---
tags: cofacts, meeting note
---
20181010 會議記錄
=====
蝴蝶、文武、bil、MrOrz
## 程式進度
### 主機升級
- Linode 4GB
- Production Elasticsearch 1.5GB ram; staging 1GB;
### URL preview
PRs:
- https://github.com/cofacts/rumors-site/pull/140
- https://github.com/cofacts/rumors-api/pull/106
- https://github.com/cofacts/rumors-site/pull/141
### Tagging
> btf
把資料整理乾淨了
Orz:
data cleaning 的手段可以 apply 到其他文章嗎?
蝴蝶:
只是把垃圾字元或是網址濾掉,剩下的都是有意義的字
Orz:
有辦法自動 data cleaning 嗎?
蝴蝶:
可能有些可以,但像這個是照格式濾掉一些東西,應該還算
新的東西進來之後,在經過一樣的程序就可以用
這是 generalize 的 data cleaning,沒有針對特定主題做,所以新主題也 ok
Orz:
現在有 URL summmary,會有更多的字可以用
但 opendata 不知道怎麼做,hyperlinks 是 array of objects,要在 CSV 裡包 JSON 還是 normalize?
蝴蝶:
CSV 裡包 json 怪怪的,那不如一開始就 json。
normalize 吧。
Orz:
那就丟掉 articles & replies 的 hyperlinks field,直接吐 urls index 吧。2GB,連 HTML 都有。
是說開放 `urls` 是重製資料,這會不會有著作權問題,可以合理使用嗎?
orz:有沒有辦法在GCE上面弄一台chrome的機器,平常關起來需要時打開來的機器?
想做 pipeline:
1. 從 linode 的 production elasticsearch backup esdata 到 google cloud storage
2. 在 GCE 上的 cron 會去拉這個 DB backup,mount 到會跑的 elasticsearch,跑 opendata extraction script,產出各個 index 的 opendata (xxx.csv.zip)
3. 把 xxx.csv.zip 們丟上 GCE 給大家下載
蝴蝶:要排程嗎
orz:我們要先把備份撈出來,然後打開一個elastic search,然後跑open data的instrution code
我只要公開GCE的連結他就可以吐結果來
:::success
修改 opendata:
1. 開放 `urls` index 到 opendata
2. 需要再詢問 `urls` 可不可以放 opendata Orz
3. 排程需要再研究,目前先丟到 GCE 再說 --> Orz 會做
:::
### iOS 按鈕 bug
https://github.com/cofacts/rumors-line-bot/issues/105
## Workshop 整理分享
> Bil
>
來 workshop 的人提供下面的想法:
參與者說學到很多,帶得很細。
這次 workshop 帶的是思辨與整理,跟事實不太一樣,closed chatroom 都是價值觀的散步,如果你有類似價值觀就會轉傳。
大家都說是滿好的討論機會,可能是覺得不好的不會來主動說吧。
Jason 建議時間要長一點,可能要兩到三個小時才拿把它做完。大家還在熟悉,時間就結束了。
https://g0v.hackmd.io/s/Hklp-iqHq7
workshop 來的人可能比較同溫,但看大家遇到問題的質疑,可以理解站在中性來討論是比較困難的事情,大家還是會有情緒、會用反詰的語氣來質問原文。
另外對法規的不熟悉,會讓自己對文章很不信任。
另外,即使是與會來賓,也會把性解放與放縱搞混。
## Interview from NTU undergraduate
- Email 主旨:[g0v-talks] Request for Interview on Fact Checking Research
- Link: https://docs.google.com/document/d/1tdysg3_bj291D1rS2fJAxZa5yuMT6jbqHzaYHZ2A8_k/edit?usp=sharing
## 11 月小聚
- 11/11 (日) 雙十一闢謠節
> 鼓勵大家闢謠換購物金(誤
> 謠言闢一則送一則
> 謠言翻倍送
### 地點:tmot
tmot 搬家了!!變成比較大一點,但也遠一點,在昆陽站附近。
需要場勘 + 新的「只有前方的走法」 + 大肆宣傳地點換了這件事情。
> FB group 討論中
## 貼圖O2O
> 選一些給 Hazel 去問
Bil:
被 LINE 打槍的我們就出,畢竟錢也付了。
Orz:
我會想貼在筆電上的只有「我到底看了什麼」那張(真的假的)。
其他真的會有人想貼嗎?
Bil:
Lucien 的貼紙在 summit 很受歡迎。
不要小看「轉發不會有好運」貼紙了,大家都很想要蓮花版的「轉發也不會有好運」
UCCU 應該也會有很中二的人想貼吧。
文武:
我會想貼「長度太短」。
:::success
試著把被 LINE 退回的貼圖都做成貼紙ㄅ~
:::
## [LINE Boot Award](https://www.line-community.me/awards/)
> GGM 沒來。
## Messenger bot 進度
技術上,使用者看起來可以分享到 bot([相關 slack 對話串](https://g0v-slack-archive.g0v.ronny.tw/index/channel/C2PPMRQGP#ts-1538754278.000200))
![]』(https://g0vhackmd.blob.core.windows.net/g0v-hackmd-images/upload_c48664c1451598e513c1e95455798162)