記者快抄

Install & Setup

若在Ubuntu環境下,可直接執行以下指令:

sudo bash install.sh

若在其他環境下,請參照install.shrequirements.txt來安裝相關python3套件

若相關套件已安裝成功,請更改setup.sh並source它。

To Run

python3 journalist.py

Intro

About Image Searching DataBase

因為一些隱私權問題,我們並沒有直接公開資料庫。

目前使用 "Reading Wikipedia to Answer Open-Domain Questions", ACL 2017 提供的 search engine 演算法來找適合的圖片。

您可直接省略需要用到此DB的程式碼、跳過自動搜尋合適圖片的步驟,或來信與我們聯絡取得DOCTFIDF_DATA

About Auto Generated Articles

目前使用 TextRank 抓出內文重點與重要回文後,將其填進我們撰寫的簡單模板(template)來產生新聞。

其他嘗試中的方法:

Training data 為從蘋果, 自由時報等新聞網站爬下來約 10 萬篇新聞。

同樣因為一些著作權問題不太方便公開 training data。如果你對自動產生文章有心得或是想要提供中文文章與摘要的 data,歡迎和我們聯絡。

Update: 現在我使用一份叫做 CIRB010 的 data,實際測試在 pointer-generator networks 上後結果還算能接受,但是文法不通順的問題仍待解決。

Issues

Related projects