--- tags: AI, jothon --- # 建置定期更新的立委發言觀測儀表板與政治時事資料集 ![](https://s3-ap-northeast-1.amazonaws.com/g0v-hackmd-images/uploads/upload_8884c687ce64d0fca066ac35901431f9.png =500x) ## 提案代表人 《報導者》簡毅慧 ## 專案簡介 本專案希望透過自動化技術整理、蒐集立法院會議的發言記錄,建立一個全面覆蓋台灣當前政治及社會議題的大規模資料集,作為開發本土政治大型語言模型(LLM)的基礎。同時應用LDA主題模型技術,本專案將分析各黨團、委員的關注焦點及熱門話題,並建立一個互動式儀表板,盡可能提升數據與模型的近用性與分析便利性。我們將透過定期更新,確保資料的時效與相關性。 本專案的特點在於填補了繁體中文在政治社會時事領域下的語言模型與資料集空白,未來或可成為自然語言處理專家、政治統計學者及普通選民了解台灣國會及政治的重要基石。 :::success License: apache-2.0 ::: :::warning - 專案簡介:https://sch001.g0v.tw/dash/prj/PuH4T8g4v2yywCP85Wc9MluRFz_HCh - 成果簡報:https://docs.google.com/presentation/d/1qsLss_8n-DUwSShHHasc9SUT5bzK1muJ6AXRuORp3eA/edit?usp=sharing - Hugging Face: - https://huggingface.co/datasets/aigrant/taiwan-legislator-transcript - https://huggingface.co/datasets/aigrant/taiwan-ly-law-research ::: ## 成果發表影片 <iframe width=100% height="315" src="https://www.youtube.com/embed/pYhizn95Gz0?si=SlbMGF5BS1kJjAa4" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe> > 影片連結:https://youtu.be/pYhizn95Gz0