---
title: g0v AI 機器人 aka 找專案分類帽
tags: AI, chatgpt
---
# g0v AI 機器人 aka 找專案分類帽
:::info
- 坑主:slack @ichieh
- slack channel: #g0v-aibot
:::
---
## 專案起心動念
- 每次新手加入 g0v,都想知道可以做什麼,因此常常會需要長期參與者幫忙當分類帽,看看有沒有適合的專案可以加入。
- 有人會問,請問 g0v 有沒有OOO 類型的專案,希望有機器人可以直接回答這個問題
---
## 作法
- ChatGPT 的出現感覺可以拯救已經 program hub 9.0 的進度
---
### 不會寫程式的我&大家
- 使用現有的工具 [DocBots](https://docsbot.ai/app) 把 g0v data base 的資料灌入
---
### 會寫程式的大家
- 會寫程式的大家:用 chatGPT 訓練一隻有 g0v data base 的機器人來專門回答問題
- [我看不懂但好像可以的解法](https://betterprogramming.pub/how-to-build-your-own-custom-chatgpt-with-custom-knowledge-base-4e61ad82427e)
- pip install openai
- pip install llama-index
- pip install google-auth-oauthlib
- python
- [flower framework](https://flower.dev/)
---
## 資料
- [官網](https://g0v.tw)
- [g0v database 原始檔案不要編輯](https://docs.google.com/spreadsheets/d/1C9-g1pvkfqBJbfkjPB0gvfBbBxVlWYJj6tTVwaI5_x8/edit#gid=1563040282&fvid=1102076775)
- [g0v chatbot database 合併上面的 database 可以複製編輯](https://docs.google.com/spreadsheets/d/1jB-8uR30OE4EBlCcLr2XOZb9kU4amoPH76U8OxOymmI/edit?usp=sharing)
### 0408 成果
- [sample code](https://colab.research.google.com/drive/1QG1TRdgRBMhqMxPxCIvDMMGfFhw19-mo?usp=sharing)
- [參考文檔:llama index](https://gpt-index.readthedocs.io/en/latest/)
- [code中要用的資料](https://drive.google.com/file/d/12uPW1vpeLNhncvFjEBOxbFiL9157mdR0/view?usp=sharing)
- [live demo 影片](https://www.youtube.com/watch?v=FG9LHt80uBA)
---
## 先前成果
- DocBots:需要再加一些 prompt、有使用上限
![](https://s3-ap-northeast-1.amazonaws.com/g0v-hackmd-images/uploads/upload_85186cea87762707fedaa66c54285c3e.png)
---
## 說到闢謠你會想到....
![](https://s3-ap-northeast-1.amazonaws.com/g0v-hackmd-images/uploads/upload_6dc554d8e021703272abe40b7777ec49.png)
---
## 所以機器人說什麼
![](https://s3-ap-northeast-1.amazonaws.com/g0v-hackmd-images/uploads/upload_8e299f46e327da60235bbe47c9f45166.png)
---
## 歡迎大家一起來救救機器人
### 2023/04/08 大松討論
- ky database 找坑
- 使用者
- 找有主坑>>覺得可以先專注在這塊
- 找坑主認領資料庫裡的提案
- 讓機器人可以列出資料庫裡有興趣的提案
- g0v 人力資源部需求表
- https://docs.google.com/spreadsheets/d/1iuHB3nrtz09BvOwdZdX1YL7MrFq_ZeV2SgYwotZfhjQ/edit#gid=0
- 找無主坑
- ronny 做的歷代大松提案逐字稿轉換:https://github.com/g0v/g0v-proposal-text
- 成果可以看上面的程式碼
### 其他資料
貢獻者的影音發言語料,聚焦明確專案的側寫與採訪
- Podcast 零時電台
- 專案主題導向,容易標記「專案標籤」
- https://linktr.ee/g0vpodcast
- 歷年提案短講成果報告 youtube 影片
- 專案主題導向,容易標記「專案標籤」
- https://www.youtube.com/@g0vTW
- Why 開坑?來蒐集 g0v 坑的開坑故事 (有部分是採訪寫手採訪坑主團隊所寫成的文章,但都算是聚焦專案內容,比起一般媒體報導來說更聚焦)
- 專案主題導向,容易標記「專案標籤」
- https://g0v.hackmd.io/@jothon/keng/https%3A%2F%2Fg0v.hackmd.io%2F93xg-Gv2TyiiEwenLLEKQw
- 松後推坑,介紹每次大松的提案,產出文字描述
- 專案主題導向,容易標記「專案標籤」
- https://g0v.hackmd.io/@jothon/afterg0vhackathon/
- 社群九分鐘,每月整理 g0v 事件
- 專案主題導向,容易標記「專案標籤」
- https://g0v.hackmd.io/@jothon/community99/
- g0v.hackmd
- 專案主題導向
- 文件有 tags 則容易標記「專案標籤」
- 文件如果沒有 tags 則不一定容易標記
- https://g0v.hackmd.io/
- g0v Slack archive
- 有一些「頻道=專案」,其他則不一定
- https://g0v-slack-archive.g0v.ronny.tw/
結構化的資料
- 成就系統 https://badge.g0v.tw/
- John 整理過「專案、github 帳號、youtube 影片」對應成果 https://chunyenhuang.github.io/awesome-g0v-projects/#/
- g0v database https://docs.google.com/spreadsheets/d/1C9-g1pvkfqBJbfkjPB0gvfBbBxVlWYJj6tTVwaI5_x8/edit
- 200 個專案清單
- [ky 的人力徵求](https://docs.google.com/spreadsheets/d/1iuHB3nrtz09BvOwdZdX1YL7MrFq_ZeV2SgYwotZfhjQ/edit?usp=sharing)
> [name=ael]
> 提案者 id 也很適合連結
> 另外,也許可以不只抓提案?可以抓 Slack archive?
> https://g0v-slack-archive.g0v.ronny.tw/
待評估是否合用的資料來源
- 中外媒體報導,這類文本比較會參雜更多不一定與社群相關的內容,有英文、日文等
- https://docs.google.com/spreadsheets/d/1YaD9e3HQ19ft2lSz_B9nnxjw8A-4Tbfain9OvnS38aw/edit#gid=0
### 應用情境
- 找坑找專案
- 是否適合擬人化、取名稱