文件授權: CC-BY 4.0
先把作的過程裡想到的法律相關疑問寫在這邊,方便日後討論。
Q: 把其他租屋平台的物件拿到 Rentea 的介面,依我們的規則排序、呈現會侵害商業平台的利益嗎?其中包含:重複物件偵測、允許使用者收藏、隱藏某些物件,如此將改變原本每個租屋資料被搜尋到的機會,讓某些物件被排除,或是讓搜尋變精準
- 首先,需要進一步探究的是,這些所謂「重複物件偵測、允許使用者收藏、隱藏某些物件」的功能,是要透過資料撈出另行分析,還是要寫瀏覽器外掛等在商業租屋網站的原站台直接進行?
- 如果是後者,原則上不會涉及侵害商業平台的利益,設以591租屋網為例,其網站並沒有設有廣告收益機制,而是從會員機制收費,外掛來增加適合房屋的被搜尋率,並沒有損及其會費收益。
- 如果是前者,將資料撈出另行分析,單筆單筆資料撈出另行組合,原則上不會侵害原網站平台的著作權利,因一般租屋網站上的租屋資料,都是讓出租者自行登載,依著作權法的立場,實在很難讓租屋平台成為單筆單筆資料的著作人,所以司法判決上,除非是整個資料庫抄襲承繼(台灣經濟新報公司 vs 全曜公司),並且資料庫發展建置分類架構一致,不然不會構成資料庫(編輯資料)之重製、改作,及散布之侵權;然而,後者有可能構成公平交易法第25條之違犯,公平交易法第 25 條:「除本法另有規定者外,事業亦不得為其他足以影響交易秩序之欺罔或顯失公平之行為。」至於什麼是影響交易秩序、顯失公平,可參考公平交易委員會公布的處理原則:https://www.ftc.gov.tw/internet/main/doc/docDetail.aspx?uid=167&docid=266
Lucien C.H. Lin
NEW REPLY-0
目前的方向是用爬蟲把租屋網站的資料,每小時更新到自己的資料庫後,另行分析,包含以下搜尋方式:
- 使用原本租屋網站可供搜尋的欄位(價位、房型等) +
- 使用原本租屋網站不提供的搜尋欄位,例如 gps 座標(現行網站只提供行政區,無法自行指定細部或任意區域)
另外,也將提供「重複物件偵測」、「隱藏特定物件」的功能,降低看到重複資訊、沒興趣的物件的機會。
看完公平交易委員會的處理原則後,看起來邏輯應該是「因為有欺罔或顯失公平之行為」=>「導致足以影響交易秩序」,才會是 25 條的處理範圍。就目前規劃的功能而言,只要確定有明確標註屋件來源,供使用者點回來源網站,而且是作平台而非針對特定公司,看起來很難達到「欺罔或顯失公平」的要件,也就無涉交易秩序的影響了吧?
Ddio Juan
NEW ANSWER-0
對的,著作權才論重製與散布,但那必須是涉及著作權保護的客體,raw data不受著作權保護,除非是編輯著作整個資料庫被機械性、體系性的重製、散布;所以,屏蔽部份資料只是不是有害該平台本來的商業模式,不會涉及交易秩序的影響。重點就是,若要完成租屋交易,還是回到591租屋網的架構來處理。
Lucien C.H. Lin
小結-0
- 確定有明確標註屋件來源,讓想租屋的使用者,必須點回來源網站
- 作平台而非針對特定公司
Ddio Juan
Q: 由使用者提供的 Rentea 獨家資料:
因為想要幫忙標示資料,例如讓使用者回饋實際問到的租金、樓層、是不是頂加、報稅或折扣方式等,再將資料的統計呈現,供後面的使用者自己判斷,不另外下結論,不確定會不會有什麼爭議
- 這些加註或反饋的資料是怎麼被紀錄及呈現的?
- 那現在先泛泛的說,一般來說,UGC(User-generated content/用戶生成內容)在處理上,有幾個要注意的法律要點:
- 讓用戶自己負責,實名制或半實名制(只顯示ID但要有FB或Google等原則有手機號才能註冊的帳號),來確保不會都是假資料或惡意行為;
- 如果平台有營利要有資料錯誤或資料是違法或有爭議時應被下架的申報機制
- 要有適當的用戶條款讓用戶將提報資料授權給平台或是以用戶名義授權給瀏覽者,或諭請提報者直接拋棄所有可能的著作權利
Lucien C.H. Lin
NEW REPLY-1
- 紀錄方式:應該會在瀏覽單一房屋的頁面裡,提供資料回報的表單,讓使用者在實際看屋後,可以回到網頁上回報物件的實際狀況(例如真頂加刊登者卻寫是頂樓,都是固定格式,不會是問答題)
- 呈現方式:當針對特定房屋的回報數量達到數量門檻後(例如五人),所有使用者,在該房屋的資料頁面裡,會看到答案分佈,例如「有 85% 的人說這間是頂加」、「67% 的人說電費為一度 5 元」
- 這樣會需要讓人可以查詢,是哪些帳號回報了哪些答案嗎?
- 如果只是回報客觀資訊(樓層、電費等),應該不會有著作權利的問題?
- 如果提供客服信箱讓人申報錯誤資訊,然後要求檢覆相關證明,但會視證明文件(例如是否為原刊登者)決定資訊調整狀況,這樣算是可接受的申報機制嗎?
Ddio Juan
NEW ANSWER-1
- 個人資料主要保護資料自主權,若是你希望這個服務可以「讓人可以查詢,是哪些帳號回報了哪些答案」,建議在服務登入的會員條款裡註明這點,寫明服務涉及部份的profiling,所回報的租屋動態能被連動到帳號。
- 如果只是回報客觀資訊(樓層、電費等),應該不會有著作權利的問題?沒有,不過從俗的,我建議若有會員登入條款,一樣把這件事寫清楚,像CC論壇這段:「使用者在這裡討論併分享的內容,視為依己意採CC0聲明不主張著作權利」。
- 提供客服信箱讓人申報錯誤資訊,然後要求檢覆相關證明,但會視證明文件(例如是否為原刊登者)決定資訊調整狀況,這樣算是可接受的申報機制嗎?→可接受,但既然設了信箱,就要有紀律的定合理回覆時間自律喔!這個申報機制是複合式目的的,既符合著作權法避風港機制的要求,也符合GDPR這種個資保護機制的申復地位,所以應該是說,請申報者「釋明(一般來說不會要求到證明的程度)」有哪一筆呈現他覺得違反個人權利保護或法令,平台或服務就允諾先下架再進行細部審議處理。
Lucien C.H. Lin
小結-1
- 需要在會員條款裡註明的同意事項:
- 註明在 Rentea 貢獻的內容,視為依己意採 CC0 聲明不主張著作權力
- 如果界面上面需要揭露是哪些帳號回報資訊的,需要寫名服務涉及紀錄回報的行為,回報租屋動態會被連動到帳號上
- 提供客服信箱接受爭議申請是可接受的機制,包含
- 著作權避風港機制的請求
- 個資保護機制的申復
- 要明定合理的回覆時間(應該可參考避風港的 Notice & Take Down?)
- 不用到「證明」的程度,收到後可以先下架,再作細部審議
Ddio Juan
Q: 營利的範圍怎麼界定?例如收取捐款或贊助來養機器、辦黑客松,這種沒有回到開發者身上,或是沒有對價關係的事情算嗎?
好問題,不同法律不同個案有不同的解釋態度,不過若就一般原則來說,原問題提到的「對價關係」是解讀上的關鍵:
- 一手交錢、一手交貨這種,是最經典的營利或商業行為的認定,所以以服務來換錢、換機器、換活動贊助,如果必然有1才有2,廣義都是營利行為;
- 所以一般來說,希望將營利認定範圍降到最低,就是有2不一定要有1,能收捐款、能請人幫養機器、能請人贊助活動,但是不保證一定給服務,這就不會是營利行為。
Lucien C.H. Lin
NEW REPLY-2
- 如果申請 g0v 獎助金就算營利了嗎 XDD 因為申請時要給承諾(如果承諾是要做出網站服務的話),主辦單位也會根據承諾的執行程度撥款…
- 如果像維基媒體基金會那樣,收捐款、有企業贊助機器,但只說捐款會被用在哪,而沒有保證會產出什麼,就不算營利行為了?
- 當有營利行為時,對於 UGC 的申訴處理、服務的承諾、資料的利用是否顯失公平,這幾項的判斷標準應該都會更嚴格?
- 那如果是營利行為,但獲利有沒有回到投資人/發起人手上,法律上的會有差別嗎?像是 NPO vs 公司那樣。
Ddio Juan
NEW ANSWER-2
- 申請 g0v 獎助金就算營利了嗎? → 這很有趣,我個人的見解是「算」!為什麼呢?因為依照「2019 年 g0v 公民科技創新獎助金實施細則」,得獎專案是要繳稅的!一般來說,繳稅就是營利的附帶行為,所以若是獎金採這個模式處理,無法完全說從得獎者的角度來說,這是非營利行為。所以一般來說,獎金低到某種程度,通論才會認為它不是營利行為。
- 像維基媒體基金會那樣,收捐款、有企業贊助機器,但只說捐款會被用在哪,而沒有保證會產出什麼 → 如果是捐款,捐款之後會列核銷,公益基金會年收捐款和年出若幾乎一致,不會有稅的產生,這種狀況,就不是營利行為。(類同大專院校接科技部的研究補助案-錢進來、花出去,計畫沒有發大財,就不算營利。)
- 當有營利行為時,對於 UGC 的申訴處理、服務的承諾、資料的利用是否顯失公平,這幾項的判斷標準應該都會更嚴格?→會,GDPR的設計就是對大公司課重責、對小公司課小責。
- 如果是營利行為,但獲利有沒有回到投資人/發起人手上,法律上的會有差別嗎?→原則上沒有太大差異,主要是看公司損益表上的資產規模來定責任分級,像FB賺了很多錢,但也花了很多錢,大概沒辦法因為它花很多錢所以帳目沒賺,就說它只要負中小企業的個資防護責任?所以重點是這樣,(1)這個專案本身是不是透過一個商業公司來推動?如果是,雖然公司也可以有非營利的行為,但解釋上要多費唇舌;(2)這個專案是不是透過非營利組織或是個人來推動,如果是,一般來說可以公布或表列哪些入帳花在哪些成本事務最後導致完全沒賺或只有少少的貼補(錢進來、花出去,專案沒有發大財,連小財也很難算入),那就愈可以站在非營利的這邊。
Lucien C.H. Lin
QUESTION-2.1
我好像發現我卡在哪裡,原本一直覺得是否因為營利就有法律問題,但其實應該不是這樣推論的 XD
- 這邊的在討論的都是課責,所以如果在產品從設計階段就避開可能的爭議,後續也有確實執行著作權、個人資料保護等工作,也沒有違反公平交易相關規定,不管營利的程度為何,其實都沒有差吧?
- 如果設計或實做時出現問題,或是後續工作有疏漏,才會有課責問題,這時候才會根據營利的程度、平台的規模,來討論該負多少責任?
Ddio Juan
ANSWER-2.1
營利!多少罪惡假汝之名為之!(誤)。不好意思,最近天氣熱,插科打諢一下。對的,「不是因為營利就有法律問題」,而是說,多半是有產生法律問題,而因為營利了,就更容易被權利人找上門來。
我常舉的例子是專利,如果某一家公司被告專利侵權,除非告它的是foxconn,不然基本上是好事,代表這家公司發達了,有人願意告他專利侵權。因為萬法不變其宗,今天各國法律,對於侵權行為的基本原則,就是:1、所受損失,2、所失利益,3、額外加權,前兩者是基本上權利被侵犯者可以要的,比如發生車禍,有過失的要賠償無過失的:被撞車體維修復原費(所受損失)、被撞者醫藥及復健費用(所受損失),還有不能上班不能上工的錢(所失利益);而額外加權,就看各國的特殊條件是不是充足,例如傷天害理在米國可能會有懲罰性賠償金(punitive damages),台灣則是專利侵權故意重大時可以罰三倍(https://law.moj.gov.tw/LawClass/LawSingle.aspx?pcode=J0070007&flno=97)。
所以並不是說營利就會出問題,而是出問題之後又被發現營利,那麼被懲罰的效果可能會被加乘,這是法理邏輯上。也不是說營利就一定會出問題,營利也有不出問題的,例如Google Book search engine,在美國纏訟多年,終審判決合理使用不涉及侵權賠償,簡單來說:1、Google有賺錢、但賺的是廣告費,2、而出版商賺的是出版的版稅,從版稅的觀點,Google Book完全沒有削弱出版廠商版稅的收益與價值,所以最後Google成功的主張合理使用。
也是要和你先打一 個預防針:這世上並沒有不具風險的新創,但某一天如果你被告了,那也不一定是壞事,有時候那代表,你浮上檯面了,那公司產生價值了。
所以說,我覺得設計流程及利用他人平台的資料,有幾個重點,在實作時常常去檢閱並處理:1、有沒有影響它既定的商業模式?有沒有讓它少賺錢?2、你哪一天賺了錢,那個錢是不是該平台本來的企業規劃?
如果實作時發現哪些有點疑問的點,再來實際討論應該怎麼務實的處理。
不過再次強調,哪一天如果真的被告了,也不一定是壞事。畢竟,沒有哪一家做大的公司,是沒有被告的。
Lucien C.H. Lin
小結-2
不是說營利就會出問題,而是出問題之後又被發現營利,那麼被懲罰的效果可能會被加乘。
在實作時要常常去檢閱並處理:
- 有沒有影響它既定的商業模式?有沒有讓它少賺錢?
- 你哪一天賺了錢,那個錢是不是該平台本來的企業規劃?
Ddio Juan
NEW REPLY-3
前情提要:
作找屋平台的目的之一,是希望累積租屋者的使用資料,整理出需求端的資訊,讓居住政策、租屋市場也能有需求方的聲音。為此,可能會在使用的過程裡,收集使用者的
個資保護的部份,目前打算作到:
但就算拿掉帳號資訊,如果可以上面三種資料可以被鍊結起來,還是有可能推斷是哪個帳號的資料。目前最保險的公開方式應該是
Q: 開源專案裡,如何規範開發者寫出會追蹤不必要個人資訊的程式?感覺只能透過 CoC + peer review ?
Q: 開源專案裡,如何規範有資料庫存取權限的人,不將使用者的使用資訊私自匯出?也只能靠 CoC 嗎?
Q: 如果想要提供更細節的統計資料,有什麼推薦介紹匿名處理、去識別化,或是相關的資源嗎?
NEW ANSWER-3
基本上上面列表的處理要項原則上都同意,這樣做起來是符合個案保護的法律框架的,但其實,要不要直接就把政策定為:
- 會員註冊條款明白宣布會追蹤紀錄您的使用動態(profiling),包括地區、租金範圍、房型、特殊需求、標為忽略、收進待看清單、有看但沒有進一步動作、個別房屋標註的資料:是否為頂加、樓層是否正確、電費計算方式、網站使用頻率推測找到房屋所費時間;
- 然後,允諾在3個月到6個月的期間就上述profiling的結果進行量化分析,之後,就刪除原紀錄資料,對、刪除,完完整整刪除原始資料,你可能會覺得可惜,但這樣就不負個資之後防護或使用的責任;
- 基於已經完整刪除了原始資料,當3個月-6個月的暫存期經過,資料已被處理後,也不用再讓使用者透過系統,刪除、匯出所有關於他的紀錄,因為這些紀錄客觀上已經不在了,但當然,處理前你要能應申請來處理;
- 至於要不要允許使用者不將自己的資料用作統計、進一步的個人化機器學習之用,這是尊重自主權,或許也可以改成你註冊會員就表示同意,你不註冊會員我也不會收你資料,這樣就有對當事人的個資做到自主的尊重,也就是說,不登錄會員就是一種個資的自主和撤回。
Lucien C.H. Lin
小結-3
- 前三點摘不了 XD
- 為了尊重自主權,可改成註冊表示同意收集資料
- 要考慮第一次公開發布時的授權條款是什麼,因為如果改動太大,之後的條款 migration 要作到沒有瑕疵,應該會很複雜
Ddio Juan
目前的使用者研究使用 CC-BY-NC ,目的是維持這個設計點子的公共性,做出有差異而且吸引人的軟體,累積租屋市場需求端的統計資料,讓租屋者的需求可以被納入市場與政策研究。
- CC授權的適用對象是受著作權保護的客體,詩、詞、書、畫、影音、多媒體,或是設計藍圖等,「點子」不能被CC授權,因為點子根本不受著作權保護,若是真的希望保護點子,就是得申請專利(營業方法也可以申請專利,但申請時必須說明和哪個技術手段或步驟流程搭配,不然純概念會被拒發);
- 或點子(Know how)也可以被營業秘密保護,不過那樣的點子就不能公開啦!
Lucien C.H. Lin
但因為都是設計草稿,所以要用相同概念做出類似設計也不會不行,不是一個很好的保護
如果有設計圖,別人未經授權是不能直接重製、散布這張圖,不過對的,這不是一個對點子很好的保護,因為「實施(implement)」不會侵犯著作權,所以看到設計流程圖的人,依那個概念重做別的設計,確實不會不行。
Lucien C.H. Lin
開始開發程式後,除非另外調整程式碼授權,不然開源的東西都是可以直接拿去用的
不然就給GPL-3.0或AGPL-3.0授權的程式碼?用是可以用,但如果用到的程式碼,後續再散布或雲端使用(AGPL-3.0),也得主張揭露及提供源碼。
Lucien C.H. Lin
根本的問題應該是,如果想要維持公共性,那在開發有商業潛力的專案時,有什麼常見的取徑或案例嗎?
至少要有 CoC + contriguting guideline, from Open Source Guides Ddio Juan
NEW REPLY-4
Q: 如果想要確保 Rentea 上線後,維持非商業的特性,不以幫投資者賺取報酬為目標,有什麼可以預先準備的事情嗎?目前想到的有:
NEW ANSWER-4
如果是這樣,我建議一開始就採CoC併一款寬鬆的(BSD/MIT/Apache-2.0)開源授權來讓大家貢獻,當有相當規格時,再轉隸基金會下,改採CoC寫入CLA(貢獻者協議/Contributor License Agreement)的作法來做永續處理,CLA必須要有法人或個人當載體
Lucien C.H. Lin
好!
Ddio Juan
小結-1
須告知資料收集與(如果有的話)揭露使用者等資訊小結-3
若要分析使用者資料,可以只保留分析的結果,原始資料則在一定時間後刪除,讓個資完全無法追溯,其他請見同段 1-3 點小結-1
第二點小結-2
營利不是問題,而是有問題時,會因為營利而更容易懲罰。重點還是要避免問題,例如遵守個資法、公平交易法,避免侵害資料來源利益等。小結-0
需提供使用者跑去物件來源網站的誘因,避免減損資料來源利益
小結-0
界面應該是通用的,避免針對特定平台小結-0
爬蟲、API 等應該是通用的,避免針對特定平台NEW ANSWER-4
用 CoC + 寬鬆的(BSD/MIT/Apache-2.0)開源授權TBD
感謝!
ddio Juan