網路資料耙梳的法律邊界與 CC0 的公益釋出(上)

林誠夏

當代各界投入 Open Data 的研究,主要是希望透過大量結構化、標準化的資料綜合分析之後,能夠發展出視覺化易讀易懂,並能更透明化促進一般人政治參與,或便利到多數人生活的資料創新加值模式。然而,參與者在往這些目標前進的過程中,有時也不得不承認,現時能夠取得的相關資料,其結構與儲放格式上,多不夠通用與符合開放標準;於法律使用上的限制,亦常未被釐清,在這樣的狀況下,往往阻礙使用者邁向資料新創加值模式的最後目標。故此一領域的實作者有時宥於現實,不得不透過網路爬蟲 (Web Crawler) 或其他相關的技術,來至公開網站上撈取所需的各式資料,並於整理之後進行結構化的運用。

這樣的作法對於 Open Data 中長期的發展,也許並非常道,但很多時候卻恰可以在草創之初,舒解資料缺乏的燃眉之急。而這樣的行為和舉措究竟合不合法,或者說應該扣緊哪些法律原則來進行,才不會侵犯到網站架設者的核心權益,並能夠在合法適份的基礎上,去拓深這些資料耙梳的成果,就是本文想要進行初步探討與分享的內容。

一、資料未成電子資料庫規模者,往往不受法律所保障。

資料 (data)、資料集 (dataset) 若是單純以數據表格的形式表現,原則上是不受到著作權法與智慧財產權相關法律所保護的,這是因為各國著作權法在立法要旨皆揭示:著作權利要保障的是著作人之創作性 (originality: creation within an intellectual domain)。故若相關的素材 (material) 在產出上並不具創作性時,法律是不能夠讓這些素材逾越範圍,受到著作權相關保障的。然而,若是資料與素材在選編的過程中,具有存取與分類架構上的創意性,並從質量來看皆可視為具實質創作性層級的電子資料庫 (database) 時,此時這些資料庫便可視為著作權法上的編輯著作而受到法律保護,在歐洲,歐洲議會與歐盟理事會更是以第 96-9-EC 號指令 (Directive 96/9/EC),來律定電子資料庫的細部保護範圍與保護方式(註一)。

所以說,如果未經允許便破解、轉譯他人既已受法律保護的電子資料庫,這是一種在法律上會被非難與究責的侵權行為。然而,若是資料本身已在網路上,或其他公眾皆可達的途徑被公開出來,那麼閱覽者合理適份的捉取這些資料,並轉以開放資料的實踐方式來深化這些資料的應用,則並不該當法律上的竊盜行為。畢竟,以我國法律為例,竊盜罪、侵占罪的成立對象必須是一般動產、不動產等有形之物,或已被法律擬制保護的電能、熱能及其他能量,故不具實體之資料,並不在這些條文的涵蓋護範圍之內,而已然公開的網站或文書資料,按理不再具有秘密性,亦當不生其他妨害秘密罪嫌的可能。

二、耙梳不受著作權保護的資料,首應注意相關的網站使用者條款。

「自己的資料自己爬」,這是宥於目前通用格式的開放資料尚不完備,在過渡階段有時 Open Data 的實作者必須進行的權宜之計,而一般未達資料庫規模的個別資料與資料集本不受到法律所保護,故而耙梳的對象僅是一筆一筆的單一資料,再自行彙整,嚴格來說也與侵權行為無涉。然而在實際的資料耙梳上,實踐者還要進一步注意到所使用的網路爬蟲程式,會不會妨礙到該網站的正常運作與服務提供。這是因為個別網站如設有使用者條款,則該條款便是一份依契約自由主義所訂立的有效法律文件,也就是說,該網站服務提供者與使用者之間,法律所沒有預先規範到的事項,悉依此使用者條款的約定內容來進行,除非該使用者條款有悖於法律或高度不公平的狀況存在,則主管的行政機關與受訴的司法機關,才能有依法介入進行調整的空間。

以「Speed Bus 大台北極速公車」這隻行動式 APP 曾引發的斷線爭議為例,該程式直接透過自動化的方式捉取「台北市公車動態資訊系統」網頁上的公車車行資料,以提供使用者即時的公車到站訊息。其後為北市府公運處發現網站頻寬佔線與系統資源負載過高,逕將其服務斷線。此一舉措引來民眾正反兩極的評價。其實,此一爭議無涉侵權利用與否的情事,依台北市公共運輸處官方網站的資訊安全政策說明頁面之明述:「網站上刊載之內容,不得為著作權標的者,任何人均得自由利用,歡迎各界廣為利用。」故實則是因為 Speed Bus 動態捉取資料的行為,逾越了一般使用者的應用模式,故其後台北市交通局,亦提示業者得以依「申請介接臺北市即時交通資訊作業說明」的方式,來申請資訊介接來善加處理此事(註二)。從此例可知,實作網路耙梳資料的大原則是,盡量讓執行資料捉取的爬蟲程式,能依一般自然人使用者的使用幅度與模式,來捉取所需要的相關資料。此一類比模式,較不易導致網站的資源和頻寬過於負載,而造成服務效率降低與失靈,也較不容易被列為各網站使用者條款裡,要去預先禁絕的排除範圍。

三、耙梳不受著作權保護的資料,次須兼顧其他合法權利的保護。

從現實面來說,已能被紙本申請查閱、或網路公開瀏覽的資料,只要未達編輯著作或電子資料庫的創作程度,本身係屬不受法律保護的客體。但是這些資料經匯整之後,得否被合法散布與應用,有時也會涉及其他法定權利的保護,例如個人的隱私權利保護,就是普遍影響到多數人生活,需要資料耙梳者額外關注的重要環結!
依101年10月1日施行的新修訂個人資料保護法,更是要求無論公私機關、單位或自然人,只要涉及個人資料的蒐集、處理及利用,都必須依照該法的規範,才能夠合法來進行。以下是新訂個資法,與資料耙梳有關的三大作業原則:

1. 能協助他人得以直接或間接方式,識別該個人身份之資料為個人資料。

依照個資法第 2 條的列舉與概括解釋,個人資料包括:自然人之姓名、出生年月日、國民身分證統一編號、護照號碼、特徵、指紋、婚姻、家庭、教育、職業、病歷、醫療、基因、性生活、健康檢查、犯罪前科、聯絡方式、財務情況、社會活動,及其他得以直接或間接方式識別該個人之資料皆包含之;而這些個人資料的蒐集、處理及利用,應經當事人書面同意並預先告知其資料的蒐集目的與使用期間、地區及方式,並諭知當事人可隨時要求,對相關資料進行查閱、更正、停止利用,以及刪除。

2. 個人資料裡可再被區分為:一般性個人資料與特殊性個人資料。

依照個資法第 6 條規定,有關醫療、基因、性生活、健康檢查及犯罪前科之個人資料,其保護層級比起一般性個人資料更高;除了當事人的書面同意之外,特殊性個人資料必須依法律明文規定或具其他公益目的,並踐履相關程序後,才得以蒐集、處理及利用,並仍應向當事人預先告知其資料的蒐集目的與使用期間、地區及方式,並諭知當事人可隨時要求,對相關資料進行查閱、更正、停止利用,以及刪除。

3. 當事人自行公開或其他已合法公開之個人資料,設有蒐集、處理及利用上的折衷機制。

此處的折衷機制意指,當事人已自行對不特定人或特定多數人揭露的個人資料,或其他依法律或法律具體明確授權之法規命令所公示、公告或以其他合法方式公開之個人資料,得不受書面預告方得蒐集原則之限制,但仍應設置資料濫用的回報處理機制。此一資料濫用的回報處理機制,散見於個資法第 9 條第 2 項、第 11 條第 1 項、第 19 條第 1 項第 7 款,以及第 19 條第 2 項。大意是指當事人已自行公開、其他已合法公開,或一般可得之來源皆可取得之個人資料,若仍嚴定公務機關與非公務機關對其之蒐集、處理及利用,必定要書面通知到當事人,則此種要求與現實環境的落差實在太大,也不具有確實執法與落實的可能性,所以折衷規範此類已經公開或一般可得的個人資料,得逕依合理的目的進行蒐集、處理及利用,然若是資料的當事人,依法表達欲對相關資料進行查閱、更正、停止利用,以及刪除時,資料的蒐集、處理及利用方,亦必須設置流暢可及的回報機制,來迅速處理資料當事人的要求。

依照上述的作業原則,網路或其他公開途徑資料的耙梳者,便可以在不直接違犯個資法保護原則的基礎上,去進行其所欲進行的資料耙梳工作。接著,在這些原則的指導之下,我們還可以在實務上整理出網路耙梳資料,涉及個人資料時的三項守法綱要,這部分內容,容後於下篇中呈現。 

----

註一:相關的行政函釋、司法判決、國際協議,與法律條文引據,可參考我國經濟部智慧財產局 98 年 4 月 27 日電子郵件 980427a 號、94 年 4 月 15 日電子郵件 940415 號函釋,臺灣高等法院臺中分院 92 年度上更(一)字第 267 號判決、智慧財產權法院 97 年度刑智上訴字第 41 號刑事判決,世界貿易組織 (WTO)—與貿易有關之智慧財產權協定 (TRIPs) 第 10 條第 2 項,以及本文內容提到的歐洲議會與歐盟理事會第 96-9-EC 號指令。
註二:關於 Speed Bus 事件的始末,可參照,周文茵,政府資訊再利用—從Speed Bus事件談起台北市公共運輸處隱私權與資訊安全政策揭示網頁台北市公車動態資訊系統網站台北市政府交通局「申請介接臺北市即時交通資訊作業說明」