荷蘭開放文化資料促成多元應用程式產生

柯俊如 /文

文化機構保存了許多獨特藏品,也有關於藏品的豐富知識、活動展覽消息,以及訪客的資訊與回饋記錄。美術館、圖書館、檔案館、博物館透過開放資料,可以達成機構開放取用文化資產、促成創新利用的任務,也能促成文化機構間彼此合作發展新服務。然而,機構在管理這些資料時,往往沒有意識到潛在價值,透過技術限制使用者的取用機會。

2011年九月,荷蘭開展「開放文化資料(Open Cultuur Data)」計畫,希望能開放文化資料以激發更多有用且創新的應用程式產生。此計畫聚集了許多相信開放力量的專家參與實驗,他們原本因為缺乏相關知識,或是出於對資料開放後的風險考量,而對開放資料運動猶豫不決。然而,在這場實驗後,他們獲得了開放資料的實務經驗、了解開放對於館藏的價值,甚至願意進一步成為未來開放運動的領頭羊。許多文化機構也發現,原來連結機構外的駭客、設計師、學生,可以一起挖掘出更多嶄新的資料應用方式。

圖片:by Kennisland @flickr, under CC BY-SA.

推動過程

最初,開放文化資料計畫和Hack de Overheid(駭入政府)合作,主要是使用開放政府資料創造新的應用程式。此時他們訂下一些原則,指出開放文化資料應具備以下五點特性:

  1. 開放文化資料包含館藏物件的數位展現,以及文化機構與館藏、活動和組織相關計畫的知識與資訊。
  2. 每個人都可以查詢、使用、散佈、再利用開放文化資料,可能是經由開放授權釋出,或將素材作為公眾領域提供取用。
  3. 開放文化資料可以經由能再次使用的數位標準型式取用。
  4. 會在資料部落格等處說明開放文化資料的結構和可能應用程式。
  5. 開放文化資料的提供者已經準備好將回答他人對於資料提出的問題,並且會尊重開放資料社群投入應用程式開發的努力。

他們將開放文化資料區分成「內容」及「詮釋資料(metadata)」。內容即數位化文化物件,像是掃描的圖畫、物件照片、數位文本,關於這些物件的描述性資訊則為詮釋資料。由於創用CC授權在世界各地使用,其授權條款也符合許多開放資料計畫對於權利開放的要求,因此成為開放資料時首選的授權方式。詮釋資料可以使用「公眾領域貢獻宣告CC0」授權,內容則可以使用「公眾領域標章PDM」、「創用CC 姓名標示」、「創用CC 姓名標示—相同方式分享」授權。

有了這些原則後,他們開始邀請文化遺產機構的人參加工作坊及開放資料。此時,他們邀請到荷蘭國家博物館Rijksmuseum阿姆斯特丹博物館荷蘭國家電影資料館國家檔案館荷蘭視聽覺研究中心與國家荷蘭遺產網站提供資料集。

2011年9月敲定了一場荷蘭應用程式競賽,希望能促使開發展善用荷蘭政府的開放資料。11月底開始進行黑客松(Hackathon),開發者、程式設計員等人齊聚一堂,上述機構也在此時開放他們的資料集,並舉辦一場工作坊說明。在黑客松進行期間,一共開發了13個文化應用程式,其中8個完成度高而進一步參與競賽,種類多元,可以看出開發者對於文化資料的興趣。文化機構也從此次競賽中體會到這些數位館藏可以如何被再次利用。

Glimworm IT2使用開放圖像(Open Images)的影片與歷史搭配地理定位技術開發的Vistory應用程式,在這次競賽過程中獲得大獎。Vistory的使用者選擇一個所處位置附近的歷史影片,將影片停在當地的歷史畫面後拍攝現在的當地景象,影片就會被標記上地理位置及新照片。

2012年4月到6月,開放文化資料計畫和荷蘭的創用CC合作推出專家課程,主講授權、技術、應用等開放資料過程會遇到的課題,有17間文化機構完成課程。2012年6月到12月,則舉辦了開放文化資料競賽,徵求能以嶄新方式拓展觀眾取用管道及連結不同資料集的應用程式,首獎得主將能獲得3000歐元。參賽者有35個開放授權的資料集可以使用,共有27個應用程式參與競賽,其中8個來自專家課程的文化機構代表。

最後獲得首獎的是Muse,人們可以使用這個應用程式聚集及混搭世界名畫及自己的創作。第二名是Histagram,透過此應用程式可以使用國家檔案館的照片創作電子賀卡。第三名是SimMuseum,這是一個讓使用者擔任博物館館長、自行買賣荷蘭博物館藝術作品的遊戲。

雖然透過這幾次活動產生了40個應用程式,但是只有少數可以持續經營。另外,並非每個資料集的使用頻率都相同,同時開放內容和詮釋資料會比單獨開放詮釋資料吸引更多人使用。在所有資料集中,荷蘭國家博物館由於有12萬多幅高解析度畫像及好用的API,而成為最多人用以開發應用程式的資料集。

開放文化資料計畫之後將發展一個評估模型(GLAMetrics),用以獲得開放資料影響的實證。目前這個模型已經在測試階段,之後將進行問卷調查或舉辦工作坊了解文化機構的想法,並試圖與Europeana、OpenGLAM、GLAM-WIKI等國際計畫展開合作。最終結果將會免費在線上分享。

困難與好處

許多文化機構的代表也提出幾個開放資料時的風險。首先,資料在沒有標示出處的情況下散佈,文化機構無法因此累積聲譽,也難以控制資料的利用方式,如此一來將可能損及機構的品牌價值及營銷收入。另外,文化機構的資料(像是家譜)有些會透露個人訊息,因此也會牽涉到資料隱私的保障問題。

不過,文化機構的代表也指出,開放資料符合其使命,尤其是接受公眾資金的機構。而且透過開放,他們可以讓這些資料普及到更多網站,增加資料連結和取用的機會。使用者可以在自己有需要的時候隨時取用、分享這些館藏,讓館藏產生更多元且嶄新的互動方式。

 

開放文化資料集及開發應用程式一覽表:

22間文化機構
開放物件
採取授權
40應用程式 (粗體字的為現行可用者)
荷蘭國家博物館Rijksmuseum
111000張圖像
圖像:PD
詮釋資料:CC0
144050張相片、1170張地圖
相片:CC BY-SA、CC0
地圖:CC0
詮釋資料:CC0
70000張圖像
圖像:PD
詮釋資料:CC0
2100個聲音檔、12000張圖像、18000篇維基百科文章、1800支影片
聲音檔、圖像、文章、影片:CC BY-SA
100000 筆活動記錄
詮釋資料:CC0
550000張圖像、150000筆圖書館記錄
圖像:CC BY-SA
詮釋資料:CC0
61000筆附有脈絡資源的遺址
圖像:CC BY-SA
 
170筆電影記錄
詮釋資料:CC0
140000筆記錄
詮釋資料:CC0
 
2000張地圖
圖像:CC BY
詮釋資料:CC0
8500筆記錄、650張圖像
圖像:PD/CC0
詮釋資料:CC0
23000000筆記錄
詮釋資料:CC0
17000筆記錄、 2100張圖像
圖像:PD
詮釋資料:CC0
80張地圖
圖像:PD
詮釋資料:CC0
454800份手稿、11240本書
手稿:CC0
書:PD
詮釋資料:CC0
3500筆戰爭遺址資料
詮釋資料:CC0
4086171筆家譜記錄、80000筆圖像記錄(有些許圖像)
圖像:CC BY-SA
詮釋資料:CC0
681張圖像
圖像:CC BY-SA
 
15000張圖像
圖像:CC BY-SA
詮釋資料:CC0
50000張圖像
圖像:CC BY-SA
 
111張地圖
圖像:PD
詮釋資料:CC0
562筆記錄
圖像:PD
詮釋資料:CC0

參考資料: