如何讓開放文化資料更容易的被再次利用?

柯俊如 /編譯

2012年,荷蘭的開放文化資料計畫獲得來自開發者和開放資料使用者對於資料提供者的建議。Lotte Belice Baltussen於本文中,全方位的提供幾個最重要的建議,以便增加開放文化資料的再利用機會。


圖片資訊:by Gideon Burton, under CC BY-SA .

哪裡是存放資料的最佳場合?

  • 要讓你的資料(不論是內容或詮釋資料)總是能在你自己的網站上被取用。一方面這樣一來可以很清楚的顯示出你是原始提供者,另一方面,比起只在他處提供取用管道,這樣更能全方位的掌控資料取用和再利用情形。
  • 你可以同時提供內容(例如:圖像、影片)以及關於內容的資訊(也就是詮釋資料)。比起內容,詮釋資料幾乎總是會存放在不同地方。若同時提供兩者,最好確定自己已經清楚呈現出能在哪裡找到他們。理想上的狀況是,在詮釋資料中增加一個獨立欄位提供內容(圖像、影片)的連結網址。

可以做什麼以提供更多關於開放文化資料的資訊?

  • 如上所述,理想上,使用者能在詮釋資料輕易找到原始目錄或網站的連結。
  • 如果你的機構有讓使用者訂購內容的線上商店,最好能以創用CC授權條款等清楚標示出這些開放文化資料內容是開放的。因為,使用者同時看到線上商店的付費圖像與在其他網站上提供的免費圖像時,會對於自己可以如何利用感到困惑。也就是說,若未清楚標示出這些資料可以被再次使用,最終將會減少再次使用的情形。
  • 確定你的網站上有對機構提供的開放文化資料類型作出解釋,這裡的文字可以使用資料部落格(data blog)上的內容。
  • 在詮釋資料裡總是要提供一個說明使用權利狀態的欄位,清楚呈現這些內容或詮釋資料是以何種授權或條款釋出。開放文化資料的建議是:以「公眾領域貢獻宣告」(CC0)授權後設資料,以「創用CC 姓名標示」、「創用CC姓名標示—相同方式分享」授權內容,或在內容已超過著作權保障期限時以「公眾領域標章(PDM)」授權內容。

提供詮釋資料的最佳方式為何?

  • 採用上述方式清楚展現取用內容及詮釋資料的使用方式。
  • 開發者和其他使用者的偏好不同。有些人只要有簡單的詮釋資料csv檔或txt檔就滿足了,有些人則偏好取用提供不同資料取用方式(如JSON、xml檔)的完整API。不論選擇哪種方式,你至少要確認自己已經清楚說明了人們在資料部落格中的詮釋資料欄位能找到什麼,並盡可能的提供使用者有許多近用、下載、搜尋資料的選項。若你有API,就說明你使用的標準為何,以及使用者可以在哪裡找到更多相關資訊。
  • 在你的資料部落格或詮釋資料中清楚指出這些資料的最後修正時間。若常常會修正,就要漸進式的更新或甚至是提供資料集的不同版本。

提供內容(圖像、影片)的最佳方式為何?

  • 如果你要提供開放內容,建議你提供高解析度的取用機會。這將會大幅促進重新使用的可能性!不過有些開發者也喜歡使用較小解析度的作品,因為檔案比較小。因此理想上,最好提供不同解析度的內容。

將開放文化內容放上維基百科時要注意些什麼?

  • 若要在維基百科上被再次使用,以下的詮釋資料欄位是最重要的,應確保有恰當的說明這些欄位:作者姓名、作品標題、物件類型、描述、創造日期、尺寸、目前所處位置、內部ID、授權方式。
  • 若你的內容在維基共享資源上被標記為特殊種類,像是Category:Media_from_Open_Beelden,就能獲得維基百科的使用數據。這些種類是由維基社群所指派的。

原文/ Lotte Belice Baltussen “Tips for data providers: how to make open culture data re-use easier” 以創用CC BY授權釋出。