跳转到内容

開放資料

维基百科,自由的百科全书

这是本页的一个历史版本,由Wihwang留言 | 贡献2013年5月26日 (日) 08:19 →‎Open Data 的主要來源编辑。这可能和当前版本存在着巨大的差异。

Linking Open Data project in September 2007

開放資料 (英語:Open data) 指的是一種經過挑選與許可的資料,這些資料不受著作權專利權,以及其他管理機制所限制,可以開放給社會公眾,任何人都可以自由出版使用,不論是要拿來出版或是做其他的運用都不加以限制。Open data 運動希望達成的目標與開放源碼內容開放開放獲取等其他「開放」運動類似。Open data 背後的核心思想由來已久(例如在 Mertonian tradition of science),但 Open data 這名詞直到近代才出現,拜網際網路崛起而為人所知,尤其是 Data.gov 等 Open data 政府組織的設立。

概論

Open data 並不是一個嶄新的概念;雖然我們越來越常使用到 Open Data 這個詞彙,但是在目前並沒有一個大家普遍都認同的定義 (有別於其他類似的運動,例如在開放獲取中,我們已經見到許多受到大眾認同並正式公佈的宣告)。

一般來說,Open Data 的應用主要為非文字的資料素材,像是地圖, 基因體, 聯結體, 化學分子, 數學以及科學公式,醫學資料與應用,生命科學以及生物多樣性。開放這些資料時常常會因為這些資料本身具有的商業價值,或是經過彙整後可以成為有價值的產品,而引發出不同聲音的意見。資料的讀取,再次使用等,一般都由特定組織所監管,這些組織可能為私人或是公家機關。資料的讀取和再次使用的監管方法可能為,資料讀取的限制,透過版權與授權,專利的申請,或是付費要求等。Open Data 的倡議者們認為,這些限制都有違公眾的利益同時這些資料都應該能自由取得,沒有限制也不該索取費用。除此之外,資料的再次使用也不該需要其他的許可,雖然依照再次使用的不同性質(例如延伸性的創作)可以經由授權來控管。

一個典型關於為何我們需要資料開放的說法:

許多科學家都曾經指出,在這歷史的一刻,正當我們擁有技術能力將科學資料以全球性的層次來發佈和送出,加強彼此之間的合作關係和加快加深新科技的發明時,很諷刺的看到我們忙著將資料封閉起來,並嚴禁使用更先進的技術在這些知識上

[1] John Wilbanks, 執行長, Science Commons

資料的創造者通常不會考量到資料應該標注的擁用者、授權方式以及再次使用的限制等資訊。舉例來說,對很多科學家來說, 他們不會把因為工作而公佈刊出的資料看成是屬於他們所有而設限,並把這些資料在期刊上的刊出視為將資料釋放到公眾領域的方法。但是,因為沒有確切的授權聲明讓人無法清楚知曉該資料集 (data set) 的狀態並可能對這些在開放的精神下釋出的資料在使用範圍上造成限制。因為這些不確定性也造成公眾或是私人組織與機構例如 IEEE有機會匯集這些資料,然後使用版權宣告來限制資料的使用授權或是進而販賣這些資料。

在 "Toward Open Data" (邁向資料開放)一書中,Connolly (2005, v.i.) 列出兩句引言:

  • I want my data back. - 我要拿回我的資料 (Jon Bosak circa 1997)
  • I've long believed that customers of any application own the data they enter into it. 長久以來,我一直相信客戶擁有他們輸入於任何一個應用程式內的資料的完整所有權.[2] (這句引言指的是關於 Veen 自己的心律資料。)

Open Data 的主要來源

Open Data 的資料來源可能來自不同領域。本節將列出一些已經刊出大量 Open Data(或至少研擬刊出)的領域。

科學界的 Open data

關於 科學資料的開放獲取 概念的制度化主要源自為了準備在 1957-1958 年間舉辦的 International Geophysical Year[3] 所建構的 World Data Center 系統。 The International Council of Scientific Unions (現在改名為 International Council for Science) 建立了數個 World Data Centers 以求盡可能降低資料減損的可能性,並盡可能擴大資料的獲取性,並在 1955 年提出新的建議,要求資料必須以「機器可讀取」的格式來儲存[4]

雖然開放-科學-資料運動的發起是在網際網路出現之前就已經展開,但是一個快速,遍佈更廣的網路系統的出現,徹底改變了開放科學資料的環境,因為將資料的刊出與取得的代價都不像前那般昂貴,也不用花那麼大的精力。

在 2004,所有 經濟合作與發展組織 (Organisation for Economic Co-operation and Development, OECD) 會員國的科技長官,這包含了世界上大多數「已開發」國家,簽署了一份共同聲明主要內容為,所有由公家機關出資收集的資料都必需要公開釋出。[5] 緊隨著對會員國內各資料產出機構發出的要求 和激烈的爭辯,OECD 在 2007 發佈了 經濟合作暨發展組織公帑贊助研究資料之近用原則與基準 (OECD Principles and Guidelines for Access to Research Data from Public Funding)軟性約定 (soft-law)建議。[6]

政府機關的 Open data

有些國家政府已經建立了網站,來發布他們收集的部分數據。

此外,也有其他層級的政府已經建立了Open Data的網站,如渥太華[1]加州[2]

贊成及反對 Open Data 的論述

  • 屬於人類的資料。像是基因體、有機物的資料、醫學、環境資料。

與其他開放運動的關係

Open Data 運動的目標與其他開放運動類似。

封閉性資料

數種機制可使用來限制資料的獲取與再次使用。這包含了:

  • 將資料彙整進只有註冊會員或是客戶有權限讀取的資料庫或是網站。
  • 使用私有或是封閉式技術或是編碼程序來阻礙資料的可獲取性。
  • 透過版權宣告來禁止(或是造成困惑)資料的再次使用。
  • 透過授權上來禁止(或是造成困惑)資料的再次使用 (例如 share-alike[來源請求] 或是「非商業」使用)
  • 透過專利得申請來禁止資料的再次使用 (例如某些試驗性蛋白質的架構使用受專利保護的 3 維座標系統)
  • 網站禁止機器人來爬資料,, with preference to certain search engines

推廣 Open Data 概念的組織

參見

參考文獻與連結

  1. ^ Science Commons
  2. ^ Jeffrey Veen
  3. ^ Committee on Scientific Accomplishments of Earth Observations from Space, National Research Council. Earth Observations from Space: The First 50 Years of Scientific Achievements. The National Academies Press. 2008: 6 [2010-11-24]. ISBN 0309110955. 
  4. ^ World Data Center System. About the World Data Center System. NOAA, National Geophysical Data Center. 2009-09-18 [2010-11-24]. 
  5. ^ OECD Declaration on Open Access to publicly-funded data
  6. ^ OECD Principles and Guidelines for Access to Research Data from Public Funding

外部連結