

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、<p> 政府類開放關聯(lián)數(shù)據集調查研究</p><p> 摘 要:作為開放關聯(lián)數(shù)據云圖中重要的數(shù)據集合,政府開放關聯(lián)數(shù)據集擁有龐大的數(shù)據規(guī)模和發(fā)達的數(shù)據共享實踐,受到廣泛關注。文章對曼海姆關聯(lián)數(shù)據目錄中的284個政府類開放關聯(lián)數(shù)據集進行調查,從數(shù)據集的發(fā)布國家分布、主題分布、數(shù)據集格式、鏈出情況、鏈入情況、連接謂詞、詞表和開放協(xié)議等方面進行統(tǒng)計分析,發(fā)現(xiàn)政府類開放關聯(lián)數(shù)據集具有數(shù)據集國家分布較集中、
2、數(shù)據集主體涵蓋政府工作各個方面、數(shù)據集之間關聯(lián)關系緊密、質量控制和版權保護較為嚴格等特點。 </p><p> 關鍵詞:政府;關聯(lián)數(shù)據;開放關聯(lián)數(shù)據集 </p><p> 中圖分類號: G203 文獻標識碼: A DOI:10.11968/tsyqb.1003-6938.2016083 </p><p> Investigation and Research
3、on Government Linked Open Data Sets </p><p> Abstract As an important part of the Linking Open Data (LOD) data sets, government data sets have a large volume data and advanced data sharing practice, and rec
4、eive a widespread attention. 284 government linked open data sets from Mannheim Linked Data Catalog are investigated, and aspects of distribution in countries, themes, formats, outgoing and incoming links, predicates for
5、 interlinking, used vocabularies and licensing information. Consequently, the paper summarizes the features of governme</p><p> Key words government;linked data;open linked data sets </p><p>&l
6、t;b> 1 引言 </b></p><p> 2016年3月,中央發(fā)布的“十三五”規(guī)劃綱要中提出,要全面實施促進大數(shù)據發(fā)展行動,加快政府數(shù)據開放共享?!毒V要》指出,要全面推進重點領域大數(shù)據高效采集、有效整合,深化政府數(shù)據和社會數(shù)據關聯(lián)分析、融合利用,提高宏觀調控、市場監(jiān)管、社會治理和公共服務精準性和有效性。2015年9月,國務院印發(fā)《促進大數(shù)據發(fā)展行動綱要》,稱要在2018年底前建成國家政
7、府數(shù)據統(tǒng)一開放平臺,率先在氣象、環(huán)境、信用、交通、醫(yī)療、衛(wèi)生等20余個重要領域,實現(xiàn)公共數(shù)據資源合理適度向社會開放,政府數(shù)據開放作為國家大數(shù)據發(fā)展戰(zhàn)略中重要的組成部分被提上了建設日程。 </p><p> 不僅中國,各國政府都把開放數(shù)據提到了前所未有的高度。在2009年奧巴馬簽署開放政府的行政命令后,政府數(shù)據的開放已成為近年來世界性的趨勢。美國聯(lián)邦數(shù)據平臺Data.gov上線后,英國、加拿大、新西蘭等國也都建立
8、起了政府數(shù)據開放平臺,開放政府數(shù)據已成為政府的一項重要工作。在我國,2011年香港特別區(qū)政府開放政府數(shù)據網站“資料一線通(data.gov.hk)”;上海在2012年6月推出了中國大陸第一個數(shù)據開放平臺。之后,北京、武漢、無錫、佛山、南海等城市也都上線了自己的數(shù)據平臺。盡管如此,在我國開放政府數(shù)據過程中還存在各種問題,如開放數(shù)據總量偏低,可機讀性差,大多為靜態(tài)數(shù)據,數(shù)據按承諾更新比例低,整體都未嚴格符合開放授權等。 </p>
9、<p> 從2006年Tim Berners-Lee提出通過關聯(lián)數(shù)據發(fā)展數(shù)據網絡(Data Web)后,國際互聯(lián)網協(xié)會(W3C)的關聯(lián)開放數(shù)據(Linking Open Data,LOD)運動正式啟動。近年來關聯(lián)數(shù)據引起了學者的廣泛關注,同時也在政府部門的開放數(shù)據領域展開了實踐探索。關聯(lián)數(shù)據的核心目的就是促進數(shù)據資源的共享和重用,以此增加數(shù)據資源的應用價值。政府開放數(shù)據涵蓋各個領域的數(shù)據資源,包括醫(yī)療、交通、旅行和環(huán)境等
10、領域數(shù)據。關聯(lián)政府開放數(shù)據同時也促進領域資源之間的互聯(lián),即通過關聯(lián)數(shù)據技術,將具有相關性的政府開放數(shù)據進行鏈接,實現(xiàn)數(shù)據資源之間的關聯(lián)發(fā)現(xiàn)。如美國倫斯勒理工學院(Rensselaer Polytechnic Institute,簡稱RPI)開發(fā)的Data-gov Wiki可以將data.gov中的數(shù)據集轉換為RDF格式,以關聯(lián)數(shù)據的形式重新呈現(xiàn)[1];英國政府發(fā)布的關聯(lián)數(shù)據主要包括統(tǒng)計數(shù)據[2]和地理空間數(shù)據[3]。 </p>
11、;<p> 從國際上相關研究上來看,Hendler等[4]和Shadbolt等[2]分別介紹了數(shù)據集“Semantic.data.gov”和“Data.gov.uk”的建設和發(fā)布情況:Shadbolt 和O'Hara[5]通過研究英國開放數(shù)據集的發(fā)展現(xiàn)狀,認為在關注政府領域開放關聯(lián)數(shù)據時,要關注質量、消費動力問題,要跟蹤數(shù)據出處、保護公民隱私等;Galiotou等[6]介紹了希臘基于關聯(lián)數(shù)據技術,應用于希臘政府門
12、戶網站的政府開放關聯(lián)數(shù)據技術的案例;Janssen和Hoven[7]探討了在建設和利用開放關聯(lián)大數(shù)據(Big and Open Linked Data,BOLD)時需要關注透明度和隱私問題;Vert[8]分析了運用關聯(lián)數(shù)據解決開放政府數(shù)據處理的生命周期中所需要的數(shù)據發(fā)現(xiàn)、清洗、造型、出版等步驟,并以羅馬尼亞為例介紹LOGD在智慧城市中的應用;Corradi等[9]以博洛尼亞為例,分析關聯(lián)數(shù)據在開放政府中的應用;Yuan等[10]認為,通
13、過關聯(lián)數(shù)據技術發(fā)布的政府數(shù)據可以提高數(shù)據的透明度和重用度,并對中國智慧城市建設中使用的關聯(lián)政府數(shù)據進行了研究。 目前,國內還沒有實現(xiàn)大規(guī)模的政府開放關</p><p> 本文通過對國際上政府類開放關聯(lián)數(shù)據集進行較為詳細的調查研究,重點關注不同國家和不同管理單位對于開放關聯(lián)數(shù)據集的應用情況,希望對我國開放關聯(lián)政府數(shù)據集的研究和實踐起到一定的參考指導作用。 </p><p> 2 開
14、放關聯(lián)政府數(shù)據集統(tǒng)計分析 </p><p> 2.1 數(shù)據來源選擇 </p><p> 隨著開放關聯(lián)數(shù)據計劃(The Linking Open Data Project,簡稱 LOD)的發(fā)展,越來越多的數(shù)據提供者和網絡應用開發(fā)者將各自的數(shù)據發(fā)布到網絡上,并與其它數(shù)據源關聯(lián)在一起,形成了一個巨大的數(shù)據網絡。筆者以德國曼海姆大學發(fā)布的關聯(lián)數(shù)據目錄(Mannheim Linked Data
15、Catalog)為主要調查對象,結合LOD云圖2014年發(fā)布成果進行檢索,檢索時間為2016年3月20日。檢索結果顯示,截止調查時間為止,在互聯(lián)網上發(fā)布的開放關聯(lián)數(shù)據集共有1484個,主要集中于政府、出版物、生命科學、用戶生成內容、跨領域、媒體、地理、社交網絡等八大主題領域(見表1),與2014年8月LOD云圖發(fā)布的數(shù)據相對比,可以看到,關聯(lián)數(shù)據集數(shù)量增長了46.35%。其中,政府主題的數(shù)據集增長了55.19%。本次調查的樣本在曼海姆關
16、聯(lián)數(shù)據目錄中滿足標簽信息為“government”的284個關聯(lián)數(shù)據集。 </p><p> 2.2 開放關聯(lián)政府數(shù)據集概況分析 </p><p> 2.2.1 數(shù)據集發(fā)布國家分布概況 </p><p> 從表2可知,284個數(shù)據集分布在20個國家或國際組織之間。其中,英國以153個占據首位,發(fā)布機構有英國內政部、英國統(tǒng)計局、Data.gov.uk團隊等, &
17、lt;/p><p> 注:檢索時間為2016年3月20日。 </p><p> 發(fā)布平臺有Opendatacommunities.org、data.gov.org等,數(shù)據集內容包括地方政府財政、政府預算、居民住房和家庭情況、社會福利、復合剝奪指數(shù)、部門業(yè)務計劃以及地理數(shù)據等。歐盟提供有30個關聯(lián)開放政府數(shù)據集,發(fā)布機構有歐盟統(tǒng)計局、歐盟議會、歐盟環(huán)境署、歐洲中央銀行等。美國提供有20個關聯(lián)
18、開放政府數(shù)據集,發(fā)布機構為美國證券交易委員會、美國聯(lián)邦統(tǒng)計機構、美國國會等。西班牙提供有15個,市政府、市統(tǒng)計局等為主要發(fā)布機構。還有一些國際組織也紛紛發(fā)布了關聯(lián)開放政府數(shù)據集,如國際清算銀行、國際援助透明度倡議組織、國際糧食政策研究所、國際貨幣基金組織、經濟合作與發(fā)展組織和世界銀行等。 </p><p> 三元組數(shù)量排名前20的數(shù)據集部分屬性信息 </p><p> ?。ㄒ姳?)中,前
19、五位有3個關聯(lián)開放政府數(shù)據集都是由美國data.gov發(fā)布的政府數(shù)據,占到政府類數(shù)據集三元組總數(shù)的52.18%。 </p><p> 2.2.2 數(shù)據集主題分布 </p><p> 政府信息資源涉及到綜合政務、經濟管理、交通運輸、信息產業(yè)、城市建設、科技教育等多個領域,在調查涉及的284個關聯(lián)開放政府數(shù)據集中,其主題分布在民政社區(qū)、政法監(jiān)察、綜合政務、經濟建設等幾個方面(見表4)。其中
20、,93個(占總體32.75%)關聯(lián)開放政府數(shù)據集的主題為民政和社區(qū),內容包括人口數(shù)據(如2001年西班牙人口普查數(shù)據“2001 Spanish Census to RDF”;英國國家統(tǒng)計局發(fā)布的2001年年中到2007年年中的人口數(shù)據集“EnAKTing Population Dataset”等)、社會福利(如由英國社區(qū)暨地方發(fā)展部進行的區(qū)域社會復合剝奪指數(shù)“Index of Multiple Deprivation,簡稱 IMD”系列
21、調查而生成的關聯(lián)數(shù)據集“English Index of Multiple Deprivation Ranking 2010”等)、民意調查(如歐洲標準調查數(shù)據集“Standard Eurobarometer”,提供歐洲社會科學研究中應用最廣泛的數(shù)據來源)等。 </p><p> 在政法監(jiān)察類數(shù)據集中,有代表性的為英國國家檔案館發(fā)布的法律主題數(shù)據集“UK Legislation”、國際透明組織發(fā)布的包括腐敗感知
22、指數(shù)和數(shù)據來源的數(shù)據集“Transparency International Linked Data”、希臘警察局發(fā)布的犯罪事件數(shù)據集“Hellenic Police”等。 </p><p> 2.2.3 數(shù)據集格式分布 </p><p> 從曼海姆關聯(lián)數(shù)據目錄中提供的數(shù)據集格式可以看出,不同的數(shù)據集或采用單一的格式,或將多種格式進行組合呈現(xiàn)。本次調查的284個關聯(lián)開放政府數(shù)據集共采用
23、了26種數(shù)據集格式,其中排名前15名的見圖1??梢钥闯觯琫xample/rdf+xml、api/sparql和meta/void是LOGD最常采用的格式,特別是example/rdf+xml,有85.21%的關聯(lián)開放政府數(shù)據集選擇了此格式,如為了便于數(shù)據集的管理和互操作,由英國社區(qū)以及地方政府管理部成立的開放關聯(lián)數(shù)據網站OpenDataCommunities.org中所提供的所有數(shù)據集格式都統(tǒng)一為example/rdf+xml格式。而與
24、醫(yī)學相關領域的開放關聯(lián)數(shù)據集進行對比,關聯(lián)開放政府 數(shù)據集更常采用meta/void、meta/rdf-schema來組織數(shù)據集格式[16]。 </p><p> 2.3 開放關聯(lián)數(shù)據集關聯(lián)應用統(tǒng)計分析 </p><p> 關聯(lián)數(shù)據的提供者通過設置RDF連接,將單一的數(shù)據集鏈接到數(shù)據云圖中,使得數(shù)據集可以通過RDF鏈接更易被發(fā)現(xiàn)和利用。在2014年對LOD云圖中數(shù)據集的統(tǒng)計中發(fā)現(xiàn)
25、,一共有56.11%的數(shù)據集可以鏈接到至少一個數(shù)據集[17]。本次調查通過參考“鏈出”(outgoing links)和“鏈入”(incoming links)概念[16]來描述開放關聯(lián)數(shù)據集之前的關聯(lián)關系,根據在曼海姆關聯(lián)數(shù)據目錄中對284個關聯(lián)開放政府數(shù)據集進行調研,各個數(shù)據集的鏈出和鏈入情況詳細描述如下。 </p><p> 2.3.1 數(shù)據集鏈出統(tǒng)計 </p><p> 關聯(lián)數(shù)
26、據的云圖并不是強連接,并不是每一個數(shù)據集都存在于其他數(shù)據集的連接,即可能會出現(xiàn)數(shù)據集“孤島”[18]。在本次調查的284個關聯(lián)開放政府數(shù)據集中,有103個數(shù)據集沒有鏈接到其他數(shù)據集,有70個數(shù)據集僅與一個數(shù)據集建立連接關系,而鏈出數(shù)量最高的為數(shù)據集“Community R&D Information Service (CORDIS) (RKBExplorer)”,鏈出至20個數(shù)據集(見圖2)。其中鏈出數(shù)據集數(shù)量在5個以上的數(shù)據集
27、具體分布情況(見表5)。 </p><p> 2.3.2 數(shù)據集鏈入統(tǒng)計 </p><p> 在284個數(shù)據集中,有57個數(shù)據集被本領域的其他數(shù)據集鏈入(非本領域的數(shù)據集鏈入情況不統(tǒng)計),具體分布情況(見圖3)。 </p><p> 根據LOD2014報告顯示,在LOD2014年發(fā)布的關聯(lián)數(shù)據中,鏈出數(shù)量最高的為數(shù)據集“DBpedia”,其入度(indegre
28、e)達到了207。在本次調查涉及的政府信息相關的關聯(lián)數(shù)據中,數(shù)據集“reference.data.gov.uk”和“statistics.data.gov.uk”的鏈入數(shù)據集最多,占到了所有關聯(lián)開放政府數(shù)據集的29.23%,這兩個數(shù)據集分別提供英國有關人口、部門、行政區(qū)劃等信息,因此其鏈入的數(shù)據集多為在平臺opendatacommunities.org上發(fā)布的數(shù)據集。 </p><p> 而從LOD整體數(shù)據集來
29、看,被關聯(lián)開放政府數(shù)據集引用次數(shù)較多的數(shù)據集還有:跨領域數(shù)據集“dbpedia.org”,鏈入數(shù)據集71個;地理數(shù)據集“geonames.org”鏈入數(shù)據集33個;跨領域數(shù)據集“w3.org”鏈入數(shù)據集10個;跨領域數(shù)據集“l(fā)exvo.org”鏈入數(shù)據集9個??珙I域數(shù)據集提供標準被LOGD廣泛的使用,如由Wikipedia中抽取結構化信息生成的Dbpedia數(shù)據集為包括聯(lián)合國糧農組織關聯(lián)數(shù)據、國際貨幣基金組織關聯(lián)數(shù)據和Europeana
30、關聯(lián)開放數(shù)據等在內的關聯(lián)開放政府數(shù)據集所引用。地理數(shù)據集geonames.org包含了超過800萬個地理名稱,涉及地理信息的關聯(lián)開放政府數(shù)據集,如世界銀行關聯(lián)數(shù)據集、OECD關聯(lián)數(shù)據集合、美國國會數(shù)據集、希臘政府消防數(shù)據集等被廣泛引用。 </p><p> 2.3.3 連接謂詞統(tǒng)計分析 </p><p> 關聯(lián)數(shù)據中的連接謂詞是RDF聲明語句中的屬性,定義了主體和客體之間的聯(lián)系,一般由
31、一個URI表示。謂詞的選擇能使得知識連接的RDF描述語義更加明確,用戶和網絡抓取程序也能容易獲取知識連接,并通過謂詞的詞間關系建立更多的知識鏈接[19]。政府類關聯(lián)開放數(shù)據集常用的連接謂詞(見圖4)。dct:publisher定義了責任者屬性,通過該屬性將不同責任者制作的數(shù)據集建立關聯(lián),形成基于同一內容不同出版者之間的數(shù)據操作。dct:spatial定義了空間屬性,數(shù)據集之間可以通過該屬性將不同實體地理坐標的數(shù)據集建立關聯(lián),形成互操作[
32、20]。owl:sameAs在LOD整體使用較多,表示“兩個URI引用實際上指向同一事物”,使用這一屬性能夠有效聚合指向同一事務對象的所有數(shù)據。 </p><p> 2.3.4 開放關聯(lián)數(shù)據集所用詞表統(tǒng)計 </p><p> 為了使應用程序更好的理解關聯(lián)數(shù)據,數(shù)據提供者使用詞表來盡可能的定義數(shù)據。在研究關聯(lián)數(shù)據的時候,一般認為,當一個詞表被至少2個數(shù)據集使用,即認為是非專有詞表,反之則
33、為專有詞表。 </p><p> 從表7中可以看到,關聯(lián)開放政府數(shù)據集最常使用的詞表是作為描述語言的rdf和rdfs,都柏林核 </p><p> 心詞表dcterms使用也較為廣泛,有近半數(shù)的關聯(lián)開放政府數(shù)據集選擇了該詞表。除此之外,關聯(lián)開放政府數(shù)據集還較常使用詞表cube(The RDF Data Cube Vocabulary),這是一個用來發(fā)布規(guī)范的多維數(shù)據集語言,使用W3C
34、RDF標準構建,主要用于表達各種統(tǒng)計數(shù)據[21],代表性數(shù)據集包括英國復合剝奪指數(shù)系列數(shù)據集等。FOAF(Friend of a Friend Vocabulary)也是一個得到廣泛應用的本體,用于描述與人相關的資源,包括個人、組織和項目等,代表性數(shù)據集為2011年美國國會議員數(shù)據集“2011 US Congress People”、巴西政治家數(shù)據集“Brazilian Politicians”和西班牙政府數(shù)據集“Datos Abier
35、tos de Zaragoza”等。而在其他領域被廣泛使用的網絡本體語言owl詞表在關聯(lián)開放政府數(shù)據集使用率相對較低(僅為20.77%,相比于LOD 2014數(shù)據為36.49%[17],出版領域59.38%[22]、醫(yī)學領域71/85[16]),使用owl詞表的有聯(lián)合國糧農組織的地緣政治本體、歐洲關聯(lián)數(shù)據本體中心等。 </p><p> 2.5 開放關聯(lián)數(shù)據集開放協(xié)議統(tǒng)計 </p><p&g
36、t; 在發(fā)布關聯(lián)開放政府數(shù)據集的時候,不同的機構對數(shù)據集有不同等級和側重的開放許可協(xié)議。數(shù) </p><p> 據開放許可協(xié)議一般分為面向內容和數(shù)據兩方面的協(xié)議。本次調查的284個關聯(lián)開放政府數(shù)據集中,聲明數(shù)據開放許可的情況(見表8)。 </p><p> 在284個關聯(lián)開放政府數(shù)據集中,有72.54%的數(shù)據集采用各種形式使用了許可信息,與2011年(LOD的207個開放數(shù)據集中有1
37、8個數(shù)據集公開了其協(xié)議信息[23])相比,越來越多的數(shù)據集發(fā)布者開始使用各種關聯(lián)數(shù)據訪問協(xié)議來保護利益相關者,為政府類的關聯(lián)數(shù)據能穩(wěn)定健康的發(fā)展和利用提供了法律保障,其中常用的協(xié)議主要包括知識共享(Creative Commons,CC)、公共數(shù)據協(xié)議(Open Government License,OGL)、開放數(shù)據共用(Open Data Commons,ODC)等針對關聯(lián)數(shù)據自身特點而制定的協(xié)議。英國由data.gov.uk發(fā)布的
38、系列數(shù)據集(如商業(yè)、環(huán)境、專利、交通等)采用了英國皇家版權協(xié)議。還有16個數(shù)據集使用借鑒“開放知識”[24]的定義,從不同維度規(guī)定了開放協(xié)議的基本權利。 而通過調查數(shù)據集發(fā)布者的信息可以得知,在284個關聯(lián)開放政府數(shù)據集中,由第三方發(fā)布的有83個,其中僅有2個沒有提供開放許可信息;由制作者發(fā)布的有26個,其中有3個沒有提供開放許可信息。而在175個沒有明確標注發(fā)布者信息的數(shù)據集中,則有73個都無法提供明確的開放許可信息???lt;
39、/p><p> 3 開放關聯(lián)政府數(shù)據集的特點 </p><p> 根據上文中對關聯(lián)開放政府數(shù)據集的發(fā)布國家、主題分布、關聯(lián)應用和開放協(xié)議等方面的統(tǒng)計,筆者總結出開放關聯(lián)政府數(shù)據集的特點,為我國建設開放關聯(lián)政府數(shù)據集提供啟示。 </p><p> 3.1 數(shù)據集國家分布呈現(xiàn)較為集中,主要發(fā)布國之間數(shù)據開放程度高 </p><p> 在201
40、5年英國開放基金會(OKF)公布的全球開放數(shù)據指數(shù)中,臺灣以78%政府數(shù)據開放成為全球第一,緊隨其后的是英國(76%)和丹麥(70%),而我國僅以18%的指數(shù)排在第93位,其中國家統(tǒng)計數(shù)據、全民普選數(shù)據等多個關鍵數(shù)據集均顯示并無法公開可訪問, “數(shù)據僅為公開、尚未達到開放的標準”[25]。而在由獨立學術組織世界正義項目(World Justice Project)發(fā)布的“全球開放政府指數(shù)”中,得分最高的前三個國家分別是瑞典、新西蘭、挪威
41、,我國以0.43分位列全部國家和地區(qū)中的第87名[26]。 </p><p> 通過關聯(lián)數(shù)據發(fā)布的政府數(shù)據利用本體技術,整合政府運作過程中產生的各類術語體系和數(shù)據模型,使得數(shù)據通過語義關聯(lián),便于數(shù)據的開啟、鏈接和重用,能夠有效提高數(shù)據的透明度,規(guī)范數(shù)據發(fā)布行為,提升政府數(shù)據的利用效率[27]。從調查中可以看到,關聯(lián)數(shù)據集集中分布在英國、歐盟、美國等國家,另外,根據檢索數(shù)據集網站the datahub,還可以發(fā)現(xiàn)
42、捷克共和國、丹麥等國家的開放關聯(lián)數(shù)據集也已占據一定規(guī)模,這些國家通過關聯(lián)數(shù)據技術將已經發(fā)布的開放數(shù)據進行規(guī)范和重用,數(shù)據集之間建立連接關系,大大提高了政府開放數(shù)據的利用程度。 </p><p> 3.2 數(shù)據集主題涵蓋政府工作各個方面,為構建智慧政府和智慧城市提供數(shù)據支撐 </p><p> 開放關聯(lián)政府數(shù)據集的主題涵蓋了政治、經濟、文化、民生在內的多個方面,隨著智慧政府建設的發(fā)展,誕
43、生智慧的過程就是建立信息關聯(lián)的過程。關聯(lián)數(shù)據技術將相關數(shù)據通過W3C標準中的關聯(lián)數(shù)據技術實現(xiàn)語義連接,并發(fā)布到統(tǒng)一的數(shù)據平臺上供公眾使用。通過數(shù)據化的高度融合,以數(shù)據信息的融合為基礎實現(xiàn)數(shù)據之間的互聯(lián)互通。關聯(lián)政府開放數(shù)據能夠為智慧政府和智慧城市的構建提供數(shù)據的組織和管理,促進數(shù)據資源的融合。 </p><p> 3.3 數(shù)據集之間關聯(lián)關系較為緊密,促進政府開放數(shù)據的關聯(lián)發(fā)現(xiàn) </p><p
44、> 政府目錄和數(shù)據集的數(shù)量繼續(xù)增加,最佳實踐通過數(shù)據發(fā)布者和使用者的連接數(shù)量來制定。2011年6月啟動的W3C政府關聯(lián)數(shù)據工作組具有提供標準和幫助世界各地政府發(fā)布他們的數(shù)據作為有效和有用的關聯(lián)數(shù)據的其他信息的使命,包括指導部門和對遺留數(shù)據的采集、詞匯選擇、URI構建,版本控制、穩(wěn)定性、轉換機制[28]。政府類關聯(lián)數(shù)據集之間的相互關聯(lián)較為活躍,有63.7%的數(shù)據集與外部有鏈接,而對跨領域和地理領域的數(shù)據集關聯(lián)程度也較高。在搭建數(shù)據
45、集平臺時,可以借鑒其他領域數(shù)據集的關聯(lián)關系,提高數(shù)據集之間信息的互聯(lián)。 </p><p> 3.4 質量控制和版權保護較為嚴格,規(guī)范利益相關者行為 </p><p> 從LOD2014可以看到,開放關聯(lián)政府數(shù)據集較多采用都柏林核心元數(shù)據組織信息,在關聯(lián)數(shù)據集格式上,也有85.21%的關聯(lián)開放政府數(shù)據集選擇了example/rdf+xml、meta/void和meta/rdf-schem
46、a等RDF標準數(shù)據發(fā)布格式,使得發(fā)布的關聯(lián)數(shù)據更為可靠,對于使用者也能更方便、靈活的重用政府數(shù)據。另外,開放關聯(lián)政府數(shù)據集的開放授權協(xié)議的使用也較為廣泛,這種嚴謹?shù)陌鏅啾Wo政策能夠從數(shù)據發(fā)布的源頭規(guī)范人們涉及知識產權的行為,在滿足互聯(lián)網數(shù)據共享需求的同時,促進人們積極參與關聯(lián)數(shù)據運動,保障關聯(lián)數(shù)據運動不斷向前發(fā)展。 </p><p><b> 參考文獻: </b></p>&
47、lt;p> [1] Tetherless World Constellation.The Data-gov Wiki[EB/OL].[2016-03-20].https://data-gov.tw.rpi.edu//wiki. </p><p> [2] Shadbolt N,O'Hara K,Berners-Lee T,et al.Linked Open Government Data:Les
48、sons from Data.gov.uk[J].IEEE,Intelligent Systems,2012,27(3):16-24. </p><p> [3] Clough P,Tang J,Hall M M,et al.Linking archival data to location: a case study at the UK National Archives[J].Aslib Proceedin
49、gs,2011,63(2/3):127-147. </p><p> [4] Hendler J,Holm J,Musialek C,et al.US Government Linked Open Data:Semantic.data.gov[J].IEEE Intelligent Systems,2012,27(3):25-31. </p><p> [5] Shadbolt N,O
50、'Hara K.Linked Data in Government[J].IEEE Internet Computing,2013,17(4):72-77. </p><p> [6] Galiotou E,F(xiàn)ragkou P.Applying Linked Data Technologies to Greek Open Government Data:A Case Study[J].Procedia
51、- Social and Behavioral Sciences,2013(73):479-486. [7] Janssen M,Jeroen V D H.Big and Open Linked Data(BOLD)in government:A challenge to transparency and privacy?[J]. Government Information Quarterly,2015,32(4):363-36
52、8. </p><p> [8] Vert,S.Linked Open Government Data for Smart City Applications[C].Patrut,B,etc.SMART 2014 - SOCIAL MEDIA IN ACADEMIA:RESEARCH AND TEACHING.ITALY:MEDIMOND S R L,2015:401-406. </p><
53、p> [9] Corradi A,F(xiàn)oschini L,Ianniello R.Linked data for Open Government:The case of Bologna[C].Computers and Communication.2014:1-7. </p><p> [10] Yuan Y,Wu C,Ai H.Application Of Linked Open Government
54、Data:State Of The Art And Challenges[J].Theriogenology, 2005,63(2):283-299. </p><p> [11] 吳?h,李占羽.基于關聯(lián)數(shù)據開放政府數(shù)據[J].電腦知識與技術,2010,6(11):8688-8691. </p><p> [12] 袁遠明,吳產樂,艾浩軍.關聯(lián)開放政府數(shù)據的研究與應用進展[J].電信
55、科學,2012,28(9):69-73. </p><p> [13] 錢國富.基于關聯(lián)數(shù)據的政府數(shù)據發(fā)布[J].圖書情報工作,2012,56(5):123-127. </p><p> [14] 吳?h,李占羽,李丹寧.關聯(lián)數(shù)據在公安情報研判系統(tǒng)的應用[J].貴州科學,2011,29(2):26-31. </p><p> [15] 丁楠,王鈺,潘有能.基于
56、關聯(lián)數(shù)據的政府信息聚合研究[J].情報理論與實踐,2015,38(7):76-79. </p><p> [16] 涂志芳,吳丹.醫(yī)學相關領域開放關聯(lián)數(shù)據集調查研究[J].圖書情報工作,2015,59(18):14-23. </p><p> [17] State of the LOD Cloud[EB/OL].[2016-03-20].http://linkeddatacatalog
57、.dws.informatik.uni-mannheim.de/state/#toc4. </p><p> [18] Rodriguez M A. A Graph Analysis of the Linked Data Cloud[EB/OL].[2016-04-30].http://arxiv.org/pdf/0903.0194vl.pdf. </p><p> [19] 司徒俊峰
58、,曹樹金,謝莉.論基于關聯(lián)數(shù)據的知識鏈接構建與應用[J].圖書情報工作,2013,57(16):123-129. </p><p> [20] Data Catalog Vocabulary(DCAT)[EB/OL].[2016-03-20].https://www.w3.org/TR/vocab-dcat/. </p><p> [21] The RDF Data Cube Voca
59、bulary[EB/OL].[2016-03-20].https://www.w3.org/TR/vocab-data-cube/. </p><p> [22] 賈君枝,寇蕾蕾.關聯(lián)數(shù)據云圖中出版類數(shù)據集特點分析[J].國家圖書館學刊,2016(1):59-68. </p><p> [23] 張春景,劉煒,夏翠娟,等.關聯(lián)數(shù)據開放應用協(xié)議[J].中國圖書館學報,2012(1):43
60、-48. </p><p> [24] Open Definition 2.0 - Open Definition - Defining Open in Open Data, Open Content and Open Knowledge[EB/OL].[2016-03-20].http://opendefinition.org/od/2.0/en/. </p><p> [25] P
61、lace overview | Global Open Data Index by Open Knowledge[EB/OL].[2016-03-20].http://index.okfn.org/place/. </p><p> [26] World Justice Project.Open Government Index 2015 Report[EB/OL].[2016-03-20].http://wo
62、rldjusticeproject.org/sites/default/files/ogi_2015.pdf. </p><p> [27] Li Ding,Vassilios Peristeras,Michael Hausenblas.Linked Open Government Data INTRODUCTION[J].Intelligent Systems,IEEE,2012,27(3):11-15. &
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關聯(lián)數(shù)據集混合式映射研究.pdf
- 書目關聯(lián)數(shù)據的關聯(lián)方法研究
- 應用粗糙集的多來源關聯(lián)數(shù)據排序研究.pdf
- 中文古籍書目數(shù)據的關聯(lián)數(shù)據化研究
- 書目關聯(lián)數(shù)據的關聯(lián)方法研究.pdf
- 關聯(lián)數(shù)據中的實體鏈接研究.pdf
- 大數(shù)據環(huán)境下的審計關聯(lián)數(shù)據研究
- 大數(shù)據環(huán)境下的審計關聯(lián)數(shù)據研究
- 大數(shù)據環(huán)境下的審計關聯(lián)數(shù)據研究
- 中文古籍書目數(shù)據的關聯(lián)數(shù)據化研究.pdf
- 基于規(guī)則的關聯(lián)數(shù)據壓縮研究.pdf
- 基于bibframe的書目信息關聯(lián)數(shù)據化研究
- 基于關聯(lián)數(shù)據語義相似度計算研究.pdf
- 面向關聯(lián)數(shù)據的實體對齊方法研究.pdf
- 關聯(lián)數(shù)據聯(lián)合查詢處理技術研究.pdf
- 基于BIBFRAME的書目信息關聯(lián)數(shù)據化研究.pdf
- 大規(guī)模生物醫(yī)學語義關聯(lián)數(shù)據集的查詢關鍵技術研究.pdf
- 構建中文社交網絡關聯(lián)數(shù)據.pdf
- 關聯(lián)數(shù)據網絡中的本體映射研究.pdf
- 基于Jena的關聯(lián)數(shù)據語義導航技術.pdf
評論
0/150
提交評論