有好的想法卻找不到合適的數(shù)據(jù)庫(kù)?無(wú)法下載到理想的數(shù)據(jù)格式?這部分就給大家羅列了現(xiàn)在流行的一些開源免費(fèi)數(shù)據(jù)庫(kù)的入口:
1. The Guardian Data Store 鏈接 >>>
英國(guó)衛(wèi)報(bào)的Data Store始建于2010年,其針對(duì)不同的主題分類,提供一系列的在線數(shù)據(jù)集。契合英國(guó)報(bào)業(yè)的新聞追求,這個(gè)數(shù)據(jù)商城同樣遵循著”事實(shí)是神圣的”信條。衛(wèi)報(bào)的前主表Simon Rogers解釋道,他們希望能充分利用這些海量數(shù)據(jù),向公眾提供另一類可信的新聞服務(wù)。 衛(wèi)報(bào)在這個(gè)數(shù)據(jù)新聞?lì)I(lǐng)域一直是先驅(qū)者,他們的數(shù)據(jù)新聞作品和博客非常值得閱讀。
2. Google Public Data Explorer 鏈接 >>>
谷歌的公開數(shù)據(jù)庫(kù)始建于2010,旨在讓用戶更容易地理解和分享數(shù)據(jù)。這個(gè)在線工具基于著名的Gapminder Foundation的Trendalyzer軟件,主攻時(shí)間數(shù)據(jù),允許用戶創(chuàng)建全面、簡(jiǎn)潔、互動(dòng)的可視化圖表。如果你還沒有看過數(shù)據(jù)可視界巨擘Hans Rosling的經(jīng)典視頻及其產(chǎn)品,那你就落伍啦,趕緊補(bǔ)上這一課吧!
3. World Bank 鏈接 >>>
世界銀行旗下的數(shù)據(jù)銀行是最新的數(shù)據(jù)查詢工具,提供超過9,000個(gè)指標(biāo),用戶可以用它們來建立帶表格、圖表、或地圖的海關(guān)報(bào)表。這些實(shí)時(shí)報(bào)表可以被儲(chǔ)存、在用戶間分享、以及插入網(wǎng)站或博客文章中。數(shù)據(jù)銀行創(chuàng)始人之一、“公開數(shù)據(jù)”首席信息官員Reza Farivari的介紹視頻值得一看。世界銀行同時(shí)創(chuàng)建了其博客,邀請(qǐng)了許多這個(gè)領(lǐng)域的專家撰文。
4. UN Data 鏈接 >>>
世界銀行的”競(jìng)爭(zhēng)對(duì)手”聯(lián)合國(guó)也有一個(gè)自己的數(shù)據(jù)庫(kù),主要類別包括農(nóng)業(yè)、犯罪、教育、環(huán)境、能源、艾滋病等。它們現(xiàn)在也開發(fā)了自己的可視化分析工具,這里有一個(gè)互聯(lián)網(wǎng)人口的互動(dòng)圖。這個(gè)基于PHP / Javascript / MySQL的開源工具是由DrasicData開發(fā),下載地址在此 >>>
5. BuzzData(即將下線) 鏈接 >>>
BuzzData是一個(gè)測(cè)試版的社交數(shù)據(jù)發(fā)布平臺(tái),其CTO Pete Forde希望能提供一個(gè)平臺(tái),讓有不同背景和技能的數(shù)據(jù)愛好者可以分享交流。盡管它們的開發(fā)者已經(jīng)停止了這個(gè)網(wǎng)站的維護(hù),轉(zhuǎn)做新的產(chǎn)品LookBookHQ,從前發(fā)布在平臺(tái)上的數(shù)據(jù)已然可以下載。它們同時(shí)提供API,方便開發(fā)者使用,這里是它們的GitHub賬號(hào)>>>。
6. OpenCorporates 鏈接 >>>
OpenCorporates數(shù)據(jù)庫(kù)主要收集可公共使用的公司信息,它提供的各種內(nèi)部外部的數(shù)據(jù)庫(kù)鏈接極大地方便了使用者。數(shù)據(jù)索引是通過查詢WIPO(World Intellectual Property Organization) 唯一注冊(cè)商標(biāo)的方法。OpenCorporates的另一大優(yōu)點(diǎn)是提供公司及管理者網(wǎng)絡(luò)圖,通過可視的方法幫助用戶了解每個(gè)公司之間的關(guān)系以及管理者的跳槽經(jīng)歷。它們也提供了API方便開發(fā)者使用。
7. InfoChimps 鏈接 >>>
InfoChiimps是由一些數(shù)據(jù)科學(xué)家和計(jì)算專家建立,致力于提供更快更簡(jiǎn)介的大數(shù)據(jù)系統(tǒng)解決方案。他們的數(shù)據(jù)市場(chǎng)收集了上萬(wàn)條有價(jià)值的數(shù)據(jù)庫(kù)信息,囊括了社交、地理、金融等各類數(shù)據(jù),方便數(shù)據(jù)熱愛者開發(fā)出有意思的應(yīng)用。
8. OECD Statistics 鏈接 >>>
OECD是一個(gè)龐大的在線統(tǒng)計(jì)數(shù)據(jù)庫(kù),用戶可以創(chuàng)建下載自己的表格,支持多種格式。OECD的一大優(yōu)點(diǎn)是對(duì)其數(shù)據(jù)都列出了收集方法和數(shù)據(jù)源,方便引用和查詢。數(shù)據(jù)類型上,OECD囊括了GDP、失業(yè)率、教育、金融、醫(yī)療等各種類型,大家可以先瀏覽一下用戶使用指南。
9. GeoCommons 鏈接 >>>
GeoCommons是一個(gè)很不錯(cuò)的地理數(shù)據(jù)信息庫(kù),也是ESRI社區(qū)的一員。這里有一系列的新手視頻可以先學(xué)習(xí)。它們提供免費(fèi)的數(shù)據(jù)、工具和應(yīng)用接口。其在線工具允許用戶實(shí)時(shí)上傳數(shù)據(jù)并使用他們的地圖可視工具,生成的交互圖可以方便地被以Iframe形式被嵌入在其它網(wǎng)站中,這里是它們?nèi)ツ曜龅囊粋€(gè)全美失業(yè)率2012交互地圖。想要進(jìn)一步拓展的話可以使用ArcGIS Online. GeoCommons還有一個(gè)GeoIQ開發(fā)者社區(qū),方便大家在線交流以及查看一些優(yōu)秀的作品。
10. NBA 體育數(shù)據(jù) 鏈接 >>>
這個(gè)網(wǎng)站可以說是最全的NBA數(shù)據(jù)庫(kù)了,統(tǒng)計(jì)了所有球員、教練、歷屆比賽的信息和分?jǐn)?shù),同時(shí)也有女籃、奧林匹克賽事的相關(guān)數(shù)據(jù)。現(xiàn)在,他們也開始收集冰球賽事、全美大學(xué)生足球賽、全美職業(yè)足球賽、全美大學(xué)生籃球賽的相關(guān)信息,他們和全美最好的體育報(bào)道媒體USA Today Sports是合作火伴。衛(wèi)報(bào)之前做了一個(gè)交互信息圖 Do the tallest teams always win the NCAA championship?基于的就是全美大學(xué)生體育協(xié)會(huì)的籃球比賽數(shù)據(jù)。
11. 美國(guó)官方數(shù)據(jù)庫(kù) 鏈接 >>>
這個(gè)是美國(guó)官方政府的數(shù)據(jù)庫(kù),鼓勵(lì)公眾參與、合作,充分利用聯(lián)邦政府的數(shù)據(jù)集創(chuàng)建應(yīng)用、分析產(chǎn)品或是做科研分析,借此提高政府的透明度和開放度。他們提供的數(shù)據(jù)來自于大學(xué)、聯(lián)邦政府、州政府、非盈利組織等,可下載的文件類型超過十多種,還可以通過標(biāo)簽的方式進(jìn)行查詢,網(wǎng)站本身的界面設(shè)計(jì)也非常友好,用不同的顏色來區(qū)分類型,以卡片的形式展示不同數(shù)據(jù)。
12. 中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局 鏈接 >>>
國(guó)內(nèi)的數(shù)據(jù)現(xiàn)在也越來越公開了,國(guó)家統(tǒng)計(jì)局的網(wǎng)站就提供了關(guān)于國(guó)家土地、水資源、礦產(chǎn)、森林資源、工業(yè)狀況、人口資源等各方面情況的數(shù)據(jù),唯一的缺點(diǎn)是許多數(shù)據(jù)未能統(tǒng)計(jì)到最新年份/月份。對(duì)國(guó)內(nèi)數(shù)據(jù)感興趣的朋友可以充分利用網(wǎng)站上的資源。
13. 上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng) 鏈接 >>>
14. 北京市政府?dāng)?shù)據(jù)網(wǎng) 鏈接 >>>
15. 國(guó)家數(shù)據(jù)網(wǎng) 鏈接 >>>
其它數(shù)據(jù)庫(kù):
DataMarket– Find, understand and share data
The Data Hub– The easy way to get, use and share data.
Knoema– Your personal knowledge highway.
Get the Data– Ask and answer data questions.
Influence Explorer– Provides overviews of political influence data for politicians.
US Census Bureau– Measures America (people, places, economy).
datacatalogs.org– A comprehensive list of open data catalogs.
Freebase– An entity graph of people, places and things from Google.
Data360– Telling compelling and data-driven stories.
Number Of– You ask, they count.
Gallup– Public opinion polls.
EveryBlock– Uncovers info on large cities contained in government databases.
Daytum– Helps you collect, organize and communicate your everyday data.
Munterbund– Graphical visualization of text similarities in essays.
\