世界上最大的圖書館的數(shù)字化轉(zhuǎn)型之路

責(zé)任編輯:cres

作者:Paula Rooney

2021-11-26 10:52:00

來源:企業(yè)網(wǎng)D1Net

原創(chuàng)

世界上最大的圖書館美國(guó)國(guó)會(huì)圖書館的CIO討論了其正在進(jìn)行的云遷移和數(shù)字化,將超過1 7億的大部分物理資產(chǎn)數(shù)字化,讓公眾可以通過任何設(shè)備進(jìn)行訪問。

Conklin在前首席信息官Bernard Barton退休后于今年9月從副首席信息官晉升為了首席信息官,目前正在領(lǐng)導(dǎo)美國(guó)國(guó)會(huì)圖書館(LOC)為期五年的數(shù)字化轉(zhuǎn)型,旨在將數(shù)百萬(wàn)本圖書、歷史收藏和國(guó)會(huì)資料遷移到混合云環(huán)境中。此舉是2019年啟動(dòng)的IT戰(zhàn)略計(jì)劃的一部分,試圖將LOC超過1.7億的大部分物理資產(chǎn)數(shù)字化,讓公眾可以通過任何設(shè)備進(jìn)行訪問。
 
“隨著出版界和圖書館界總體上越來越數(shù)字化,國(guó)會(huì)圖書館也在走向數(shù)字化。”Conklin說,他在CIO辦公室管理著大約400名員工,其中包括大約200名的承包商。
 
國(guó)會(huì)圖書館坐落于國(guó)會(huì)山麥迪遜、亞當(dāng)斯和杰斐遜大樓的三座建筑里,不斷接受著新的物理和數(shù)字?jǐn)?shù)據(jù)以及元數(shù)據(jù)。雖然他們的目標(biāo)不是將所有的資料全部數(shù)字化,但這一轉(zhuǎn)變?nèi)匀皇蔷薮蟮?,Conklin說。“有些數(shù)據(jù)我們會(huì)保存在本地,有些數(shù)據(jù)則希望放在云平臺(tái),獲得云計(jì)算的效率和彈性。”她補(bǔ)充道。
 
麻省理工學(xué)院斯隆管理學(xué)院的首席研究科學(xué)家兼高級(jí)講師George Westerman說,這項(xiàng)雄心勃勃的事業(yè)將惠及整個(gè)社會(huì)。
 
“LOC的目標(biāo)是通過數(shù)字化來‘打開寶藏’,這樣它就可以讓全國(guó)各地的公民、教師和創(chuàng)新者都能訪問圖書館的各種資料,而不需要親自來華盛頓了。”Westerman說。
 
改造國(guó)會(huì)圖書館
 
LOC最初引入了埃森哲來幫助其指導(dǎo)現(xiàn)有的數(shù)字化轉(zhuǎn)型。這項(xiàng)為期三年的工作包括將超過130個(gè)圖書館IT系統(tǒng)和應(yīng)用程序從麥迪森大樓的一個(gè)“過時(shí)”數(shù)據(jù)中心轉(zhuǎn)移到華盛頓特區(qū)外的一個(gè)最先進(jìn)的三層數(shù)據(jù)中心,以及由圖書館管理的并通過多路徑廣域網(wǎng)連接的其他數(shù)據(jù)中心和云服務(wù)。
 
有了這個(gè)企業(yè)云環(huán)境,圖書館現(xiàn)在可以專注于版權(quán)局的企業(yè)版權(quán)系統(tǒng)(ECS)、國(guó)會(huì)研究服務(wù)局(CRS)的集成研究和信息系統(tǒng)(IRIS)項(xiàng)目,以及改善圖書館所接受、管理和維護(hù)信息的各種項(xiàng)目,并提供館藏資料,其中包括了視聽內(nèi)容管理系統(tǒng)和新的圖書館內(nèi)容平臺(tái)。
 
ECS項(xiàng)目會(huì)將版權(quán)數(shù)據(jù)分配給一家大型云提供商,盡管Conklin拒絕具體說明是三大提供商中的哪一家,但該項(xiàng)目將使申請(qǐng)版權(quán)的流程更加容易和透明。“越來越多的人希望注冊(cè)他們的資料以獲得版權(quán)。”Conklin說。
 
由許可建議和公共記錄等多個(gè)部門組成的美國(guó)版權(quán)局(US Copyright Office)依靠的是人工流程與那些已經(jīng)實(shí)現(xiàn)現(xiàn)代化的IT系統(tǒng)的自動(dòng)化流程的混合。國(guó)會(huì)為這項(xiàng)任務(wù)撥款了6000萬(wàn)美元,圖書館對(duì)完成這項(xiàng)任務(wù)有一個(gè)“非常嚴(yán)格的截止日期”,Conklin說,預(yù)計(jì)將于2024年的10月份上線。
 
Conklin正在修改圖書館的項(xiàng)目管理程序,他還啟動(dòng)了一項(xiàng)為期五年的數(shù)字存儲(chǔ)計(jì)劃,其中包括了吸收許多從各種來源以數(shù)字格式進(jìn)入圖書館的數(shù)字化藏品,以及國(guó)會(huì)兩院的數(shù)字化內(nèi)容。
 
數(shù)十年來,該圖書館一直在傳統(tǒng)遺留系統(tǒng)中存儲(chǔ)數(shù)字化數(shù)據(jù),包括許多重要的歷史文獻(xiàn)和收藏。一些數(shù)字化文檔將保留在本地,因?yàn)椴⒉皇撬械膬?nèi)容都將公開。
 
“目標(biāo)不是數(shù)字化100%的館藏,有些人可能會(huì)對(duì)此感到沮喪。”但Conklin表示,圖書館的預(yù)算不允許建立無限的數(shù)據(jù)倉(cāng)庫(kù),盡管她也指出,國(guó)會(huì)在兩年前通過的一項(xiàng)法律正在放松對(duì)更多數(shù)據(jù)的公開。
 
例如,美國(guó)憲法就不會(huì)出現(xiàn)在國(guó)會(huì)圖書館的網(wǎng)站上,Conklin說。然而,圖書館的數(shù)字化轉(zhuǎn)型也影響了我們對(duì)憲法的理解,因?yàn)橐幻麅?nèi)部保護(hù)主義者利用對(duì)憲法數(shù)字化草案的光譜分析發(fā)現(xiàn)了以前未被發(fā)現(xiàn)的編輯內(nèi)容。
 
“他們分析了憲法草案的一層又一層,他們說他們發(fā)現(xiàn)了對(duì)憲法所做的修改……而這些修改并不為人所知,”Conklin說,他們將其發(fā)現(xiàn)與可追溯性的打開軌跡更改進(jìn)行了比較。
 
該圖書館還涉足了實(shí)驗(yàn)性的人工智能技術(shù),如計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)以及專注于音頻剪輯和視覺藝術(shù)的應(yīng)用程序,其中大部分是作為開源軟件來提供的。
 
因?yàn)檫M(jìn)入國(guó)會(huì)圖書館的數(shù)據(jù)和元數(shù)據(jù)一直存在,數(shù)字化轉(zhuǎn)型的工作也永遠(yuǎn)不會(huì)真正完成。“這將是每個(gè)首席信息官的奮斗目標(biāo)。”Conklin說。
 
毫無疑問,LOC比它剛開始進(jìn)行數(shù)字化轉(zhuǎn)型時(shí)的水平已經(jīng)領(lǐng)先了很多。
 
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)