文化事業
大數據 雲計算 人工智能 與數字時代圖書館究竟是什麽關系?

轉載自(zì)@愛上圖書館 





我們所說的(de)數字時代圖書館,既包含了數字化圖書館,也包含了圖書館數字化。數字化圖書館可(kě)以将大量紙本資源通過數字化技術重組、建設、展示,更大範圍為(wèi)公衆提供文化資源,真正實現公共文化服務均等化、學(xué)術研究文獻系統化的(de)要求。而圖書館數字化的(de)含義則很廣,它不是簡單的(de)互聯網上的(de)圖書館主頁,而是一(yī)整套面向對象的(de)、分布式的(de)、平台無關的(de)數字化資源的(de)集合。

随着大數據時代的(de)來臨,各種閱讀新載體紛紛湧現,大多是電子(zǐ)産品。各種閱讀新樣态更叠頻繁,大多為(wèi)數字呈現。信息技術和(hé)網絡技術在數字圖書館的(de)建設中扮演了非常重要的(de)角色。其中,開展數字圖書館建設便是重要途徑之一(yī)。同時,互聯網+、大數據、智慧城市等戰略落地(dì),也為(wèi)圖書館數字化的(de)發展創造了更大空間。

圖書館是文獻信息中心也是曆史積澱和(hé)文化傳承的(de)場所,擁有豐富的(de)文獻資源和(hé)曆史遺産。互聯網技術不斷發展,使得圖書館數字化逐漸成為(wèi)圖書館發展的(de)重要趨勢。随着大數據時代的(de)來臨,各種閱讀新載體紛紛湧現,各種閱讀新樣态更叠頻繁。




無論是數字化圖書館建設,還是圖書館數字化建設,都是極其複雜而周期漫長(cháng)的(de)工程,再加之數字圖書館的(de)專業人員和(hé)管理(lǐ)人員不足的(de)短(duǎn)闆,是圖書館數字化建設不可(kě)逾越的(de)困難。

今日頭條上近日有一(yī)篇《淺談大數據時代下圖書館的(de)數據處理(lǐ)與服務》的(de)文章(zhāng)就指出,“無須質疑,随着技術的(de)發展,現在的(de)圖書館比以前數字化了許多,自(zì)助借書、自(zì)助還書、自(zì)助查詢書籍(精确到哪個書架的(de)哪一(yī)行哪一(yī)列)。确确實實是方便了許多,但是距離(lí)真正的(de)數字化圖書館,還是有一(yī)段距離(lí),例如(rú)對數據的(de)處理(lǐ)上。”

這位署名為(wèi)“大數據一(yī)哥(gē)”的(de)作者寫到,随着圖書館信息資源的(de)建設步伐加快及讀者服務要求的(de)提高(gāo),圖書館在大數據時代已經具有了一(yī)定的(de)大數據特征。

首先,圖書館的(de)數據種類繁多,圖書館的(de)數據資源包含所藏文獻資源中的(de)紙質純印本、光盤資源、網絡資源、數據庫資源等結構化信息,也有日常讀者信息、服務信息等非結構化信息,更有圖書館自(zì)身建設的(de)相關數據,這些數據的(de)編碼方式、數據格式、應用特征即使是一(yī)所圖書館內(nèi)都無法統一(yī),圖書館間更是存在較大差異,并形成了大量的(de)異構數據;

其次,圖書館的(de)信息資源總量日益龐大且每天在迅速增長(cháng)。全國總的(de)圖書館數字資源總量是一(yī)個龐大的(de)數據集;

再次,随着個性化、學(xué)科化等越來越專業、編輯服務的(de)實施與出現,用戶的(de)服務要求也日益提高(gāo),圖書館必須根據用戶的(de)服務信息等數據做(zuò)出相應的(de)服務策略轉變,對大量數據的(de)分析與潛在價值挖掘顯得不可(kě)避免;

第四,圖書館24小時服務、網絡服務等新興服務方式的(de)出現,使得用戶的(de)服務信息每時每刻都在遞增,但對這些數據的(de)分析和(hé)挖掘需進行相應環境、條件的(de)限定,如(rú)地(dì)域、時段、服務群體等;

第五,盡管圖書館目前的(de)自(zì)動化建設水平較高(gāo)且進入到了一(yī)個新的(de)發展階段,書目信息、用戶信息等都有大量的(de)數據庫進行記載與統計,但對這些數據及未進入數據庫的(de)數據還需進行異構處理(lǐ),以得出新的(de)服務發現。




未來數字時代,圖書館的(de)數據處理(lǐ)主要是将文獻資源等進行數字化、網絡化、語義化處理(lǐ)。并在此基礎上盡力實現用戶的(de)最大滿意和(hé)最大程度利用,數據庫建設、語義化建設、服務手段創新無一(yī)例外,但在大數據時代,圖書館的(de)數據處理(lǐ)範圍、方式、對象、目的(de)等将發生巨大的(de)變化,如(rú)根據讀者服務數據對讀者借閱習慣、愛好等的(de)數據分析,找出新的(de)服務方案、策略。

同時,在大數據時代,圖書館的(de)傳統業務将向數據分析、挖掘方向轉移,對大量數據的(de)分析與處理(lǐ)将成為(wèi)圖書館的(de)主要業務,圖書館資源數據量的(de)擴展、服務質量的(de)提升、服務策略的(de)轉變不僅僅是依靠簡單如(rú)當前的(de)數據共享、豐富資源、創新方式、增加時間等,從大量數據中發現的(de)規律越多、找出的(de)潛在價值越大,圖書館的(de)服務水平等也将提升的(de)越快。

我國圖書館的(de)數字化探索,将不再囿于傳統的(de)業務管理(lǐ)模塊,而是要以用戶需求為(wèi)核心,充分利用大數據分析、通過雲計算、不斷推進人工智能建設等方式,進一(yī)步展開數字資源的(de)加工與傳播,為(wèi)公衆提供全文數據庫和(hé)多媒體信息處理(lǐ)、圖文查詢等服務,持續提升服務體驗。

那麽,圖書館數字化也好,數字化圖書館也好,大數據、雲計算、人工智能究竟是個什麽關系呢(ne)?




一(yī)家名為(wèi)“金智塔”的(de)公衆号載文說,一(yī)般談雲計算的(de)時候會提到大數據、談人工智能的(de)時候會提大數據、談人工智能的(de)時候會提雲計算……這三者不能分開來講,而是有着緊密聯系的(de),互相聯系,互相依托的(de),脫離(lí)了誰都不能更好的(de)發展。但很多人将這三者的(de)概念混為(wèi)一(yī)談,這是不對的(de)。

什麽是“大數據”?

大數據指無法在一(yī)定時間範圍內(nèi)用常規軟件工具進行捕捉、管理(lǐ)和(hé)處理(lǐ)的(de)數據集合,是需要新處理(lǐ)模式才能具有更強的(de)決策力、洞察發現力和(hé)流程優化能力的(de)海量、高(gāo)增長(cháng)率和(hé)多樣化的(de)信息資産。

簡單的(de)描述就是:大數據就是非常龐大的(de)數據,但正因為(wèi)這些數據因為(wèi)太多了,所以需要特殊的(de)工具進行收納、整理(lǐ)、分析。

據IDC發布《數據時代2025》的(de)報告顯示,全球每年(nián)産生的(de)數據将從2018年(nián)的(de)33ZB增長(cháng)到175ZB,相當于每天産生491EB的(de)數據。





那麽175ZB的(de)數據到底有多大呢(ne)?1ZB相當于1.1萬億GB。如(rú)果把175ZB全部存在DVD光盤中,那麽DVD疊加起來的(de)高(gāo)度将是地(dì)球和(hé)月球距離(lí)的(de)23倍(月地(dì)最近距離(lí)約39.3萬公裏),或者繞地(dì)球222圈(一(yī)圈約為(wèi)四萬公裏)。目前美國的(de)平均網速為(wèi)25Mb/秒,一(yī)個人要下載完這175ZB的(de)數據,需要18億年(nián)。

對如(rú)此龐大的(de)數據,需要什麽樣的(de)“特殊工具”進行處理(lǐ)呢(ne)?沒錯,就是雲計算

什麽是“雲計算”?

雲計算是一(yī)種按使用量付費的(de)模式,這種模式提供可(kě)用的(de)、便捷的(de)、按需的(de)網絡訪問, 進入可(kě)配置的(de)計算資源共享池(資源包括網絡,服務器,存儲,應用軟件,服務),這些資源能夠被快速提供,隻需投入很少的(de)管理(lǐ)工作,或與服務供應商進行很少的(de)交互。通常涉及通過互聯網來提供動态易擴展且經常是虛拟化的(de)資源。




用通俗的(de)話說,雲計算就是通過大量在雲端的(de)計算資源進行計算。如(rú):用戶通過自(zì)己的(de)電腦發送指令給提供雲計算的(de)服務商,通過服務商提供的(de)大量服務器進行“核爆炸”的(de)計算,再将結果返回給用戶。

因此,雲計算甚至可(kě)以讓你體驗每秒10萬億次的(de)運算能力,也隻有這麽強大的(de)計算能力才可(kě)以對大數據進行處理(lǐ)。

什麽是“人工智能”?

人工智能(Artificial Intelligence),英文縮寫為(wèi)AI。它是研究、開發用于模拟、延伸和(hé)擴展人的(de)智能的(de)理(lǐ)論、方法、技術及應用系統的(de)一(yī)門新的(de)技術科學(xué)。人工智能其實就是大數據、雲計算的(de)一(yī)個應用場景。




人工智能不同于傳統的(de)機器人,傳統機器人隻是代替人類做(zuò)一(yī)些已經輸入好的(de)指令工作,而人工智能則包含了機器學(xué)習,從被動到主動,從模式化實行指令,到自(zì)主判斷根據情況實行不同的(de)指令,這就是區别。

總之,雲計算是大數據的(de)底層架構,大數據依賴雲計算來處理(lǐ)大數據,人工智能是大數據的(de)場景應用。三者直接建立起一(yī)個體系,所以當雲計算、大數據、人工智能這樣整合起來,便完成了相遇、相識、相知的(de)過程。

技術的(de)改變以及用戶服務要求的(de)變化推動着圖書館服務的(de)變遷,大數據時代的(de)圖書館服務不管是服務的(de)方式、途徑、模式等也都将發生改變,由于圖書館的(de)服務策略是經過大量數據捕獲、組織、分析和(hé)決策而得來的(de),因此使得圖書館服務變得更具有針對性,服務手段、方式等也會随着圖書館服務策略的(de)調整而調整。

可(kě)以預見的(de)是,在調整文獻服務、信息咨詢、學(xué)科服務等這些圖書館必備的(de)服務策略同時,以信息的(de)處理(lǐ)與服務為(wèi)優勢的(de)圖書館的(de)服務範圍及領域将會得到更大的(de)擴展,為(wèi)社會機構如(rú)政府、企業做(zuò)一(yī)定的(de)數據分析服務、數據挖掘服務将會成為(wèi)大數據圖書館的(de)常态服務內(nèi)容。


來源:圖情軒(id:library-information)


轉載自(zì)@愛上圖書館