中文久久久字幕|亚洲精品成人 在线|视频精品5区|韩国国产一区

歡迎來到優(yōu)發(fā)表網(wǎng)!

購物車(0)

期刊大全 雜志訂閱 SCI期刊 期刊投稿 出版社 公文范文 精品范文

新技術(shù)下地質(zhì)文獻(xiàn)資料工作分析

時(shí)間:2022-06-28 06:21:19

序論:在您撰寫新技術(shù)下地質(zhì)文獻(xiàn)資料工作分析時(shí),參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。

新技術(shù)下地質(zhì)文獻(xiàn)資料工作分析

本文將綜合探討全國地質(zhì)資料館地質(zhì)文獻(xiàn)資料的開發(fā)利用情況及服務(wù)模式,從國外地質(zhì)文獻(xiàn)資料服務(wù)現(xiàn)狀、全國館地質(zhì)文獻(xiàn)資料服務(wù)存在的問題及文獻(xiàn)領(lǐng)域新技術(shù)應(yīng)用幾個(gè)層面進(jìn)行分析與研究,以期對整個(gè)行業(yè)內(nèi)的文獻(xiàn)服務(wù)起到一定的參考與指導(dǎo)作用。當(dāng)今在互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)的迅猛發(fā)展和帶動作用下,國內(nèi)外科技期刊出版領(lǐng)域在生產(chǎn)方式、傳播方法、內(nèi)容服務(wù)模式等方面都發(fā)生了巨大變化[1]。地質(zhì)文獻(xiàn)資料作為全國地質(zhì)資料館館藏?cái)?shù)據(jù)資源的重要組成部分,是科技情報(bào)工作的基礎(chǔ),而海量文獻(xiàn)數(shù)據(jù)資源如何向用戶提供服務(wù)是數(shù)據(jù)管理者面臨的一項(xiàng)重要工作任務(wù)。全國地質(zhì)資料館是中國最大最權(quán)威的地質(zhì)資料館藏機(jī)構(gòu),近幾年來,全國館每年新進(jìn)館5000余檔、約30萬件地質(zhì)資料[2-3],年度增長數(shù)據(jù)量超過40TB。其中,館藏機(jī)構(gòu)中的地質(zhì)調(diào)查成果報(bào)告承載的信息量占絕對優(yōu)勢,每年接收的地質(zhì)調(diào)查成果資料涉及專業(yè)涵蓋地質(zhì)、煤炭、冶金、有色、化工、建材、石油、核工業(yè)、環(huán)境等,且資料中的文件類別多樣化,包括附圖、附表、附件、多媒體、數(shù)據(jù)庫、軟件、正文報(bào)告等。地質(zhì)調(diào)查成果資料大多是基礎(chǔ)性的野外或?qū)嵉卣{(diào)查工作,主體內(nèi)容是對地球信息的客觀記錄,不僅可以為地球的科學(xué)研究及找礦勘查工作提供第一手資料,還可以服務(wù)于經(jīng)濟(jì)、社會、政治、環(huán)境等各方面,如鐵路、公路、水庫、壩基、電廠等重大基礎(chǔ)設(shè)施工程建設(shè)中,都需查明工程地質(zhì)、水文地質(zhì)、環(huán)境地質(zhì)、地質(zhì)災(zāi)害以及區(qū)域地質(zhì)工作、礦產(chǎn)資源分布等情況,而地質(zhì)資料為以上工程建設(shè)提供了重要依據(jù)[4]。因此,地質(zhì)調(diào)查成果資料是影響面極寬、開發(fā)利用潛力極大的文獻(xiàn)數(shù)據(jù)資源。

1國外地質(zhì)文獻(xiàn)資料服務(wù)現(xiàn)狀

1.1美國地質(zhì)調(diào)查局

美國地質(zhì)調(diào)查局(USGS)建立了科技報(bào)告文獻(xiàn)數(shù)據(jù)庫(publicationwarehouse),涵蓋USGS科學(xué)家過去100多年中撰寫的超過150000種出版物文本,包括為公眾撰寫的科普產(chǎn)品、期刊文章、系列報(bào)告、書籍章節(jié)等,并按著作年份(1855~2019年)、學(xué)科(水文、地質(zhì)災(zāi)害、生物生態(tài)系統(tǒng)、礦產(chǎn)、地質(zhì)、環(huán)境與健康等)以及產(chǎn)品類型(基礎(chǔ)地質(zhì)報(bào)告、期刊論文、圖書、會議論文、數(shù)據(jù)庫、學(xué)位論文、小冊子、講座等)構(gòu)建成不同類別的出版物系列產(chǎn)品,方便用戶檢索與查詢,且很大一部分提供免費(fèi)下載服務(wù),并在不斷地更新中,時(shí)效性較強(qiáng),能夠?qū)⒆钚碌牡刭|(zhì)調(diào)查和科研成果及時(shí)向社會開放共享。同時(shí),多種系列出版物產(chǎn)品表明USGS對文獻(xiàn)進(jìn)行了有效的匯總、分類、篩選等處理工作,從而有利于用戶在不同文獻(xiàn)庫中查詢所需的資料。USGS的每一篇報(bào)告或論文的在線表達(dá)方式豐富,不僅包括基本的元數(shù)據(jù)信息,如標(biāo)題、作者、關(guān)鍵詞、摘要、正文目錄等,還在標(biāo)題、作者及報(bào)告的重要位置鏈接有DOI(數(shù)字對象唯一標(biāo)識符)、作者ID(ORCiD,作者身份唯一識別符,可以獲取作者的身份信息、聯(lián)系方式及出版成果信息等詳細(xì)資料)及其他輔助關(guān)聯(lián)信息,在每一篇報(bào)告鏈接網(wǎng)頁最下部還有元數(shù)據(jù)信息表,幫助用戶掌握所需報(bào)告的其他詳細(xì)信息。

1.2英國地質(zhì)調(diào)查局

英國地質(zhì)調(diào)查局(BritishGeologicalSurvey,BGS)出版物數(shù)據(jù)產(chǎn)品包括從1832年到現(xiàn)在的大部分已發(fā)表作品,還包括回憶錄和報(bào)告。出版物中包括的產(chǎn)品有出版物查看器、Earthwise數(shù)字出版、地圖門戶、圖書館目錄、NERC開放研究檔案(NORA)等。出版物查看器中的資源包括自1835年到現(xiàn)在的出版物,可以免費(fèi)查看正式的BGS印刷出版物和最近的研究報(bào)告/開放報(bào)告出版物系列。出版物劃分系列非常精細(xì),約有170個(gè)系列產(chǎn)品,如年報(bào)系列、公報(bào)系列、地質(zhì)報(bào)告系列、回憶錄系列、專題報(bào)告系列以及非系列出版物等。BGS提供大量開放成果地質(zhì)資料的免費(fèi)下載服務(wù)(包括NERC開放研究檔案)及網(wǎng)上商店中所有資料印刷版本的購買服務(wù)等。每一篇報(bào)告的線上表達(dá)方式結(jié)構(gòu)化較強(qiáng),網(wǎng)頁上有部分版塊展示了出版物的作者信息、元數(shù)據(jù)信息和摘要信息等,部分版塊公開了出版物的在線下載、引用以及在其他文獻(xiàn)或社交網(wǎng)絡(luò)平臺分享傳播情況的統(tǒng)計(jì)數(shù)據(jù)等。Earthwise是BGS的數(shù)字出版頻道,其目標(biāo)是傳播BGS的研究成果,促進(jìn)地質(zhì)界更廣泛地進(jìn)行自由交換信息,具體表現(xiàn):在出版物、地圖、模型和數(shù)據(jù)之間建立更強(qiáng)大的語義和空間聯(lián)系;靈活應(yīng)對利益相關(guān)者的各種需求,新的文化趨勢和出版領(lǐng)域的新技術(shù);鼓勵(lì)更多社區(qū)反饋和對BGS出版物的貢獻(xiàn);允許輕松詳細(xì)、豐富的Web內(nèi)容;為協(xié)助項(xiàng)目提供平臺;提供免費(fèi)服務(wù)以共享信息。通過分析研究,Earthwise采用了文獻(xiàn)結(jié)構(gòu)化處理技術(shù),將每一篇報(bào)告或論文進(jìn)行碎片化處理,按類別或主題、子類別進(jìn)行分組(如分成前言、摘要、簡介、方法、結(jié)果、討論、結(jié)論、附錄1~5等12個(gè)子類別),其中包含構(gòu)成主題的各個(gè)頁面的列表。在每個(gè)類別頁面上,用戶可以選擇閱讀頁面、評論頁面或撰寫自己的文字。BGS在地球科學(xué)數(shù)字出版領(lǐng)域走在世界前端,Earthwise通過利用數(shù)字出版技術(shù)傳播高質(zhì)量BGS科學(xué)并與更多的地球科學(xué)家合作,促進(jìn)地球科學(xué)信息交流,同時(shí)滿足不同層次用戶對知識資源的不同需求。

1.3加拿大地質(zhì)調(diào)查局

加拿大地質(zhì)調(diào)查局(TheGeologicalSurveyofCanada,GSC)設(shè)計(jì)了“出版物和報(bào)告(publicationsandreports)”網(wǎng)站欄目,提供廣泛的地球科學(xué)類出版物和報(bào)告,且進(jìn)行了分類,劃分為幾個(gè)大的專題出版物數(shù)據(jù)庫,如加拿大自然資源、地球科學(xué)、能源、森林、礦物、金屬和采礦。其中地球科學(xué)專題數(shù)據(jù)庫為GEOSCAN數(shù)據(jù)庫,包含加拿大地質(zhì)調(diào)查局、加拿大遙感中心以及部門科學(xué)家和專家撰寫的外部出版物的書目數(shù)據(jù)庫,涵蓋內(nèi)容豐富,既包括大型會議報(bào)告的信息免費(fèi)下載服務(wù),又包括大量基礎(chǔ)調(diào)查報(bào)告、科學(xué)論文等出版物的免費(fèi)下載服務(wù)。通過分析研究GEOSCAN數(shù)據(jù)庫中的論文和報(bào)告,每一篇論文和報(bào)告都具有豐富的元數(shù)據(jù)信息,如作者、標(biāo)題、完成時(shí)間、DOI、出版物系列、出版者、語言、媒介、文件格式、區(qū)域、位置、經(jīng)緯度坐標(biāo)、主題標(biāo)簽、插圖信息、項(xiàng)目、摘要、簡介、時(shí)間、GEOSCAN唯一標(biāo)識符等近20項(xiàng)數(shù)據(jù),使用戶獲取文獻(xiàn)資源的更多詳細(xì)信息,豐富的元數(shù)據(jù)信息可以幫助用戶快速發(fā)現(xiàn)文獻(xiàn)的價(jià)值。此外,與紙質(zhì)書籍和純粹PDF文件對比,GEOSCAN數(shù)據(jù)庫中每一篇文獻(xiàn)的表達(dá)方式形式多樣,可以瀏覽和下載各種電子格式的文件,如JPG、PDF、DOC、XML、HTML、XLS、RTF、KML地理信息文件等,使用戶獲取更多增值知識服務(wù)。

1.4澳大利亞地球科學(xué)局

澳大利亞地球科學(xué)局(GeoscienceAustralia,GA)通過數(shù)據(jù)和出版物(dataandpublicationssearch)搜索服務(wù)平臺自1951年至今的31373件產(chǎn)品,且在不斷更新。產(chǎn)品類型主要包括應(yīng)用程序、收集工具、數(shù)據(jù)庫、文檔、模型、非地理數(shù)據(jù)庫、軟件等,文件格式達(dá)10幾種,如DAT、ECW、GeoPDF、HTML、PDF、TIF、NETCDF、KML、JPG、NETCDF、SHP、MISC、WCS、WMS、ZIPPEDERS等。數(shù)據(jù)和出版物中的產(chǎn)品按照產(chǎn)品類型、時(shí)間、文件類型、更新頻率、狀態(tài)、服務(wù)類型、比例尺等進(jìn)行了有效分類,將數(shù)據(jù)資源進(jìn)行詳細(xì)分類可以使用戶縮小搜索范圍,快速獲取自己所需的數(shù)據(jù)資源。每一個(gè)數(shù)據(jù)產(chǎn)品幾乎都有簡介、摘要、主題標(biāo)簽、元數(shù)據(jù)等信息,提供多個(gè)文件格式的下載服務(wù),且與多個(gè)社交平臺關(guān)聯(lián),可以向其他網(wǎng)絡(luò)平臺進(jìn)行資源共享。GA維護(hù)著許多在線工具,用以促進(jìn)數(shù)據(jù)的發(fā)現(xiàn)和傳遞。此外,GA與美國地球科學(xué)研究所合作,建立了AusGeoRef文獻(xiàn)數(shù)據(jù)庫,數(shù)據(jù)庫每周進(jìn)行更新,提供的參考文獻(xiàn)來自期刊論文、會議論文、摘要、書籍、報(bào)告和地圖等。AusGeoRef提供出版物的全文搜索,用戶不僅可以搜索文獻(xiàn)的元數(shù)據(jù)信息(如標(biāo)題、作者、注釋等),還可以搜索數(shù)據(jù)庫中出版物的整個(gè)文本,以便查找所需信息,并與具有地理坐標(biāo)等信息的出版物進(jìn)行交互式地理搜索。AusGeoRef還提供了廣泛的用戶功能,如可以導(dǎo)出引文,創(chuàng)建用戶賬戶以保存查詢、引用和創(chuàng)建策劃列表,向數(shù)據(jù)庫中添加注釋、自定義標(biāo)記等。AusGeoRef的建立旨在面臨地球科學(xué)和社會交叉的問題時(shí)幫助決策者提高地質(zhì)調(diào)查出版物的可發(fā)現(xiàn)性和使用率。這幾個(gè)國家在文獻(xiàn)資料服務(wù)方面均展現(xiàn)出多元、開放、合作的特點(diǎn),主要體現(xiàn)在:①開放程度高,大量數(shù)據(jù)可下載使用;②數(shù)據(jù)服務(wù)產(chǎn)品多元化,包含基礎(chǔ)地圖、地形圖、交互式地圖、3D模型、報(bào)告、文檔等;③數(shù)據(jù)格式多樣,如GeoPDF、XML、WMS等;④鏈接作者ID,提供作者相關(guān)信息及其他詳細(xì)成果資料,幫助用戶獲取大量信息,且方便用戶及時(shí)與作者進(jìn)行溝通;⑤數(shù)據(jù)庫定期更新,及時(shí)向社會提供服務(wù);⑥利用數(shù)據(jù)庫、主題標(biāo)引等技術(shù)用以增強(qiáng)數(shù)據(jù)資源的可發(fā)現(xiàn)性;⑦與其他國家研究機(jī)構(gòu)相互合作,協(xié)同整合、開放和共享大量數(shù)據(jù)資源。但是,相比現(xiàn)在的大數(shù)據(jù)、語義網(wǎng)與關(guān)聯(lián)數(shù)據(jù)、云計(jì)算、人工智能等計(jì)算機(jī)技術(shù)的快速發(fā)展,國外地質(zhì)調(diào)查機(jī)構(gòu)對于地質(zhì)調(diào)查成果資料的開發(fā)和利用還有很大的升級空間。

2我國地質(zhì)文獻(xiàn)資料發(fā)展存在的問題

2.1館藏文獻(xiàn)量大,開放程度較低

全國地質(zhì)資料館是中國館藏地質(zhì)資料數(shù)量最多、內(nèi)容最全的國家級館藏機(jī)構(gòu),收藏有我國自19世紀(jì)末以來形成的各類地質(zhì)資料,以區(qū)域地質(zhì)調(diào)查資料、礦產(chǎn)勘查資料、水工環(huán)調(diào)查資料、物化遙勘查資料、地質(zhì)科學(xué)研究資料為主[5]。近幾年來,館藏?cái)?shù)據(jù)總量更是呈“井噴式”增長,每3年實(shí)現(xiàn)一次翻番,有效電子文件數(shù)近3億。然而,國內(nèi)的地質(zhì)調(diào)查文獻(xiàn)資源由于受限于涉密等因素[6],服務(wù)的開放程度遠(yuǎn)遠(yuǎn)不夠,這與2018年4月2日國務(wù)院的《科學(xué)數(shù)據(jù)管理辦法》[7]中“開放為常態(tài),不開放為例外”的原則不相符。

2.2文獻(xiàn)服務(wù)方式單一

文獻(xiàn)資源作為館藏地質(zhì)資料的重要組成部分,目前服務(wù)方式主要以到館借閱服務(wù)為主[5,8],還提供電子目錄查詢、部分文獻(xiàn)資源線上閱覽和全文下載服務(wù),但總體服務(wù)方式單一、保守,與當(dāng)今信息技術(shù)發(fā)展嚴(yán)重脫節(jié),一方面導(dǎo)致用戶獲取信息量冗余,增加其閱讀量,嚴(yán)重制約了用戶的工作效率;另一方面也導(dǎo)致不能對館藏中的海量文獻(xiàn)資源進(jìn)行充分的挖掘和利用,大大降低了文獻(xiàn)資源的使用效能。

2.3文獻(xiàn)信息資源流轉(zhuǎn)周期長

由于思維慣性和組織管理問題,目前地質(zhì)資料工作還習(xí)慣性保留著以紙介質(zhì)為主的工作模式和思維方式,地質(zhì)資料在館藏機(jī)構(gòu)流轉(zhuǎn)時(shí)滯大大超過法定的90天,甚至有的地質(zhì)資料成為“死檔”,嚴(yán)重制約了地質(zhì)資料的社會化服務(wù)率和在線服務(wù)率。此外,地質(zhì)調(diào)查文獻(xiàn)資源中蘊(yùn)含的信息繁多,涉及知識面廣泛,包括基礎(chǔ)地質(zhì)情況、礦產(chǎn)資源信息、物化探調(diào)查結(jié)果等,數(shù)據(jù)類型多樣,如正文、圖、表格、公式、參考文獻(xiàn)標(biāo)注等,傳統(tǒng)的傳播方式主要以靜態(tài)的紙質(zhì)資料或單一PDF文件為主,造成用戶面對的是大量的、無序的地質(zhì)信息,不能快速從文獻(xiàn)中獲取所需的資料,查找資料經(jīng)常用去整個(gè)工作周期的一半時(shí)間,大大降低了知識的利用效率。

2.4文獻(xiàn)信息資源加工程度低

館藏文獻(xiàn)承載著不同歷史時(shí)期地質(zhì)工作者的智慧和經(jīng)驗(yàn)。隨著中國地質(zhì)調(diào)查事業(yè)的變革和發(fā)展,不僅館藏文獻(xiàn)資源量逐年增長,地質(zhì)資料文件結(jié)構(gòu)也變得更加復(fù)雜,構(gòu)成一個(gè)多維度形式的信息復(fù)合體,包括相互關(guān)聯(lián)的報(bào)告、文獻(xiàn)、表格、矢量數(shù)據(jù)、圖形等[9]。傳統(tǒng)的文獻(xiàn)目錄、索引、文摘等檢索形式已不能滿足當(dāng)前時(shí)代背景下用戶對知識資源的需求。近年來,隨著計(jì)算機(jī)、數(shù)據(jù)庫、文字識別等信息技術(shù)的廣泛應(yīng)用,大量文獻(xiàn)被轉(zhuǎn)換為文本文件和數(shù)據(jù)庫等電子資源,隨著數(shù)字文獻(xiàn)的大量積累,如何對文獻(xiàn)資源進(jìn)行有效的分類、組織和檢索,成為具有挑戰(zhàn)性的問題。目前通過人工方式對文獻(xiàn)進(jìn)行著錄和主題(標(biāo)題、關(guān)鍵詞)標(biāo)引,以提升文獻(xiàn)檢索的效率,但還不夠完善,不能檢索到全部的相關(guān)文獻(xiàn)資源,而且手工的主題標(biāo)引是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作,單憑手動已經(jīng)難以跟上文獻(xiàn)的更新速度。

3文獻(xiàn)領(lǐng)域新技術(shù)應(yīng)用

地質(zhì)文獻(xiàn)資源資源量巨大和文件結(jié)構(gòu)復(fù)雜,如何從浩如煙海的復(fù)雜文獻(xiàn)資源中發(fā)現(xiàn)有用和有意義的知識,成為地質(zhì)工作者的迫切需求,也是地質(zhì)資料工作者關(guān)注的熱點(diǎn)問題。以網(wǎng)絡(luò)化、數(shù)字化、人工智能化為代表的新技術(shù)為地質(zhì)資料工作提供了良好的機(jī)會。

3.1文獻(xiàn)內(nèi)容結(jié)構(gòu)化

知識服務(wù)已成為當(dāng)今知識經(jīng)濟(jì)時(shí)代的必然需求。由前文可知,很多文獻(xiàn)至今還只向用戶提供靜態(tài)的PDF版本文檔,極大影響了文章的再次使用。目前,數(shù)字出版領(lǐng)域科技論文的主流格式是HTML(超文本標(biāo)記語言)格式[10],此格式的文檔可實(shí)現(xiàn)文獻(xiàn)的結(jié)構(gòu)化、碎片化閱讀,如用戶可以根據(jù)自己的需求選擇感興趣的部分進(jìn)行閱讀;結(jié)構(gòu)化的文獻(xiàn)具有高效的知識組織能力以及良好的擴(kuò)展性,一方面可以實(shí)現(xiàn)全文查詢和檢索,另一方面可以與文獻(xiàn)關(guān)聯(lián),上傳附件材料(supplementalmaterial),附件材料可以是矢量數(shù)據(jù),如短視頻、MapGIS、數(shù)據(jù)表格、矢量PDF等[10]。此外,結(jié)構(gòu)化的文獻(xiàn)是實(shí)現(xiàn)文獻(xiàn)內(nèi)容標(biāo)引、語義關(guān)聯(lián)等應(yīng)用的前提。

3.2文獻(xiàn)內(nèi)容標(biāo)引

隨著用戶對知識元層次數(shù)據(jù)資源的需求,文獻(xiàn)標(biāo)題、作者、摘要等基本信息的著錄表示已經(jīng)無法滿足用戶需求。為了表示不同領(lǐng)域和不同類型的知識,同時(shí)適應(yīng)不同層次和不同需求的用戶,在知識服務(wù)過程中就需要提供不同層次和不同顆粒度的知識[11]。如借助中圖分類法和敘詞表的學(xué)科分類和主題標(biāo)引將文獻(xiàn)資源通過詞語、句子、段落以及文獻(xiàn)等不同層次依次進(jìn)行規(guī)范化表示,實(shí)現(xiàn)文獻(xiàn)深層次的內(nèi)容標(biāo)引。例如,在現(xiàn)有的地質(zhì)資料著錄規(guī)范中,案卷級資料經(jīng)常包括不同類型的文件級資料,每一個(gè)文件對應(yīng)不同大小的知識,且分別包括文件標(biāo)題、名稱、分類號、作者、單位、摘要等信息,但用戶在應(yīng)用過程中可能需要粒度更小的知識表示,這時(shí)可以進(jìn)行知識元層次內(nèi)容的著錄和標(biāo)引,如對區(qū)域地質(zhì)調(diào)查報(bào)告中地層章節(jié)的奧陶系進(jìn)行標(biāo)引:知識編號為0001,知識大類為地層,知識小類為奧陶系,知識類型為文本,知識級別為4等。

3.3語義關(guān)聯(lián)技術(shù)

除了利用文獻(xiàn)著錄和標(biāo)引表示來進(jìn)行知識粒度化外,還有大量的知識需要通過知識表示規(guī)范進(jìn)行知識粒度化[11]。例如,對于“華北奧陶系”體現(xiàn)的知識粒度較大,如果想要了解華北地區(qū)奧陶系的詳細(xì)信息,就需要細(xì)化華北奧陶系在地質(zhì)演化史的地位、分布區(qū)域、巖性、古生物化石、發(fā)育礦產(chǎn)等。對于這些問題的回答就需要借助于語義關(guān)聯(lián)來表示,首先對文獻(xiàn)中的關(guān)鍵數(shù)據(jù)進(jìn)行語義標(biāo)注,有步驟、有目標(biāo)地開展文獻(xiàn)挖掘工作,建立多元、多維的數(shù)據(jù)表達(dá)形式,將有價(jià)值的信息全方位地展現(xiàn)出來,使用戶信息檢索和分析整理資料的過程變得程序化、網(wǎng)絡(luò)化、智能化,幫助用戶快速檢索到所需的信息資源,同時(shí)可獲取其他相關(guān)文獻(xiàn)資源,大大提高用戶獲取知識的效率。針對文本中蘊(yùn)含的語義信息建立索引,建立文本之間的語義關(guān)聯(lián),利用機(jī)器自動推理技術(shù),實(shí)現(xiàn)同義詞檢索、關(guān)聯(lián)檢索等高級檢索功能,通過一個(gè)檢索詞就能將所有相關(guān)的文獻(xiàn)資源都顯示出來,無需多次重復(fù)檢索,同時(shí)可以按照下載率、引用率、完成時(shí)間等方式排序,加快檢索速度的同時(shí),為用戶提供更多資源的可選性。此外,通過關(guān)聯(lián)技術(shù)對網(wǎng)站中不同文獻(xiàn)資源之間進(jìn)行鏈接,能夠?qū)^藏“死檔”資料變“活”,增加其線上曝光率,充分發(fā)揮地質(zhì)資料的利用價(jià)值,進(jìn)而提高館藏機(jī)構(gòu)的社會化服務(wù)效能。目前新技術(shù)已經(jīng)廣泛應(yīng)用于科技期刊出版領(lǐng)域,滲透到數(shù)據(jù)資源的采集、概念識別、組織和利用等各個(gè)環(huán)節(jié)[12-13],如將數(shù)據(jù)資源內(nèi)容進(jìn)行加工處理,實(shí)現(xiàn)結(jié)構(gòu)化轉(zhuǎn)變;對數(shù)據(jù)資源進(jìn)行語義標(biāo)注,提取內(nèi)容中的專業(yè)術(shù)語、技術(shù)方法、圖、表、研究結(jié)果等;借助語義技術(shù)將數(shù)據(jù)資源在深層次上實(shí)現(xiàn)語義和概念層面的互聯(lián);使用語義出版技術(shù)實(shí)現(xiàn)用戶之間的交流、尋求交流對象、建立合作關(guān)系等。新技術(shù)不僅可以改進(jìn)用戶獲取文獻(xiàn)資源的體驗(yàn)方式,還能夠在數(shù)字化基礎(chǔ)上進(jìn)一步提升用戶利用地質(zhì)文獻(xiàn)資料的功能和效率。

4結(jié)語

當(dāng)今在互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)的迅猛發(fā)展和帶動下,國內(nèi)外科技期刊出版領(lǐng)域在生產(chǎn)方式、傳播方法、內(nèi)容服務(wù)模式等方面都發(fā)生了巨大變化。全國地質(zhì)資料館作為政府部門、企業(yè)、科研機(jī)構(gòu)及高等院校等的數(shù)據(jù)資源提供者,更需要緊跟時(shí)代的發(fā)展,不斷加快數(shù)據(jù)資源整合、傳播與服務(wù)進(jìn)程。館藏機(jī)構(gòu)以信息技術(shù)為依托,加強(qiáng)文獻(xiàn)數(shù)據(jù)資源的增值服務(wù),構(gòu)建智能化的數(shù)據(jù)服務(wù)模式,是促進(jìn)知識發(fā)現(xiàn)與創(chuàng)新、滿足用戶需求、提升服務(wù)效能的關(guān)鍵。綜合利用數(shù)字出版技術(shù)將復(fù)雜的館藏文獻(xiàn)資源進(jìn)行數(shù)據(jù)化、碎片化、結(jié)構(gòu)化,能夠系統(tǒng)完整地反映地質(zhì)調(diào)查成果概貌,拓展地質(zhì)資料服務(wù)價(jià)值鏈,提高館藏資料的創(chuàng)新服務(wù)水平,還可以幫助用戶快速獲取目標(biāo)知識服務(wù),充分提高用戶的工作效率。因此,利用新技術(shù)重新構(gòu)建地質(zhì)文獻(xiàn)資料的服務(wù)模式,實(shí)現(xiàn)資源共享更加多元化的表達(dá)方式變得極為必要。

作者:孟潔 賈麗瓊 李曉蕾 吳軒 李晨陽 單位:中國地質(zhì)調(diào)查局發(fā)展研究中心;中國地質(zhì)大學(xué);全國地質(zhì)資料館