小编: [目的/意义]传统文献信息经历了从文本化、数字化到网络化的演变过程,目前正在向数据化、智慧化迈进,在此过程中文献信息的价值也产生了延展与升华。对文献信息价值的重构一方
中国特色社会主义进入新时代,新技术的快速发展使得信息传播的方式日新月异,精准化的信息服务不断改变着人类的生产和生活方式,与此同时,它也将社会的发展推向技术驱动的快车道。文献作为当今社会人们获取知识的重要途径,它是人类社会文明进步的产物,而文献信息是文献的核心内容。作为图书馆学、情报学、文献学等学科重要的研究对象,文献信息担负着记载和传承文献中知识的重要使命,长期以来,对文献信息的研究一直是学界的热点话题。新时代在技术驱动下,使用传统文献信息的记载方式已经不能满足人们快速获取和筛选有效价值信息的需求,文献信息价值一般是指文献信息能够满足社会和人主体需要的属性[1],文献信息数字化、数据化的逐渐兴起,使文献信息在原有价值的基础上,延展并升华出了智慧向善、服务用户的理论与应用价值特征,因此对文献信息价值的重构不但是图书馆学、情报学、文献学等学科发展的需要,还是新时代满足用户日益增长的精神文化需求的需要,它是顺势而为的演化进程。
1文献信息理论及价值研究综述
1984年9月邓小平同志给新华社《经济参考报》题词“开发信息资源,服务四化建设”是我国各类信息资源开发利用新的里程碑,而文献信息资源是信息资源的重要组成部分。在此之后,我国著名学者黄宗忠提出了文献信息学基础理论,随后很多学者基于该理论对文献信息的价值进行阐释。对国内外相关文献研究发现,国外对图书馆学、情报学的研究文献较多,但对文献信息及其价值相关研究较少,经过梳理对文献信息的相关研究主要经历了以下三个阶段:
第一阶段,基础理论及价值形成阶段(2004年之前)。黄宗忠[1]提出文献信息学的基础理论并认为文献信息是推动社会发展的生产力,在此后的十多年间,文献信息学经历了一个快速发展的阶段,文献信息及其价值一直被学者关注,于鸣镝[2]把文献信息物化成物质文明的思想。钱万里等[3]从形成原理和特征角度全面论述文献信息价值。潘玉田[4]从方法论角度论述了文献信息的科学认识方法及文献信息价值内涵。赵文广[5]从分析文献信息的价值内涵入手,论述了文献信息扩散在知识生产、传播、资源配置中的重要作用。刘宗朝[6]述评了文献信息功能特点及其利用价值。马丽明[7]从网络化的资源共享角度提出文献信息价值和使用价值。孟智明[8]从使用价值和开发价值论述了文献信息的价值。在该阶段学者主要从传统文献信息的科学价值、信息价值、经济价值、开发价值、使用价值等方面进行阐述,综述发现,在此阶段已经有学者逐渐从文献信息网络化、数字化的角度来挖掘其价值。
第二阶段,数字化阶段(2005—2014年)。2004年12月,中共中央办公厅、国务院办公厅联合发布的《关于加强信息资源开发利用工作的若干意见》(中办发[2004]34号)是我国信息资源开发与利用的指导性文件,对促进信息资源开发利用起到重要作用。自2005年起对文献信息资源的研究逐步开始向数字化转变,大量成果不断涌现,纪照霞[9]提出要充分借助数字图书馆,让西部古典文献体现出应有的文化价值。程卫军[10]从文献信息资源数字化过程中信息的完整性和规范化角度阐述其利用价值。赵晔[11]以陕西省文献信息资源数字化共享建设的情况为例,充分阐释了数字化文献信息的应用价值。赵丹阳[12]认为对数字环境下科技文献信息开发利用的研究能够充分揭示科技文献信息内容与价值,促进多种科技文献的集成共享与价值实现。宋琳琳等[13]认为要真正深化文献信息资源聚合的层次,必须从数字资源的加工和组织着手,细化其描述粒度,才能更好发挥数字资源的价值。在该阶段学者主要从数字化文献信息资源所释放出的文化价值、信息价值、使用价值等方面进行阐述。
第三阶段,智能化阶段(2015年—至今)。随着中国特色社会主义进入了新时代,人民对美好生活需要逐渐提升,在5G、大数据、人工智能等新技术驱动下,对文献信息的开发与利用从数字化、网络化、数据化向智能化快速跃升,进入了一个全新的时期,以文献信息为基础的开放知识服务产生了巨大变革,实现了从以人为中心向以机器智能为中心转变,从信息检索向认知搜索转变,从知识发现向知识计算转变,从点对点的线性服务向智慧化服务转变,由人工智能和大数据相结合所提供的智慧服务将给社会发展和人类生活带来翻天覆地的变化。近年来国内外学者从不同层面对文献信息价值提出了新观点:文献大数据层面:如张玲[14],毛雅君[15],温有奎等[16]从文献信息大数据智能挖掘和知识服务的角度进行研究。文献元数据层面:如毛玉琪[17],马袁燕[18],丁遒劲等[19]认为从海量文献元数据视角开展知识发现服务可以全面释放文献资源价值。数字人文层面:如A.Burdick等[20],D.M.Berry等[21]认为数字人文可以促进信息资源的深度挖掘,进而形成各类智慧应用,以实现挖掘出信息资源的隐含价值。国内学者王晓光[22],刘炜等[23]将数字人文作为研究文献信息的理论思维,来挖掘并释放其潜在的价值。文献研究发现,国内外专家学者从不同程度上都提及了在技术驱动下海量文献信息所产生的价值,文献信息在原有价值的基础上所延展并升华出新的价值内涵更符合新时代特征,这必将受到学界的广泛关注。
基于对文献信息价值演进阶段的综述,文章提出通过建立文献信息生态圈,重点从文献信息在不同对象间转化过程中所延展出的人工智能技术理论及文献信息在开发利用过程中所升华出的智慧化服务场景角度,对文献信息理论价值和应用价值进行重构。
2文献信息生态圈
文章在知识螺旋[24]、信息链[25]、信息生态[26]等理论的基础上,结合新时代人们对美好生活日益增长的需要构建了文献信息生态圈,文献信息生态圈是重构文献信息价值理论价值和应用价值的源动力。文献信息生态圈由外部生态和内部生态构成,它包含了信息人、信息、信息环境等信息生态圈中基本的组成要素[27]。外部生态是将文献信息层、人工智能技术层、智慧服务层及用户等视作一个整体生态环境,该生态环境中维持着一种供需结构合理、运行高效的协调统一状态[28],其中用户是推动各层运转的关键元素,他具有多重角色,即是文献信息的产生者、传递者,又是服务与被服务对象,用户需求不但是推动对文献信息的开发与利用的外部因素,还是推进技术发展的内在动力。内部生态主要由文献信息层中各对象构成,随着内部生态中各对象的逐渐演变、进化带动了外部生态的变化,这使文献信息生态圈在不断调整运转中保持平衡状态。具体关系如图1所示。 图1文献信息生态圈 下载原图
文献信息层不但构成了文献信息生态圈中的内部生态,还是文献信息生态圈的重要支撑,在各对象相互转换过程中起到了粘合剂和催化剂的作用。文献和文献信息是该层的两个重要对象,它们是同一事物的两个方面[29]。数字化的文献通过技术手段提取核心内容成为文献信息,文献信息经过预处理后成为待分析数据素材,利用人工智能技术对数据进行深层次挖掘而获取知识,而知识向智慧转化是一个复杂的学习过程,正是因为海量数字化的文献信息出现后为人工智能技术提供了大量的样本学习数据,在知识基础上反复学习产生了智慧。所产生的智慧是隐性知识的体现,而文献是显性知识,基于知识螺旋理论[24],文献(显性知识)和智慧(隐性知识)是不断相互转化的过程,智慧(隐性知识)经过知识凝练进化后形成文献(显性知识),而智慧到文献的螺旋上升就是低层隐性知识向高层显性知识凝练与进化的过程,此过程周而复始运转构成了文献信息生态圈中的内部生态。
人工智能技术层是连接文献信息生态圈内外的重要纽带,对于保持生态圈平衡发挥着重要驱动作用。我们应该重视人工智能技术处理海量文献信息所形成的理论价值,近年来以数据分析和计算思维为引导的方法理论逐渐与传统人文社会科学结合,很多文献研究者在内容分析法的基础上提出了基于人工智能技术的文本计算方法及理论,人工智能技术以计算机科学为基础,由机器学习、知识图谱、计算机视觉、自然语言处理等前沿技术组成,技术间的交叉与融合,贯穿了对文献信息抽取、挖掘、学习、感知与表达的全过程[30],进而实现了技术驱动下从文献信息到智慧的生态进化过程,智慧到文献的进化同时也促进了技术的不断进步。
智慧服务层是文献信息生态圈重要的应用价值输出,为用户提供便捷高效的智慧化文献信息服务。进入新时代,用户对美好生活的需要日益增长,智慧服务的出现不但能提升用户在获取知识时的体验,还能有效提升用户工作学习的效率。利用人工智能技术对文献信息内容分析并挖掘后,基于智慧向善的理念催生了智慧推荐、智能编目、智能修复、智能问答、远距离阅读、可视化阅读等应用场景,智慧服务是文献信息、人工智能技术、各类用户共同作用下的产物,在智慧到文献进化过程中智慧服务也不断在升华。
文献信息生态圈的平衡发展进一步促进了对文献信息价值的重构。在文献信息生态圈中,内部生态和外部生态通过文献信息层中各对象紧密相连且相互作用,这是文献信息价值重构的动因,内部生态的流动不断带动外部生态的运转,外部生态的运转反向促进内部生态的流动。内部生态中不同对象间的转化、演进、凝练、进化是在技术驱动和用户不断提升的服务需求下社会发展的必然趋势;外部生态中文献信息层、人工智能技术层、智慧服务层与用户需求之间存在着较为复杂的辩证关系,人工智能技术层中每一种人工智能技术处理海量文献信息所延展的理论方法,智慧服务层为用户提供的每项智慧化服务应用场景,都是重构文献信息理论价值和应用价值的重要因素。
3理论价值的延展——人工智能技术驱动
技术驱动的核心理念是指技术的发展推动社会进步,社会进步同时引发技术变革。人工智能技术在人类社会很多领域都得到了广泛应用,而人工智能对文献信息的影响应重点关注利用人工智能技术解决文献信息数据量巨大、存储载体多样、部分信息不完整等问题所延展出的理论价值[31]。目前机器学习、知识图谱、自然语言处理、计算机视觉等是人工智能领域主要核心技术,在技术驱动下,对文献信息的开发与利用进入了自动化时代,这得益于文献信息由数字化到数据化的转变过程,长期积累后海量文献信息逐渐形成,为技术提供了学习数据,人工智能技术在不同程度上作用于各种类型的文献信息,使得文献信息理论价值在文献信息到智慧到文献进化的过程中技术与方法得以延展。
3.1机器学习
机器学习是人工智能领域中核心方法之一,它是各类文献数据加工与处理的基础算法,可以应用于各种基于智能关联的文献信息服务。机器学习算法建立在统计学理论基础之上,让机器模拟人类来进行自我学习并从海量文献信息中获得规律,深度挖掘可能被人类忽略的文献中所蕴含的知识。目前基于神经网络的机器学习已经广泛应用,正是由于神经网络具有多神经元、分布式计算性能、多层深度反馈调整等优势,才使机器学习具备了处理海量文献信息的可能性,并进一步形成了基于机器学习的文献信息技术理论与方法。
3.2知识图谱
知识图谱作为人工智能领域知识工程的关键技术,在聚合信息、知识表达、自动推理方面有着独特的优势,它能从文本数据中识别、发现和推断事物之间的复杂关系并构建文献信息中的知识体系[32]。知识图谱在对各类文献信息进行聚集、融合和组织,形成有逻辑关联、对智慧服务有意义的知识结构体方面发挥重要作用。它不但能建立起文献信息中知识对象间的关联关系,还能对知识对象间进行逻辑推理。目前语义知识图谱(即关联数据技术)在图情界研究较多[33],在利用它处理文献信息的过程中,逐渐形成具有重要价值的技术理论体系。
3.3自然语言处理
自然语言处理将人类语言转化为计算机可识别的语言,并能够实现人机之间用自然语言进行通信的技术,它是让计算机形成能够模拟人脑结构的人工神经网络,通过加工处理符号信息来实现语义的理解转换[34]。自然语言处理延展了对文本和音频文献信息的识别、加工与处理的技术理论与方法,通过海量文献信息资源所形成的语言知识库是自然语言处理的基础,大规模文献信息知识库形成后,不但可以促进特色音频文献信息的保护与利用,还可以提升机器翻译及问答系统的精准性。
3.4计算机视觉
计算机视觉是文献信息感知与表达的过程,让机器拥有对海量文献信息提取、理解和分析图像的能力。视觉识别是计算机视觉的关键技术,神经网络的兴起极大推动了计算机视觉的发展,并使其准确率大大提升[35]。计算机视觉在对图像和视频文献信息的识别、跟踪、测量及处理的过程体现了重要的优势,它逐渐延展了对这些类型文献信息研究的技术理论与方法。计算机视觉技术不但可以对文献信息中缺失的文字、图片部分进行智能化的完善与修补,还可以把文献信息中的文本数据提取加工形成图形化、视频化的应用场景。
4应用价值的升华——智慧向善服务场景
“智慧向善、服务用户”的核心理念,从技术角度来看,在服务中使用向善的智能技术;从人本角度来看,通过智能技术更好地服务用户[36]。在文献信息生态圈的平衡发展过程中,智慧服务是文献信息生态圈的重要价值输出,人工智能技术驱动下所形成的应用场景真正服务于用户需求,这也是外部生态中用户需求推动的结果,随着用户需求的不断提升,智慧服务应用场景也不是一成不变的,智能推荐、智能编目、智能问答、智能修复、远距离阅读、可视化阅读等应用场景是逐级递进的过程,文献信息内部生态各对象的进化带动智慧向善服务场景的升级,使文献信息的应用价值不断升华[37]。
4.1智能推荐
智能推荐利用机器学习、知识图谱、自然语言处理等技术,将多种形式的文献信息资源关联并整合,通过海量文献信息分析读者阅读和活动行为,进行内容和服务的推荐,以期最大限度发挥文献信息的应用价值[38](见图2)。随着海量文献信息资源库的逐渐完善,数字化的文献信息与用户行为特征相结合后形成了个性化推荐及精准化的服务内容,由此传统推荐服务得到升级,在保证资源均等化分配的同时,信息推荐像大脑一样具有智慧,文献信息生态圈内部生态各对象的进化,用户智慧化的感知与需求逐步提升,进而带动智能推荐服务不断升华。 图2智能推荐系统流图 下载原图
4.2智能编目
智能编目是利用机器学习、知识图谱、自然语言处理等技术,使机器学习特定的规则,智能化地对文献进行著录的一种应用场景(见图3)。传统的编目过于依赖题名、关键词、摘要等元信息,这些信息并不能完全体现出文献间的差异,而文献内容信息是体现文献细微差别的重要切入点,通过机器学习算法对海量文献信息进行学习,再结合自然语言处理中对语义信息的识别,把文献信息以知识图谱的形式关联并进行呈现,随着文献信息中训练数据集不断增加,其准确度和细分程度不断提升,进而使智能编目服务不断升华。 图3智能编目系统流图 下载原图
4.3智能修复
智能修复是利用机器学习、自然语言处理、计算机视觉等技术,对文献中缺失部分进行智能化修补及复原的过程(见图4)。长期以来对损坏的文献进行修复是文献资料保护工程中的一项重要工作[39]。文献资源在数字化保存管理过程中通常采取图片形式存储,通过对海量图片文献信息的视觉识别,并进行语义知识转换,利用机器学习算法智能匹配文献信息中缺失部分,进而形成了智能修复应用场景。智能修复不能替代传统的文献修复工作,但它是此项工作的一个升华过程,既能为文献修复人员提供参照,又能使修复工作更加科学化精准化。智能修复不仅使文献信息甚至文献遗产以数字修复的形式被保存,还能使这些文献以多元化的形态发挥重要价值。 图4智能修复系统流图 下载原图
4.4智能问答
智能问答是一种以自然语言和用户进行自由问答交流的系统,系统结合自然语言处理技术,通过对问题的理解,检索到答案并答复的智能模式(见图5)。它从文献信息中抽取出知识,对用户自然语言问句进行深度语义理解,经过匹配和推理返回准确的答案[40],在用户规律性提问交互的情景下能比较显著地提升交互效率。智能问答是用户获取文献信息和知识的新入口,能为用户和文献信息服务机构提供智慧化交互渠道,它有助于提升咨询服务的效率,减少传统咨询工作的人力负担,进而使参考咨询、文献信息检索等服务得到升华。 图5智能问答系统流图 下载原图
4.5远距离阅读
远距离阅读是通过机器学习、知识图谱、自然语言处理算法,从大规模文献信息中自动抽取要旨并对其进行总结,实现从研究者多角度发现知识演变趋势和数据关系,可通过设置推理规则来实现对这些数据间隐性关系的挖掘与呈现,能够发现靠传统文献阅读无法发现的隐藏在文献中的史实与现象,让知识获取不受人脑的限制,能使用户获取知识更加智慧化(见图6)。远距离阅读是一种新型文献理解方式,它主张通过计算机处理原文,生成新的概要性内容,以支撑读者理解或进行学术研究[41]。 图6远距离阅读系统流图 下载原图
4.6可视化阅读
可视化阅读利用机器学习、计算机视觉、知识图谱、自然语言处理算法,从海量文献信息中自动抽取要旨并将其形成视觉化的内容呈现出来(见图7)。可视化阅读是远距离阅读与计算机视觉技术融合与发展的产物,它依托于文献信息知识化的程度,将文本中复杂的或难以通过文字表达的内容和规律以视觉符号的形式表达出来,同时向用户提供与视觉信息进行交互的功能,把关键内容与图像符号智能关联,形成用视觉符号甚至是视频的方式呈现给用户的应用,用户就能够通过可视化的方式获取文献信息中所蕴含的关键知识[42]。 图7可视化阅读系统流图 下载原图
5结束语
自20世纪90年代起,文献信息的发展经历了从文本化、大规模数字化、网络化到数据化、智慧化的过程,每个阶段都带来了图书馆学、情报学、文献学等学科的跨越式发展,而对文献信息价值重构有利于拓展这些学科发展思路,新技术、新方法、新手段相融合使学科发展有了新的增长点。文章通过建立文献信息生态圈,实现对文献信息理论价值和应用价值的重构,在新时代人工智能技术的驱动下,使文献信息开发与利用的理论与方法得到了极大的丰富,进而延展了文献信息的理论价值。随着用户需求的不断提升,每一个智慧服务应用场景在不断升级过程中共同构成了文献信息生态圈的外部生态,这些场景使文献信息在原有应用价值的基础上得到了升华。我们所提到的人工智能技术和智慧服务尚处在发展优化阶段,而对文献信息的价值重构也要经历一个长期的过程,但在重构过程中应一直秉承以技术驱动、智慧向善、服务用户的核心理念,随着对文献信息价值不断的丰富与完善,必然会拓展图书馆学、情报学、文献学等学科发展的新方向。
当前网址:http://www.paperaa.com/newss/12773.html