知识图谱应用于学科知识服务初探

2015-03-18 04:25     字号:

知识图谱应用于学科知识服务初探

  (福建省图书馆  福州  350001

 

    概述知识图谱的概念、作用、类型和应用领域,对知识图谱应用于学科知识服务的原因进行探讨,分析知识图谱应用于学科知识服务的障碍,并提出相关对策。

关键词  知识图谱  学科知识服务  服务障碍

 

1 前言

当今世界正处于知识信息化时代,面对大量无序、不可靠的信息,许多人想从中获取想要的有用信息并不是一件易事。图书馆员的任务之一就是为用户从日益纷繁冗杂的信息资源中提取有效信息,通过知识发现、挖掘、获取、组织、创新、应用、储存、管理等一系列过程提供知识服务。而知识图谱正是提供知识服务的有效手段。进入新世纪以来,知识图谱凭借其理论上的综合化、方法上的可视化、描绘上的形象化等诸多特征,获得迅猛发展,一跃成为当代科学计量学的研究热点和最新前沿。[1]本文对如何利用知识图谱促进学科知识服务进行探讨。

2 知识图谱

2.1 知识图谱的概念

知识图谱(Mapping Knowledge Domain)在图书情报界也称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形。详细地说,知识图谱就是把图形学、信息可视化、信息科学等学科的理论和方法与科学计量学中的引文分析、共现分析等方法结合起来,用可视化技术来形容描述知识资源及其联系,挖掘、分析、建构、测绘及显示知识及它们之间的关联,展示一门学科的核心结构、发展历史、前沿热点以及整体知识结构的将多种学科知识、技术进行融合的一种研究方法。[2]

这种研究方法把复杂的知识领域通过数据挖掘、信息处理、知识计量和信息可视化显示出来,动态地揭示了知识领域的发展规律,为学科研究提供切实有效的参考。

2.2 知识图谱的作用

英国著名的情报学家布鲁克斯曾指出:情报学的真正任务应该是组织、加工和整理人类客观知识,将知识结构绘制成以各个知识单元概念为节点的学科“知识地图”,通过对文献中的逻辑内容进行分析,找到人们思想的相互影响及联系的结合点,从而为用户提供知识之间关系的一种知识组织的理想状态。[3]加菲尔德早在1955年在《科学》杂志上发表的一篇论文中,就认为传统的基于学科的检索和摘要服务难以满足研究的需求。

知识图谱通过可视化工具软件导入来自于《科学引文索引》的数据,通过信息图像化这种直观的处理方式,显示出专业学科领域中学科之间的结构关系、核心、热点等,从而获得形象、详尽的学科信息分析结果。这些信息分析结果可以帮助用户了解学科的历史、现状以及前沿问题,有助于用户在浩瀚无垠的信息海洋中直接撷取有用、可靠的信息,并对这些已经由学科馆员进行加工的知识直接利用。这一过程由学科馆员替代用户完成了知识化,将非编码化的隐性知识变为外显的可视化的知识图谱,这样有助于用户以简洁、直观的方式,准确地获取想要解决的问题的相关知识和先前未知的潜在规律,展现了知识的价值,有助于推动学科的发展和热点问题的分析与解决。

2.3 知识图谱的主要应用领域

现今知识图谱的主要应用领域包括如下5个方面[4]:①从事科学技术研究活动的学术共同体和作为学术知识载体的网络。学术公共体是某一专业领域内志同道合的学者结成联盟,共同研究,相互影响,相互学习[5],从而有利于该领域的学术评价、学术发展和学术自主度。而不同的学术知识载体对学术知识的传播起到不同的作用,尤其在现今社会,出现越来越多不同的可以作为知识载体的事物,它们对学科知识发展也起到一定的作用。知识图谱作为一种优秀的学术知识载体,有利于促进学科知识的发展。②某一学科主要研究的几个领域之间的内在联系。在知识图谱中可以显示各研究领域之间的相同知识输入与输出,这些被两个或多个主要领域运用的知识就成为这个学科的重点知识,也能很好地代表这个学科的热点,便于了解该学科的结构。③知识图谱可以对某一领域研究主题的渗透、衍生和扩散趋势做出预测。这样能发现该领域几个主要研究的知识群之间的关系,很好地显示基础理论、基础技术和新兴技术之间的关系,对研究该领域的主要知识脉络可以很好掌握理解。④知识图谱可以将学科领域内隐性或非编码化的知识转化为显性、编码化的知识,例如作者、期刊和其他出版物等之间的关系。这样将原来可能隐性的不易为所有人认知或难以信息化的知识,通过编码化的形式,借助一定的手段,使这些知识理性化、直观化、形象化,直接反映出来。⑤科学社会网络,也可以称作科学合作网络。知识图谱可以显示某些作者、机构、群体的合作关系,从而找到核心作者,这样可以了解研究某一领域的主要科研力量,大致掌握该领域的研究情况。

3 知识图谱运用于学科知识服务中的原因

3.1 契合学科知识服务的职责

在新的形势下,创新知识服务、承担深层次信息服务成为学科馆员的职责。[6]学科馆员以开发专题信息资源为目的,深入学科专业领域之中,针对用户的问题及其特定的环境,对某一学科的基本理论、历史和现状、学术前沿、主要学术领头人等方面进行深入的分析了解。对无序繁杂的信息进行加工、分析、整理、重组,完成知识的管理过程,为用户提供有效可靠的支持知识应用和知识创新的服务。[7]

知识图谱正是研究学科知识和知识管理的方法之一,通过最先进的信息技术运用于知识图谱,导入来自SCI的具有一定公信力的数据,便可以完成动态呈现某一学科或领域内发展着的知识的可视化,揭示其现状与发展规律。在知识图谱中,学科前沿之间的交互关系是以立体多维的形式展现出来,这样就能够探明有关学科不同领域之间的亲疏关系和学科核心结构,划定某学科的核心作者及核心作者群,分析并推测学科间的交叉、渗透和衍生趋势,从而可以对某一学科进行多方位多角度的分析,从而揭示学科的动态结构[8],能够较好地满足用户的知识需求。由此看来,知识图谱是履行学科服务职责的良好工具。

3.2 为学科知识服务增值

学科知识服务是面向增值服务的服务。[9]学科知识服务注重的是利用自己独有的知识和能力,对现成拥有的文献进行更深入的加工,创造新的具有独特价值的知识产品,为用户解决在他的能力范围之内所不能解决的问题。学科知识服务者当然希望自己的产品或服务成为用户重要的需求,通过运用自身专业知识和专业能力为用户创造实际价值或潜在价值,显著提高用户知识应用和知识创新的效率与效果。简而言之,学科知识服务是以为用户解决问题来体现价值,所解决的问题越难,其服务价值越大,而不是以前那种单单基于资源优势,在庞大复杂的学科知识领域内查阅获取相关信息的“劳务”服务来体现的。

知识图谱导入的数据大部分来自SCI,而SCI的数据拥有核心资料和最新概念,可供学科馆员很好地对某一学科或领域的现状和最新动态趋势作出预测,从而把握其未来发展大致方向。这样不论是对学科还是对生产都起到辅助作用,对学术共同体或领导机关的决策也可以起到重要的参考作用,形成融洽的“服务者——学科专家、学者——各类型学科用户群——合作对象”的互动关系,便于进行从知识捕获、提取、挖掘、重组、创新到集成应用的全程一体服务[10],使知识图谱具有巨大的满足用户需要的价值。现今知识图谱在我国的主要研究应用领域集中于科学学研究和前沿、热点问题分析,这也有利于知识图谱发挥其应用性强、应用学科广的特点,很好地体现了学科知识服务的价值。

3.3 支持用户得到个性化、专业化服务

进入新世纪后,图书馆服务不再单纯是大众化服务,而开始转向个性化、专业化的服务模式。学科知识服务要求以学科馆员为主导,全面利用现代信息技术手段和知识服务观念,在“学科知识一站式服务”的目标下,面向学科知识发展最前沿,集成多种知识服务,整合信息技术与信息资源,开展基于知识管理的数字化环境下学科知识的个性化制定服务。[11]而借助知识图谱的引导,图书馆可以摒弃以往那种宽泛、模糊的知识服务,集中力量对用户的需求进行分析,为用户量身定做其需要的知识图谱,收集、鉴别和整理相关知识,进行学科导航服务,协助用户进行专题检索,有针对性地提供决策参考服务。

为了扩大学科知识服务的深度和广度,满足用户个性化需求,学科馆员应对经常使用学科知识服务的用户建立起用户个人的服务资料库,根据已有的知识图谱查询、使用记录对其需求进行推测,定期进行内容更新和推荐,对用户已储存的知识信息进行跟踪报道,更好地实现学科专业化、个性化服务。

4 知识图谱应用于学科知识服务的障碍

图书馆自从进入数字图书馆时代,其信息科学技术不断得到发展,信息可视化技术也得到国内关注和重视,有些领域甚至引起学者的重点关注。但这并不意味着知识图谱在学科知识服务中的应用就不存在障碍。下面对知识图谱应用于学科知识服务的障碍进行介绍分析。

4.1 知识图谱使用软件

国内外用于绘制知识图谱的主要软件有:PajekUcinetNetdrawBibexclWordStatWordsmithCitespaceHistCiteVxlnsigh9种。其中有汉化版的是WordStat,并且它可以让国内图书情报机构免费使用。除 WordStat之外,Pajek也是可以免费使用的软件,但它是专门针对大型数据分析的软件,且只适用于社会科学类。Wordsmith是一款词频分析软件,但研发之初就是以商业性为目的,现在国外多将它用于科学计量学领域。Citespace利用引文网络分析,可以探寻学科演化路径、知识拐点和学科发展热点,在国内也可以在网上下载到小型版,但使用方法推广的并不好,很多人不知如何操作。Vxlnsigh软件的分析结果是使用3D的效果呈现出大规模的数据元素,但目前只是在国外成功应用于核物理领域可视化。此外,这些主要的可视化知识分析软件在国内甚少有相关专业的使用报告和研究结果,对其技术及使用方法都鲜有研究。如果知识图谱的研究方法和手段没有得到发展和提高,那么便会对知识图谱应用于学科知识服务造成困难。

4.2 知识图谱的应用推广

知识图谱通常以二维或三维图表呈现,但图形中复杂密集的知识点与关系连线对大部分学科馆员的服务用户来说都不易理解,要经过专门化的培训,才能使其较好地掌握知识图谱的可视化结果分析,运用分析结果满足用户自己的知识需求。而这一过程要消耗大量的人力,首先,现今图书馆的专职学科馆员还不普遍,大多是兼职的形式,掌握知识图谱需消耗大量的成本。其次,目前能提供知识图谱学科服务的机构也很少,利用知识图谱的图书馆用户就更少,对其进行集中培训明显很不实际。这样就会在一定程度上对知识图谱的推广造成困难。再次,目前国内对知识图谱的研究还处于起步阶段,其研究成果不多,知识图谱技术与其可视化效果的优化不易在短期内得到发展,这便降低了知识图谱在学科知识服务中被用户接受的可能。

4.3 知识图谱的发展水平

知识图谱研究是一个新领域,近期的发展趋势良好,但也存在发展时间短、科研力量分散的问题。许多不错的科研结果多是各国拥有一两项,没有什么特别突出的领导力量。

国内近几年也渐渐涌现出研究知识图谱的团队,如武汉大学、中科院、中信所、大连理工大学、南京大学等,但国内研究的手段普遍过于传统。截止2008年上半年,国内相关文献中使用PFNET算法[12]的文献只有1篇,而运用最新的商用软件Thomson Data Analyzer对人类基因组领域进行共词图谱绘制的实例[13]也只有1篇。这一情况可能与知识图谱的相关软件操作具有一定难度,汉化版本少,实验数据获取不易,经费需求大而资助来源少,国内普遍发展水平不高等原因有关。虽然以大连理工大学刘则渊教授带领的团队对国内知识图谱方面的研究做出不小的贡献,但国内整体研究团队的研究水平不高,国内学科馆员对知识图谱的利用也尚未普及,学科馆员在为图书馆用户提供服务时会利用原有的、相对成熟、熟悉掌握的科学技术,这对知识图谱在学科知识服务的平台上得到充分利用形成障碍。

4.4 数据质量

知识图谱应用于学科知识服务的障碍还包括:获取的数据质量直接影响知识产品的质量。而在专业领域中的高质量数据(可获取并有用的)大都以普通形式出现,这就需要生产出来的数据也必需以相同形式出现。虽然SCI的数据质量较好,但最近引用规则却越来越得不到一些学者的遵守。他们通常出于不严谨、学派或利益原因而引用或不引用某些文章,使SCI数据失去一定客观性。这都在一定程度上影响了知识图谱的结果,影响了学科知识服务的服务效果。

4.5 评价体系

任何一种机制,如果缺乏相应的质量评价指标,那么就会难以得到优化和发展。在信息可视化方面和学科知识服务方面都没有相应的完善的质量评价指标的情况下,更不必说知识图谱应用于学科知识服务方面的服务质量评价体系了。而相应的质量评价指标缺乏,既不能客观地反映知识图谱对于学科知识服务的进行现状,也不利于对其整体事业建设进行宏观调控促进其发展,也不能对具体的某一机构的服务进行评估,让其负责人和学科馆员了解其业务水平、特点和工作差距,从而更好地为其后的发展订立发展计划和工作目标[14],以评价的结果改进工作的重点和措施,以更好地满足用户的需求,实现服务的价值。

5 知识图谱应用于学科知识服务的相关对策

5.1 协调合作,资源共享

知识图谱的研究需要大量的人力、物力、财力,仅仅一个图书馆、一部分学者进行研究,必然影响知识图谱研究的发展,为此,知识图谱研究领域应与现有其他研究热点结合,带动自身的研究氛围,提高研究水平,展现自身技术与成果优势,使知识图谱逐渐受到重视,在实践中得到提高发展。同时,各研究院校与学者之间经常进行学术科研交流,共享相关资源,这样有利于节省经费,避免信息分散,提高国内知识图谱发展的整体水平。

5.2 美化知识图谱图形

知识图谱虽然可以通过可视化技术使某一学科或领域的知识以直观、形象的方式表现出来,但其复杂、多维的图表不是任何普通用户就可以直接理解的,除非用户已理解绘图系统,否则学科馆员即使提供了知识图谱服务,那么对用户也将没有多大用处。所以美化知识图谱图形,使其符合中国用户的看图习惯,从本地较经常使用、易被图书馆用户所接受的图形入手,提高用户的知识图谱利用率。

5.3 服务社会,扩大受众

学科社会化服务是学科知识服务的必经之路。它一方面可以使信息接受者增加,学科知识服务从学校、科研机构延伸到工厂、企业以及社会上其他与该学科有关系的单位,不仅可以为校内、机构内的科研教学人员服务,还可以为社会上有需求的其他人服务,拓宽服务面,增强知识传播效果。另一方面,学科馆员在服务的同时,还可以结合自己具有的专业基础知识,深入实践,在实践中完善理论,更加了解专业发展现状,更好地把握研究趋势以及未来研究方向。扩大受众也有利于加快知识流通与更新,从而有效地加快学科知识服务走向社会、面向社会的进程。[15]

5.4 提高数据质量

随着知识图谱工具的提高,只有数据质量也提高,才能真正使学科知识图谱的整体质量提高。为了便于数据的利用与共享,数据的标准化就格外重要,否则人们要花费大量时间将不同格式的信息转化为统一格式,之后再进行利用。而只是统一信息的格式也不能很好完成作为知识图谱基础数据的职责,只有简洁规范的数据才是最佳的基础。这就要求利用专门的数据库,对那些经过加工、整理的数据直接进行利用,这样才会取得最佳效果。

5.5 建立相关的评价标准和体系

无规矩不成方圆,建立相关的知识图谱学科知识服务评价标准和体系,有利于学科馆员在为图书馆用户进行服务时有据可循,有利于学科信息资源或资源获取渠道组织整理得更加完备,了解用户的使用率和满意度,从而更好地了解自身存在的缺点,并在之后的工作中改进。评价也可以作为一个标准,便于各学科馆员为用户提供相近水平的知识服务,而不会造成良莠不齐,学科馆员在进行知识组织、储备和生成的时候也有一定的方向,避免造成重复劳动和资源浪费。

6 结语

目前知识图谱在国内仍处于起步阶段,发展程度不高,资源共享不佳,但随着我国学者对此领域的研究逐渐深入,知识图谱的发展和应用将不会有太多困难。知识图谱与学科知识服务又有诸多契合之处,随着知识图谱的发展,其在学科知识服务中的运用与推广必将得到发展,在社会化与产业化用途的逐步扩大也会使知识图谱得到重视,进一步提高其在学科知识服务中的作用。知识图谱应用于学科知识服务方面,会为用户提供动态、快捷、个性化的学科知识服务,更好地满足用户的知识需求,从而更好地体现图书馆的职能。

参考文献

1,2,4,8,11 秦长江,侯汉青.知识图谱——信息管理与知识管理的新领域[J].大学图书馆学报,2009(1):30-37.

3 郑苗,樊治平.知识地图:知识管理和组织学习的有效工具[J].工业工程与管理,2003(3):56-59.

5 中国共产党新闻网.学术共同体当承担学术评价重任[EB/OL].

http://theory.people.com.cn/GB/10175011.html.2010-08-21.

6 魏红梅.高校图书馆学科馆员的工作定位与素质要求[J].情报探索,2006(8):73-75.

7 钱智勇.学科馆员与重点学科创新服务模式研究[J].情报理论与实践,2004(5):514-517.

9 沈小玲.基于学科知识管理的高校图书馆学科知识服务[J].情报探索,2009(8):119-121.

10 张会田,巩林立,傅晔.基于网络的学科化信息服务体系构建[J].情报理论与实践,2007(5):686-701.

12 张兆锋,张志平.信息可视化在科技文献深度挖掘中的应用[J].情报学报,2007(3):408-41.

13 周静怡,孙坦.共词可视化:以人类基因组领域为例[J].情报学报,2007(4):532-537.

14 吴慰慈.图书馆学基础[M].北京:高等教育出版社,2004.

15 靳启颖.数字环境下高校图书馆的学科服务模式研究[J].科技情报开发与经济,2009(19):39-41.

 

    女,福建省图书馆助理馆员。

(收稿日期:2014-03-04。龚永年编发。)

附件下载

相关链接