论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>硕士论文>范文阅读
快捷分类: 文献信息检索 信息检索论文 论文检索报告 文献检索网站 电子信息工程毕业论文 移动信息期刊 因特网信息检索的参考文献 信息检索论文评语 信息检索期刊 信息检索和论文写作 科技论文写作相关的信息检索知识 计算机信息检索和利用论文

关于信息检索论文范文 基于Prefuse和社会网络算法的信息检索学科合作网络相关论文写作参考文献

分类:硕士论文 原创主题:信息检索论文 更新时间:2024-01-27

基于Prefuse和社会网络算法的信息检索学科合作网络是关于对写作信息检索论文范文与课题研究的大学硕士、相关本科毕业论文信息检索论文开题报告范文和相关文献综述及职称论文参考文献资料下载有帮助。

摘 要:通过构建基于Prefuse的知识图谱系统框架,在此框架基础上采用社会网络算法构建信息检索学科合作网络知识图谱并进行了分析.发现信息检索研究人员在高产、高被引和高合作群体中不存在很强的一致性.合著网络中形成以Zhang, L、Sprink, A和Schacter, DL为中心的最大规模科研群体,以Tulving, E和Cabeza, R为代表的凝聚力最强的合作群体.

关键词:Prefuse 社会网络 知识图谱 信息检索 合作网络

中图分类号: G254.9文献标识码: A 文章编号: 1003-6938(2012)05-0079-06

近年来,随着多种知识图谱分析工具的出现,一些研究者利用知识图谱软件(主要是CiteSpaceⅡ)对信息检索学科进行了分析,如Rorissa A和Yuan X(2011)在2000~2009年数据的基础上用CiteSpaceⅡ对信息检索学科进行知识图谱构建和学科分析[1];国内同样有学者利用该软件对信息检索的子领域进行分析,但这些研究存在数据源时间跨度短、在一定程度上依赖于知识图谱软件的功能,而且未对信息检索学科合作网络进行分析研究.通过上述考虑,本文尝试一种新的知识图谱框架,基于该框架通过社会网络算法构建信息检索合作网络并进行解读,以便为国内外从事信息检索研究的有关学者提供参考借鉴.

1 基于Prefuse的知识图谱系统设计

2005年,Heer J、Card SK、Landay JA三人共同撰文提出了Prefuse的信息可视化框架[2].Prefuse为数据建模、数据可视化以及用户交互提供了丰富的软件库,可以支持表格、图和树显示,还具有支持动态显示、动态查询等功能.Prefuse基于传统的MVC架构进行开发,其可视化时需要经过如下处理过程[3]:

(1)抽象数据(Abstract Data).Prefuse对数据进行可视化的首要步骤是获取数据,并为数据提供了指定的接口和程序,可以显示表、图和多种树形结构.本文主要使用XML格式的数据,通过把数据转化成XML格式,如DOITrees、GraphML、TreeML格式,完成抽象数据的处理过程.

(2)数据过滤(Filtering).主要是将抽象数据进行提取、转化,使其适用于显示.首先选取要进行可视化的一系列元素,如一个图形或显示在散点图上的重点区域.然后形成一些可视化的属性(称为VisualItems),如源数据中显示的文字、数字,显示时的坐标点、颜色、大小等等.然后通过Action提供为上层组件.

(3)数据渲染(Rendering).即图形绘制的过程,可视化元素(VisualItems)通过渲染器(Renderers)绘制到屏幕上,其中用到上面形成的组件如颜色、位置、大小等等.Prefuse实现了一些基本渲染器,通过渲染器工厂RenderFactory进行管理.

(4)交互显示(Interactive Display).功能由Display组件完成,用于显示ItemRegistry中注册的组件.可视化交互功能通过ControlListener接口实现,主要是提供对鼠标、键盘的监听功能.

本文通过对数据的预处理、数据抽取、矩阵形成,进行聚类或社会网络以后,把生成结果转化成Prefuse可支持的TreeML、GraphML格式,借助Prefuse可视化框架,完成聚类显示、社会网络显示的功能.

2 信息检索学科分析的知识图谱构建

2.1 数据源获取

本研究数据来源于Web of Science的SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH数据库,用“Information Retriev*”作主题检索,检索时间选择20世纪50年代至今(截止至2011年11月25日),词形还原打开,得到的检索结果共计46561条记录.以此作为构建信息检索学科知识图谱的数据集,以下简称为“数据集”.

2.2 数据处理

(1)提取作者数据.在原数据库中,通过数据表paper的“authors”字段,可以获得每篇文献的作者数据,在作者字段中,为方便去重和区别不同作者,每个作者姓名以数据集中提供的全名进行表示,当文献是合作文献时,作者之间以分号进行分隔.选择paper的“authors”字段的所有数据,通过编程对获取的每个作者条目进行切分,从而得到所有作者数据.

(2)构建合作者对应关系.建立表author_author,其中包括两个字段“firstauthor”和“secondauthor”.通过处理,共得到548,182条作者与作者对应数据.在构建“作者——作者”对应表时,第一作者与第二作者及其他作者不分权重,即所有作者的重要程度相同.构建作者与作者对应关系表时,通过对步骤一获得的每一条合作者数据进行遍历,得到作者与作者对应关系.

(3)生成合作者数据.对表author_author中的数据,根据“firstauthor”字段进行分组合并,对“secondauthor”进行合并,合并过程中剔除重复元素,“secondauthor”对应数据以分号进行连接,同时统计出每个作者的合作次数,然后将合作者数据插入表coauthor中.

处理完成后,共得到96,778个作者的合作者信息,其中与其他作者合作频次最高的为Bryant, Stephen H.,合作频次为245.与其他作者合作频次达到200次以上的作者共22人(见表1).

2.3 合作者网络构建

由于本文的研究重点是确定合作者中的团体和其研究内容,所以文中采用无向无权网络,构建过程如下:

(1)定义社会网络数据结构.合作者网络的定义包括节点、边和社会网络三个部分.节点包括aid和aname两个字段,为网络中最基本的构成元素,由类Node表示;边由节点和与该节点关联度为1的节点的集合构成,其中与该节点关联的节点数即为该节点的度,由类Edges表示;社会网络由节点的集合和边的集合两部分构成,其中社会网络还可以获取子网络,由类SocialNetwork表示(见图1).

总结:关于免费信息检索论文范文在这里免费下载与阅读,为您的信息检索相关论文写作提供资料。

参考文献:

1、 十八届五中全会精神专题吹风会向国际社会传递了什么信息 为回应国际社会的关切,中共中央对外联络部于2015年11月9日、10日分别举办面向外国驻华使节和外国企业驻华代表的十八届五中全会精神专题吹风会,。

2、 电子商务信息不对称和网络购物风险分析 内容摘要:电子商务作为新兴的经济模式在我国已经进入了繁荣发展期,对我国经济发展起到重要的推动作用。但目前由于我国电商行业发展时间短、发展基础薄弱。

3、 网络环境下信息安全和公民宪法监督权 摘 要:网络的发展使得公民传统的监督方式发生了变化,公民在网络环境下能够更加快捷地行使自己的监督权,但是网络监督也会促使公民滥用自己的监督权危及。

4、 巧用网络平台办公室信息管理模式 (吉林大学 商学院,长春 130012)[摘 要]学院办公室是学院的管理中枢,学院办公室信息管理如何更加富有效率,是信息社会背景下学院快速发展。

5、 企业社会责任对会计信息质量治理效应 摘 要:会计信息质量不仅关系着一个企业的持续发展,反映着企业本身的运营状况,关系着企业未来发展的预期与计划,也是企业形象与凝聚力的重要影响因素之。

6、 我国P网络借贷平台信息披露制度建构 摘 要:信息时代背景下,P2P网络借贷平台历经十余年发展,实现了从最初担任借款中介的单纯角色到当前扮演贷款、担保以及风评机构等多重角色的转换,随。