基于关键词共现国内用户主题是适合关键词论文写作的大学硕士及相关本科毕业论文,相关关键词有哪些开题报告范文和学术职称论文参考文献下载。
【摘 要】以2002-2011年我国图情领域关于用户研究的文献为对象,从关键词共现分析、聚类分析、社会网络分析等几个方面对文献中的高频关键词进行定量研究,并将其归类为六大主题.
【关键词】用户 共词分析 社会网络分析 主题归类 核心主题
引言
随着信息化和网络化时代的来临,人们的信息交流日益频繁,信息用户日渐庞大.对用户进行研究已成为我国图情领域研究的前沿和热点,其研究成果可以为信息服务机构开展以用户为中心的服务提供依据.在这一趋势的引领下,图情界同仁迫切希望了解近10年来关于用户研究的热点领域和动态信息,为未来完善用户研究提供有用的借鉴.因此,笔者采用共词分析法和社会网络分析法对2002-2011年我国图情领域关于用户研究文献中的高频关键词进行分析,以揭示用户研究的主题,把握其发展趋势.
共词分析法主要是利用文献集中关键词对共同出现的情况来确定该文献集所代表学科中各主题之间的关系.一般做法是统计一组文献的关键词两两之间在同一篇文献中出现的频率,便可形成一个由这些词对关联所组成的共词网络.利用聚类、因子分析等多元统计分析方法对共词网络进行分析,进而展现该学科的研究结构[1].
社会网络分析法原本是社会学用于研究社会成员之间关系的一种定量方法,后来被引入到了图情领域的相关研究.它在关键词分析中应用的主要原理是将关键词作为网络的节点,关键词之间的共现关系则构成节点之间的连线,构建社会网络关系图谱,然后应用中心度、小世界效应等方法进行分析,进而发掘出关键词之间的关系 [2].
2.1 数据来源
为了尽可能保证查全率,笔者以“用户”、“信息用户”为题名和关键词,对中国知网和维普网收录的19种图情领域核心期刊进行检索.共得到2002-2011年发表的论文2 632篇,剔除非学术论文、重复等无效部分后,最终有效篇数为2 115篇.
19种核心期刊分别是:《情报学报》、《图书情报工作》、《国家图书馆学刊》、《图书和情报》、《图书馆学研究》、《图书馆工作和研究》、《图书馆理论和实践》、《情报杂志》、《情报科学》、《图书馆杂志》、《图书馆建设》、《图书馆论坛》、《图书馆》、《图书情报知识》、《情报理论和实践》、《中国图书馆学报》、《大学图书馆学报》、《情报资料工作》、《现代图书情报技术》.除了《情报学报》上发表的文献来自于维普网外,其他均来自于中国知网.
2.2 数据预处理
由于关键词是论文作者自行选择的自然语言,因此会存在一些不规范、不统一的现象.为了让研究结果更加准确,笔者采用归并、吸收和丢弃三种方法对关键词进行逐一的人工处理.
归并法是指对同一内容用不同词语来表达或者同一词语用不同语种来表示的情况,归并为统一的词语.如用户、读者和信息需求者等,归并为用户; Lib2.0、Library2.0和图书馆2.0,归并为图书馆2.0.
吸收法是指针对同一研究内容,但却采用上下位关系来表示的关键词,如用户、图书馆用户和信息用户,采用上位类代替下位类的方式进行吸收,即采用用户来表示.有些词需要采用下位类吸收上位类的方式,如模型和用户模型,这需要结合文献的具体内容而定.
丢弃法是指针对一些和用户研究无关或者太宽泛的关键词,如学校机构的名称( 财经大学)、趋势、google工具栏、21世纪等,将这些关键词丢弃而不纳入统计分析范畴.同时,由于本文研究的文章都是来源于图情领域,这些文章包含“图书馆”这个关键词的频率较高,为了使得研究结果更加准确和客观,把这个关键词也剔除.
按照上述方式,采用自编的C语言程序进行统计,共得到关键词3 256个.结合齐普夫第二定律以及关键词频次变化曲线,选取频次大于20的34个高频关键词,如表1所示:
2.3 构建共词矩阵
为反映关键词之间的关系,笔者统计高频关键词两两共现的情况,构建出34×34的共词矩阵(见表2).由于关键词共现的频次直接受到各自词频大小的影响,因此原始共词矩阵难以反映关键词之间真正的依赖程度.为了消除这种现象,笔者采取常用的Ochiia系数对关键词对进行了包容化处理,将原始共词矩阵转换为相似矩阵.Ochiia系数计算公式为: ,其中 表示关键词 和 共现的频次, 分别表示关键词 和 的频次.
由于构建的相似矩阵为0值过多的稀疏矩阵,为方便后续处理,用1和全部相似矩阵中的数据相减,得到表示关键词对的相异矩阵(表3),作为后面分析的矩阵变量.相异矩阵中的值越大表示两个关键词对联系越不紧密,值越小表明联系越紧密.
2.4 研究方法
因子分析法.该方法的目的是用少数几个因子去描述众多指标或因素之间的联系,其基本原理是把比较密切的几个变量归在同一类中,每一类变量就成为一个公共因子,然后以较少的几个公共因子反映原资料的大部分信息.运用这种方法,可以确定本论文研究的高频关键词的类数,为聚类分析中类数的确定提供依据[3].
聚类.该方法是直接比较各事物之间的性质,将性质较相近的聚为一类,将性质差别较大的归入不同类的分析方法.运用此方法,可以将高频关键词按照距离的远近聚集成不同的类别,使类内属性相似性最大, 类间属性相似性最小[4].
多维尺度分析.该方法是通过低维空间(通常是二维空间)展示多个研究对象之间的联系,利用平面距离来反映研究对象之间的相似程度.通过高频关键词的多维尺度分析结果,可以直观形象地展现关键词之间的相近程度[5].
社会网络关系图谱.该方法能够直观地揭示各个元素之间的紧密程度和所处地位.通过构建高频关键词的图谱,可以分析出高频关键词在整个网络中所处的地位 [6].
3.1 总体趋势
论文的数量能够直接反映图情领域对用户研究的关注度,2002-2011这10年间共有2 115篇相关论文,年均211.5篇.刊文量从2002年的98篇增长到了2011年的309篇,增长了近3.15倍,年均增长率达到12.2%.上述数据表明,近10年来我国学者对于用户的研究越来越关注和重视.正如普赖斯文献指数增长规律所反映的现象,图情领域关于用户的研究正处于发展阶段,会引起许多不同学者进行思想交流,不同学科内容的相互渗透、交叉,推动了用户研究的蓬勃发展.
总结:关于免费关键词论文范文在这里免费下载与阅读,为您的关键词相关论文写作提供资料。
参考文献:
1、 范围副词都和否定词共现句法语义分析 摘 要:“都”和“只”是现代汉语常用的范围副词,它们对所修饰对象做范围上的限定。本文主要对“都”和“只”的否定形式进行研究,将它们的否定形式分类。
2、 基于共词分析国内在线商品评论热点 〔摘要〕国内随着2004年网购的兴起,研究在线商品评论的文章开始逐年增多,本研究尝试利用文献计量学的方法对国内在线商品评论的学术文献进行统计分析。
3、 欧盟将和新西兰共夺中国市场国内乳业面临价格大战 3月31日,欧盟取消实施多年的奶业配额制度,届时奶源过剩的欧盟将与新西兰共同争夺中国市场。欧盟是中国婴幼儿配方奶粉、液态奶、乳清粉、奶酪进口的。
4、 国内用户驱动综述 摘要:该文分别以“中国知网(CNKI)”、“维普数据库”和“万方数据库”为数据来源,对用户驱动相关研究文献进行检索。通过对检索文献进行去重处理,。
5、 金砖合作,电商共赢主题沙龙成功召开 2017年9月5日下午,陕西省电子商务协同创新研究中心联合西安交通大学、中国国际贸易促进委员会西安市分会、长安区电子商务协会、丝路阿克苏易货贸易。