论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>硕士论文>范文阅读
快捷分类: 世界知名报刊杂志深度阅读 有深度的论文话题 生论文深度 有关新闻深度报道的毕业论文题目 信息技术和教育深度融合论文 开题报告要求深度

关于深度论文范文 一种深度学习信息文本分类算法相关论文写作参考文献

分类:硕士论文 原创主题:深度论文 更新时间:2024-03-18

一种深度学习信息文本分类算法是关于本文可作为相关专业深度论文写作研究的大学硕士与本科毕业论文深度装机大师论文开题报告范文和职称论文参考文献资料。

摘 要:针对传统文本分类算法准确率低和正确率分布不均匀的问题,提出了基于深度学习的文本分类算法.深度信念网络具有强大的学习能力,可以从高维的原始特征中提取高度可区分的低维特征,不仅能够更全面的考虑到文本信息量,而且能够进行快速分类.采用TFIDF方法计算文本特征值,利用深度信念网络构造分类器进行精准分类.实验结果表明,和支持向量机、神经网络和极端学习机等常用分类算法相比,该算法有更高的准确率和实用性,为文本的分类研究开拓了新思路.

关键词:文本分类;深度信念网络;分类器

DOI:1015938/jjhust201702020

中图分类号: TP181

文献标志码: A

文章编号: 1007-2683(2017)02-0105-07

Abstract:Aiming at the problem of low categorization accuracy and uneven distribution of the traditional text classification algorithms, a text classification algorithm based on deep learning has been put forward Deep belief networks have very strong feature learning ability, which can be extracted from the high dimension of the original feature, so that the text classification can not only be considered, but also can be used to train classification model The formula of TFIDF is used to compute text eigenvalues, and the deep belief networks are used to construct the classifier The experimental results show that compared with the commonly used classification algorithms such as support vector machine, neural network and extreme learning machine, the algorithm has higher accuracy and practicability, and it has opened up new ideas for the research of text classification

Keywords:text classification; deep belief network; classifier

0引言

文本分類是根据提前建立好的分类器[1-2],让计算机对给定的未知类别的文本集进行分类的过程[3].一个完整的文本分类过程主要包括以下几个部分:首先是文本预处理,将文本表示成易于计算机处理的形式;其次是文本向量表示;再次是根据训练集(具有类标签)学习建模,构建出分类器;最后利用测试集测试建立好的分类器的性能,并不断反馈、学习提高该分类器性能,直至达到预定的目标.

常用的文本分类算法包括SVM(support vector machine,支持向量机) [4],BP(back propagation) 神经网络[5-6]、ELM(extreme learning machine,极端学习机)算法[4]等[7],这些方法往往存在着有限样本或局部最优及过学习问题[2],并且这些方法为了避免维度灾难通常对数据做降维处理,此时得到的结果并不能很好的反应文本的特征,最终导致分类准确率低下.因此,本文主要研究如何文本分类的准确率和效率.

目前国内对于文本分类的研究比较少,因此如何提高文本分类的准确率,是一项重要的研究内容[8] .

深度学习是通过构建具有多个隐层的机器学习模型组合低层特征形成更加抽象的高层特征来表示属性类别,以发现数据的分布式特征[9].深度学习具有很强大的自我学习挖掘特征的能力,可以得到最接近数据本质的表达和模式,能够极大的提高预测、分类等性能[10].2006年,Geoffrey Hinton提出深度信念网络(deep belief network,DBN) [11].它是一种概率生成模型,通过训练其神经元间的权重可以让整个网络按照最大概率来生成训练数据,从而实现特征识别和数据分类.

深度信念网络由多层神经网络构成,且这些结构之间均是非线性映射的,这使得它可以很好的完成复杂函数的逼近,从而实现快速的训练.此外,深度信念网络输入数据的重要驱动变量是通过贪心算法逐层训练每一层网络得到的,学习过程中既保证了数据本质特征的抽取,同时也避免了过拟合现象的出现.

基于上述原因,提出了基于深度学习的文本分类算法.首先,利用中科院中文分词系统对文本进行预处理;其次,使用TFIDF(Term Frequency–Inverse Document Frequency)公式计算文本分词的特征值,构成初始特征矩阵[12];然后,利用DBN良好的特征学习能力,从原始的高维特征中自动提取出高度可区分的低维特征;最后,将得到的特征输入 softmax回归分类器实现分类.

1关键技术

11文本的获取

手动建立文本库,在网络上大量搜集资料汇总,总结出5类文本:花、树木、虫、土壤、水类文本,同样本文研究的算法也适用于其他类型的文本,本文选取的实验样本如图1~3所示(经过分词后的文本)[13].

总结:关于免费深度论文范文在这里免费下载与阅读,为您的深度相关论文写作提供资料。

参考文献:

1、 深度学习与其在医疗信息领域的应用 [摘 要] 近些年来,深度学习迅速成为机器学习领域最为炙手可热的一个分支,深度学习概念提出之后,语音识别和计算机视觉等方面得到了飞速的发展。而随。

2、 从MOOC到SPOC:一种深度学习模式建构 摘要:SPOC是将MOOC与课堂教学相结合的一种混合式教学模式,是MOOC的继承、完善与超越。从MOOC到SPOC,为学生从浅层学习向深度学习转。

3、 基于深度学习法视频文本区域定位和区别 摘要:通过对视频图像进行快速、准确的文本定位与识别,有利于提高视频信息处理的效率与准确率,采用Gabor滤波器实现在横、竖、撇、捺四个方向上的视。

4、 一种视角生成的文本:结构方式和叙述风格 2015年夏,我前往库车县采访援疆教师。帕蒂古丽正在库车,边搜集素材,边创作小说:《最后的王》。古丽陪我去见了最后的“王后”。古丽与王后的关系像。

5、 神经网络深度学习算法在地理国情监测中的应用 摘要:开展常态化地理国情监测是广东省基础测绘“十三五”规划重要内容,本文综合利用多时相影像、专题资料及已有矢量成果数据,研究基于神经网络深度学习。

6、 深鉴科技:利用深度学习为人工智能提供更高效的解决方案 深鉴科技的深度压缩技术能够将视频帧率提高10倍以上,更便于监控画面的传输和运算,提高效率,降低成本。10月24日,人工智能企业“深鉴科技”宣布。