论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>硕士论文>范文阅读
快捷分类: 文后参考文献著录规则 毕业设计文档 政论文范文 辩论文格式 维吾尔医药杂志 毛概论文格式 自学考文提纲 2018越南语论文题目 毛概论文改革开放 世说新语论文开题报告 维吾尔医学杂志 正确著录文后参考文献的重要性是

关于维吾尔文论文范文 脱机手写维吾尔文单词的过拆分方法相关论文写作参考文献

分类:硕士论文 原创主题:维吾尔文论文 更新时间:2024-02-27

脱机手写维吾尔文单词的过拆分方法是关于维吾尔文方面的的相关大学硕士和相关本科毕业论文以及相关维吾尔文论文开题报告范文和职称论文写作参考文献资料下载。

摘 要:脱机手写体维吾尔文切分是脱机手写体维吾尔文识别的基础,切分准确率直接影响识别的正确率,该问题的研究对提高识别的系统性能具有重要的意义.提出了一种脱机手写维吾尔文单过切分方法.该方法的基本过程是通过确定单词的主笔划找到单词的基线,再根据基线以上的部分过拆分单词,对该方案进行了实验,实验结果表明该文切分方案具有有效性和可行性.

关键词: 脱机手写;维吾尔文;过切分;投影;基线检测

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2018)12-0271-03

Abstract:Off-line handwriting Uyghur word segmentation is the basis of offl-ine Uyghur handwriting recognition. The segmentation accuracy directly affects the accuracy of recognition. The research on this issue is of great significance to improve the recognition system performance. An off-line handwritten Uyghur single-pass segmentation method is proposed. The basic process of this method is to find the baseline of the word by determining the main stroke of the word, then to split the word according to the part above the baseline, and the experiment is carried out. The experimental results show that the proposed scheme is effective and feasible.

Key words:Off-line handwriting; Uyghur; over segmentation; projection; Baseline detection;

1 引言

維吾尔文的历史悠久,在中国的西北地区,广泛地被维吾尔族使用.基于维吾尔文的文字处理系统与输入方法的研究,在我国研究较少,同时起步也比较晚,现存的研究文献中,研究最多的就是键盘编码输入方式[1],关于识别方面的研究相对较少.关于维吾尔文字的识别技术,尤其是印刷体字符的研究,研究比较成熟的代表是清华大学与新疆大学[2-4].与其他语言文字相比,维吾尔文在书写规则,字母结构、书写习惯等方面更为复杂,难度较大,尤其是手写体识别,由于硬件因素的影响,对于脱机手写单词识别更少.基于此,本文主要的研究对象是脱机手写维吾尔文字符切分技术的.单词的识别主要分为两种,一种是基于分割的方法,第一种是整体性识别的方法.如果是通过分析字母的形状特征对字母进行识别,然后再对整个单词进行识别,则说明采用的是基于分割的方法;如果是通过单词的整体数字特征入手,再采用整体的模式对单词进行识别,则说明采用的是整体性识别方法.在维吾尔文中,如果是采用整体性识别的方法对其识别,是行不通的,因为这种语言的单词数量特别庞大,因此只能采用基于分割的方法.在单词图像中,单词中的字符切分是相对比较重要的一步,它是字符切分、单词识别等技术的基础.要进行正确地识别就要进行正确的区分,如果切分不当就容易造成识别错误,对于这种问题是不能忽视的.在维吾尔文的脱机手写中,两个因素给单词切分带来了较大的困难,第一个因素是手写的随意性,第二个因素是单词图像中字符的唯一性.

维吾尔文字书写时字母连续流畅,自右向左书写.维吾尔文与汉文有较大的不同,维吾尔文的一个词是由一个或多个字母组成的.根据维吾尔文的书写规则,,这些字母可能前后相连形成一个或几个连体字母段或称连体段.不管是维吾尔文的手写体,还是维吾尔文的印刷体,在连体字母段中,所有的字母都是沿着一条水平线相连的,这条水平线叫基线.一个单词包含一个或多个连体段.每个连体段也是由一组字母,或一个字母组成.

2 预处理

以采集到的单词图像为基本对象,对其进行相应的处理,这种处理就叫预处理.预处理的目的有两个,一个是减少噪声的影响,另一个是减少外界干扰,预处理的主要作用是对手写单词存在的变形进行矫正.预处理在所有的步骤中是不能缺少的关键性步骤,它是字符分割的基础与前提.主要内容包括图像二值化,倾斜矫正等.

2.1 二值化

在本方案中,实验的样本图像采用的是黑白图像,白色的是背景,黑色的是字体.如果从数字图像的像素值上对其分析,图中像素的灰度值从0到255均有分布,在图像上都有细微的表现,灰度差异较小的是字符像素点与背景像素点,在单词中,骨架部分呈现的是黑色,边缘部分呈现的是灰色.本文投影切分算法的实现就是要利用颜色差异,所以分割之前需要对图像进行二值化处理.充分结合最大类间方差法[5]可以找到图片的一个合适的阈值.对这个阈值加以利用,就可以更容易(与人为设定相比)地把一张灰度图像转换为二值图像.最大类间方差法(otsu)的公式推导:记[T]为前景与背景的分割阈值,前景点数占图像比例用[w0]表示,平均灰度用[u0]表示;背景点数占图像比例用w1表示,平均灰度用u1表示.则图像的总平均灰度,可以采用公式(1)对其表示;前景和背景图象的方差,则可以采用公式(2)对其表示:

在上述公式中,当方差最大时,就可以将其认定为此时前景与背景差异最大,换句话说,就是此时的灰度是最佳阈值.

2.2 倾斜矫正

总结:关于免费维吾尔文论文范文在这里免费下载与阅读,为您的维吾尔文相关论文写作提供资料。

参考文献:

1、 做踏实人写实在文 新高三的同学们,你们是否还在努力打造所谓精美的首尾段?是否还在背诵“盈盈月光,我掬一杯最清的;落落余晖,我拥一缕最暖的;灼灼红叶,我拾一片最热的。

2、 我手写我心 爱护环境小猴孙小圣和小熊丁丁从电影院里急匆匆地跑出来,丁丁还边跑边说:“快点快点,否则公园就要关门了!”原来,他们看了一部《爱护环境》的电影,。

3、 循章轻借力得法写好文 除却审题、立意,选材、用材也颇能见出学生写作的功底。因此,日常教学中笔者常设计一些系列性的训练,以使学生积累写作素材,提升他们选材入文的能力。以。

4、 坚持我手写我心问题 莉莉老师问:如果让孩子坚持“我手写我心”会得罪中考吗?曾经一个孩子写自己被朋友忽视倍感委屈,说了一个很尖锐的观点,但一定是符合人性的,结果却被。

5、 无纸时代的手写爱情 核心提示:给身边心疼你的人写一封信,感恩的字迹有多长,爱情就有多长。汉娜·布兰契曾是大学里唯一会在一天结束时,去查信箱的那个人。她的妈妈从不相。

6、 手写光阴 “哈里在学校时常惹麻烦”、“威廉非常喜欢他的弟弟,一整天都和他在一起,不停地抱他亲他,甚至不让大人靠近!”……新年伊始,英国剑桥的切芬斯古董拍卖。