谷歌浏览器插件
订阅小程序
在清言上使用

面向满文字符识别的训练数据增广方法研究

毕佳晶,李敏,郑蕊蕊,许爽,贺建军, 黄荻

Journal of Dalian Nationalities University(2018)

引用 0|浏览3
暂无评分
摘要
为解决采用深度学习方法研究满文识别中训练样本匮乏的问题,提出一种使用数据增广方法扩展训练样本集的技术框架.该框架包括字体几何结构变形与图像质量变换两个模块,采用仿射变换、弹性形变等9种数据生成方法,分别模拟满文字符图像的笔画粗细变化、扭曲变形、光照不均、不同视角及背景等情况下的采集效果.在满文识别的研究中,采用该方法将每个类别的字符数据量扩展到7万个.实验表明,该方法生成的数据在一定程度上弥补了训练样本不足的问题,是解决训练样本匮乏问题的有效技术手段.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要