文字识别:原理、方法和实践

作者:丁晓青 王言伟等

出版:清华大学出版社

年代:2017 更多图书信息

电子纸书:暂不销售 定价: ¥128 纸质书最低¥101.1起,点此购买

图书简介

本书基于模式识别和信息熵理论,全面、系统和深入地分析介绍了各种汉字、多文种文字识别的理论和方法,以及解决复杂多变的多文种文字和文档识别中关键问题的有效算法和具体实践。本书可以作为相关专业研究生的参考书,也可以供从事模式识别、文字和文档识别等计算机信息处理研究的科研人员和从事相关产品开发的工程技术人员阅读参考。

(展开)

编辑推荐

《文字识别:原理、方法和实践》一书围绕模式识别和文档信息化而展开。基于模式识别和信息熵理论分析,对文字和文档识别的理论和方法以及关键问题进行了较为深入、系统的分析和研究,并介绍了多种文字和文档识别方法和系统。

(展开)

目录

第1章 绪论
1.1 引言
1.2 文字和汉字
1.2.1 文字的代码表示
1.2.2 汉字的字体字形
1.2.3 汉字的特点
1.2.4 中文信息处理
1.3 文字识别和汉字识别
1.4 文字识别研究历程
1.5 文字识别分类
1.5.1 按照不同文种文字和文档的识别技术分类
1.5.2 按照获取图像方式和识别对象不同分类
1.5.3 单个字符识别和文档篇章识别
1.6 文字识别与笔迹鉴别
1.7 汉字识别的基本方法——基于视觉感知的汉字识别方法
1.8 关于本书
参考文献
第2章 模式识别和模式识别信息熵理论
2.1 引言:模式与模式识别
2.2 基于贝叶斯统计决策的模式识别
2.3 模式识别统一信息熵理论
2.3.1 特征和类别及其相关信息熵
2.3.2 后验熵:最优贝叶斯分类器误识率的上限
2.3.3 模式识别的学习与识别信息过程
2.3.4 互信息:决定模式识别性能的鉴别熵
2.4 正态分布条件下的模式识别信息熵系统
2.5 最大互信息鉴别分析(互信息鉴别子空间模式识别)
2.5.1 最大互信息子空间线性鉴别分析方法
2.5.2 最大互信息线性鉴别分析与线性鉴别分析LDA
2.6 特征选择的信息熵准则
2.6.1 基于错误概率的类别可分性准则
2.6.2 基于有效互信息的类别可分性准则
2.7 从信息熵分析看提高识别性能的途径
2.8 汉字集合和汉字文本的信息熵
2.8.1 汉字集合的信息熵
2.8.2 汉字文本的信息熵和汉字的极限熵
2.9 本章小结
参考文献
第3章 汉字识别的特征提取
3.1 引言
3.2 汉字字符图像规一化预处理
3.2.1 线性规一化
3.2.2 非线性规一化
3.2.3 基于整体密度均衡的非线性规一化
3.3 汉字识别中的特征抽取
3.3.1 结构特征
3.3.2 统计特征
3.4 汉字识别特征提取研究的发展历程
3.4.1 基于图像变换的印刷汉字识别特征和系统
3.4.2 基于形态学汉字结构分析的两级印刷汉字识别特征和系统
3.4.3 汉字笔画密度微结构全局特征及多字体汉字识别系统
3.4.4 基于汉字笔画方向网格特征的鲁棒汉字识别系统
3.5 笔画方向线素特征
3.5.1 方向线素特征的形成方法
3.5.2 网格化方向线素特征
3.5.3 对原模糊分块方法的改进——低通采样方向线素特征
3.5.4 实验和结果
3.6 基于Gabor滤波器的高性能汉字识别方向特征
3.6.1 Gabor变换理论分析
3.6.2 适用于汉字识别的Gabor滤波器组设计及实验验证
3.6.3 对Gabor滤波器组输出的非线性变换—
3.6.4 分块特征的抽取
3.6.5 实验及结果
3.7 汉字识别梯度方向特征抽取方法
3.7.1 梯度方向特征
3.7.2 梯度方向特征的快速算法
3.8 不同笔画方向特征的识别性能实验比较
3.9 本章小结
参考文献
第4章 特征的鉴别分析和分布整形
4.1 引言
4.2 线性鉴别分析
4.2.1 优化准则
4.2.2 变换形式和最优解
4.2.3 变换的分解形式
4.2.4 启发式讨论
4.2.5 实验与结果
4.2.6 小结
4.3 正则化线性鉴别分析
4.3.1 小样本带来的问题
4.3.2 利用正则化估计协方差阵
4.3.3 实验结果
4.4 异方差鉴别分析
4.4.1 基于极大似然估计的异方差线性鉴别分析
4.4.2 基于Chernoff准则的异方差线性鉴别分析
4.4.3 基于Mahalanobis准则的异方差线性鉴别分析
4.4.4 实验结果
4.4.5 小结
4.5 特征统计分布整形变换
4.5.1 特征分布的整形
4.5.2 正态性检验
4.5.3 Box—Cox变换
4.5.4 方向线素及梯度特征的整形
4.5.5 实验与结果
4.6 本章小结
参考文献
第5章 模式识别分类器设计/统计模式分类方法
5.1 引言
5.2 贝叶斯判决理论
5.3 正态分布下的贝叶斯分类器
5.3.1 正态分类模型
5.3.2 最小距离分类器MDC
5.3.3 线性距离分类器LDC
5.3.4 二次鉴别函数分类器QDF
5.3.5 二次鉴别函数
5.3.6 QDF误差分析
5.4 改进二次鉴别函数分类器MQDF
5.4.1 修正二次鉴别分类MQDF
5.4.2 QDF修正形式的贝叶斯估计推导
5.4.3 实验与结果
5.5 系统实现与应用
5.5.1 非限定脱机手写汉字识别系统
5.5.2 多字体印刷中、日、韩文识别系统
5.6 分类器的置信度分析
5.6.1 分类器的置信度和广义置信度
5.6.2 基于距离的分类器的广义置信度估计
5.6.3 多层前向神经网络分类器广义置信度估计
5.6.4 从广义置信度求置信度的方法
5.6.5 使用ACT估计后验概率
5.6.6 置信度分析在字符识别中的应用
5.6.7 小结
5.7 分类器集成
5.7.1 集成的3个层次
5.7.2 基于线性回归的多分类器集成
5.7.3 利用线性回归提高后验概率估计的准确性
5.7.4 后验概率的估计误差与误识率的关系
5.7.5 实验结果
5.7.6 小结
5.8 本章小结
参考文献
……
第6章 无约束手写汉字识别分类器鉴别学习
第7章 联机手写汉字识别
第8章 利用上下文信息的汉字识别后处理
第9章 脱机手写文档识别方法
第10章 文档版面自动分析和理解
第11章 蒙藏维多文种识别
附录A 常用缩略语表
附录B 文字识别相关研究成果
附录C 文字识别相关成果主要奖励
附录D 已授权文字识别相关发明专利
附录E 文字识别相关的博士论文
附录F 本书中算法研究相关数据库
索引
(展开)

书页展示

更多图书信息
数据来源于网络,如有问题,请反馈至此邮箱:service@bookask.com

作者:丁晓青 王言伟等
出版:清华大学出版社

ISBN:9787302454625

出版日期:2017-04-01

清华大学出版社

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。作为来自一流大学的出版单位,清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。目前,清华版教材已在全国一百多所院校得到广泛使用。高品质、多层次的计算机图书是清华大学出版社的一大品牌支柱。20世纪80年代末,在席卷全球的信息化浪潮中,清华大学出版社快速切入计算机图书市场,逐渐成为并一直保持这一市场的领先地位,为发展中国计算机教育做出了巨大贡献。

(展开)

作者信息

丁晓青 王言伟等

作者:丁晓青 王言伟等

(展开)

使用移动设备
扫描二维码下载客户端

注:目前仅提供安卓客户端下载

相关书卡
书卡里除了这本书,还有更多经典等你读!

Copyright ©2020  BookAsk 书问  |  京ICP证160134号   |  

京公网安备 11010802026432号

  |  出版物经营许可证新出发京零字第海150168号   |  营业执照:91110108318038279C   |  网站地图   |  关于我们   |  合作伙伴   |  商务合作   |  友情链接