中国数字书法检索与作品真伪鉴别的研究

中国数字书法检索与作品真伪鉴别的研究

论文摘要

数字化技术和数字存储技术的发展推动了中华民族五千年文化遗留下来的书法作品的数字化进程。原始的历史书法作品每件都是唯一的,存在于纸张、石头、绢丝或者竹简上,因容易破损而珍藏在博物馆里不允许随便翻阅。数字化使历史书法作品拥有数字形式的备份,得以在数字图书馆中长久保存,使用户能随时、随地、随意地浏览和欣赏民族文化瑰宝,更好地传承了民族文化。 然而,数字化书法作品同时也带来了新挑战:在当前OCR技术无法将书法字识别成文本从而进行检索的情况下,如何为这些作品提供有效的检索服务?在当前依靠主观经验难以人工鉴别大数据量数字书法作品真伪的情况下,如何在计算机辅助下为书法作品真伪鉴别提供客观、量化的评判? 本论文的目的是提出数字书法处理的理论、方法和技术,研究如何在不识别书法字的情况下检索书法字,研究如何提高数字图书馆中大数据量书法字检索速度,探索如何结合图像处理技术和人工智能技术以底层图像特征量化表达高层语义(书法风格)特征,从而辅助进行书法作品的真伪鉴别。主要完成了如下工作: 1.基于形状的书法字检索。提取书法字轮廓特征,在不对书法字图像进行识别的情况下而直接根据样例检索书法字。其思路在于构造书法字形状矩阵,检索在形状上与样例相似的书法字。对检索目标不在书法数据库中的情况,提出并展示了合成用户所需风格的新书法字的方法。 2.书法字快速检索。系统响应时间对拥有大数据量书法作品的数字图书馆至关重要,本文提出了三种加快书法字检索速度的途径:通过先粗略剪枝后精确匹配的方案缩短总体计算时间;通过动态投影时序校准算法、支持不等长序列的2D动态校准算法,缩短匹配算法所需的计算时间;采用高维索引的PK树索引书法字的高维特征,加快存取和查找的时间。 3.书法风格学习。书法风格是描述书法字、辨别不同书法家作品的关键,因此本文采用机器学习的方法,描述了如何用底层图像特征量化表征高层书法风格特征;其思路在于,从书法字的笔划形态特征和结体形态出发,统计和分析不同书法家书法字的稳定性书写特征,提出了个性风格特征的选取及其权重计算方法,构造了个性风格特征向量。 4.书法作品真伪鉴别。与数字图书馆书法收藏联系在一起的是书法真伪鉴别,因此本文提出了计算机辅助书法作品真伪鉴别的系统框架、工作原理;提出针对可疑作品所宣称的作者构造真迹模型的方法,对比分析真迹模型与可疑作品的每一个特征,检测可疑点并给出作品是真迹的可能性概率,同时提供量化的“可怀疑证据”及置信度。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第1章 绪论
  • 1.1 研究动机
  • 1.2 研究问题
  • 1.3 论文组织
  • 1.4 本文贡献
  • 第2章 相关研究综述
  • 2.1 中国书法字检索相关研究
  • 2.1.1 手写体识别技术
  • 2.1.1.1 识别原理
  • 2.1.1.2 字符自动切分
  • 2.1.1.3 手写汉字识别
  • 2.1.2 基于形状的图像内容检索
  • 2.1.2.1 基于轮廓的形状表征
  • 2.1.2.2 基于区域的形状表征
  • 2.1.2.3 形状匹配算法
  • 2.2 书法作品真伪鉴别相关研究
  • 2.2.1 书法作品鉴定
  • 2.2.1.1 鉴定现状
  • 2.2.1.2 存在的问题
  • 2.2.2 签名笔迹鉴定
  • 2.2.2.1 工作原理
  • 2.2.2.2 离线笔迹鉴定依据
  • 2.2.2.3 离线笔迹鉴定方法
  • 2.3 小结
  • 第3章 书法字形状特征提取
  • 3.1 引言
  • 3.2 预处理
  • 3.2.1 数据获取
  • 3.2.2 去噪
  • 3.2.3 平滑
  • 3.2.4 版面分析
  • 3.3 页面切分
  • 3.3.1 部首块合并
  • 3.3.2 噪声块剔除
  • 3.3.3 粘联书法字切分
  • 3.4 归一化
  • 3.5 特征提取
  • 3.5.1 书法字类型判别
  • 3.5.2 轮廓描述子
  • 3.5.3 特征降维
  • 3.6 小结
  • 第4章 基于形状的书法字检索
  • 4.1 引言
  • 4.2 形状匹配算法
  • 4.2.1 投影降维法
  • 4.2.2 内嵌降维法
  • 4.2.3 推土机原理
  • 4.3 基于轮廓点的形状描述
  • 4.4 形状矩阵
  • 4.4.1 矩阵构造
  • 4.4.2 矩阵降维
  • 4.5 相似度量算法
  • 4.6 书法字的检索
  • 4.6.1 检索结果
  • 4.6.2 实验分析
  • 4.7 书法字合成
  • 4.7.1 问题的描述
  • 4.7.2 弹性变形模型构造
  • 4.7.3 对应点预测
  • 4.7.4 形变块匹配
  • 4.7.5 实验分析
  • 4.8 小结
  • 第5章 书法字快速检索
  • 5.1 引言
  • 5.2 剪枝算法
  • 5.2.1 阈值参数估计
  • 5.2.2 鉴别力算子
  • 5.2.3 复杂度指数
  • 5.2.4 笔划密度
  • 5.2.5 最左突起
  • 5.3 动态投影时序校准
  • 5.4 动态 2D不等长时序校准
  • 5.5 高维数据索引
  • 5.6 实验分析
  • 5.6.1 基于复杂度指数的裁剪
  • 5.6.2 基于最左突起的裁剪
  • 5.6.3 基于笔划密度的裁剪
  • 5.6.4 基于动态投影时序校准的裁剪
  • 5.6.5 动态 2D不等长时序的校准
  • 5.6.6 总体改进效果
  • 5.7 小结
  • 第6章 书法风格的学习
  • 6.1 引言
  • 6.2 基于规则的书法字笔划提取
  • 6.2.1 骨架跟踪与关键点检测
  • 6.2.2 轮廓跟踪与拐点检测
  • 6.2.3 笔段生长与合并
  • 6.3 书法字笔划形态特征
  • 6.3.1 类型识别及链码表示
  • 6.3.2 笔划形态特征
  • 6.3.2.1 笔划熵
  • 6.3.2.2 笔宽及笔压
  • 6.3.2.3 斜率和曲度
  • 6.3.2.4 仰角及扰度
  • 6.3.2.5 抖动及曲势
  • 6.3.2.6 横竖笔粗细比
  • 6.3.2.7 横竖笔笔划类型
  • 6.4 书法字结体形态特征
  • 6.4.1 结体形状
  • 6.4.2 重心位置
  • 6.4.3 几何矩分布
  • 6.5 个性风格特征向量
  • 6.5.1 个性特征的选取
  • 6.5.2 特征权值的估计
  • 6.5.3 风格特征向量构造
  • 6.6 小结
  • 第7章 计算机辅助书法作品真伪鉴别
  • 7.1 引言
  • 7.2 鉴别的工作原理
  • 7.2.1 系统框架
  • 7.2.2 工作流程
  • 7.3 真迹模型构造
  • 7.3.1 数据的获取
  • 7.3.2 风格特征的选取
  • 7.3.3 特征权重的估计
  • 7.3.4 比例增量训练
  • 7.4 作品的真伪判断
  • 7.4.1 特征诊断函数
  • 7.4.2 Takagi-Sugeno塑模法
  • 7.4.3 判定函数
  • 7.5 实验评估
  • 7.5.1 阈值选择
  • 7.5.2 工作性能
  • 7.5.3 损失范围估计
  • 7.5.4 置信区间
  • 7.6 小结
  • 第8章 系统构造及在数字图书馆中的运行结果
  • 8.1 系统简介
  • 8.2 页面切分
  • 8.2.1 按钮的功能描述
  • 8.2.2 切分例子
  • 8.3 书法数据库构建
  • 8.3.1 书法检索数据库
  • 8.3.2 作品真伪鉴别数据库
  • 8.4 书法跨媒体综合检索
  • 8.4.1 查询意图多模态表达
  • 8.4.2 检索结果多类型浏览
  • 8.5 书法作品真伪鉴别
  • 8.5.1 可疑作品的输入
  • 8.5.2 鉴别结果的浏览
  • 8.6 小结
  • 第9章 结论与展望
  • 9.1 结论
  • 9.2 展望
  • 参考文献
  • 攻读博士学位期间发表的论文及科研情况
  • 致谢
  • 相关论文文献

    • [1].国际研究数字图书馆——美国海外研究的资源宝库[J]. 数字图书馆论坛 2013(03)
    • [2].古腾堡项目——数字图书馆的先驱者[J]. 数字图书馆论坛 2013(04)
    • [3].《数字图书馆论坛》2014年征稿启事[J]. 数字图书馆论坛 2014(04)
    • [4].《数字图书馆论坛》2014年征稿启事[J]. 数字图书馆论坛 2014(03)
    • [5].《数字图书馆论坛》2012年总目录[J]. 数字图书馆论坛 2013(01)
    • [6].国际儿童数字图书馆——探索儿童书籍的世界[J]. 数字图书馆论坛 2013(12)
    • [7].数字图书馆的内涵[J]. 数字图书馆论坛 2014(02)
    • [8].《数字图书馆论坛》2014年征稿启事[J]. 数字图书馆论坛 2014(05)
    • [9].发挥市场在数字图书馆中的作用[J]. 数字图书馆论坛 2014(09)
    • [10].《数字图书馆论坛》2014年征稿启事[J]. 数字图书馆论坛 2014(09)
    • [11].《数字图书馆论坛》2015年征稿启事[J]. 数字图书馆论坛 2014(11)
    • [12].浅谈数字图书馆的建设[J]. 内蒙古图书馆工作 2013(04)
    • [13].高校数字图书馆建设的认识与探索[J]. 内蒙古图书馆工作 2008(04)
    • [14].论信息社会中的数字图书馆[J]. 内蒙古图书馆工作 2010(01)
    • [15].浅议数字化图书馆的建设[J]. 内蒙古图书馆工作 2010(04)
    • [16].区域数字图书馆的个性化服务[J]. 内蒙古图书馆工作 2009(02)
    • [17].网格技术的应用与数字图书馆建设[J]. 内蒙古图书馆工作 2009(04)
    • [18].数字图书馆的意义与特征[J]. 内蒙古图书馆工作 2009(04)
    • [19].基于3G环境的移动数字图书馆架构研究[J]. 浙江高校图书情报工作 2011(06)
    • [20].数字图书馆建设中的著作权保护探讨[J]. 内蒙古图书馆工作 2015(03)
    • [21].浅论数字图书馆建设[J]. 福建图书馆理论与实践 2009(03)
    • [22].浅谈数字图书馆存储建设[J]. 内蒙古图书馆工作 2010(03)
    • [23].浅谈数字图书馆建设[J]. 内蒙古图书馆工作 2010(03)
    • [24].浅谈数字图书馆建设[J]. 内蒙古图书馆工作 2008(01)
    • [25].鄂尔多斯市图书馆数字图书馆建设[J]. 内蒙古图书馆工作 2013(03)
    • [26].铁路企业数字图书馆建设初探[J]. 西铁科技 2009(04)
    • [27].分析影响数字图书馆建设的因素[J]. 内蒙古图书馆工作 2013(03)
    • [28].复合图书馆——数字图书馆建设的新战略[J]. 内蒙古图书馆工作 2015(Z1)
    • [29].数字图书馆环境下青年馆员的继续教育[J]. 浙江高校图书情报工作 2009(01)
    • [30].浅谈构建数字图书馆的必要性[J]. 内蒙古图书馆工作 2008(02)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    中国数字书法检索与作品真伪鉴别的研究
    下载Doc文档

    猜你喜欢