基于进化策略的仿唐诗自动生成系统

基于进化策略的仿唐诗自动生成系统

论文摘要

诗歌是一种具有独特魅力的文学体裁,是人类文明的象征,用计算机模拟生成诗歌史自然语言生成领域的一大挑战。本文研究机器自动生成仿唐诗,对其可能性和具体实现方法进行详细的研究和讨论。研究内容主要有以下几大方面:1、总结和分类诗歌生成领域到目前为止的研究成果,对每种方法的主要步骤和代表性诗歌生成系统进行介绍。并简述中国古典诗词的计算语言学研究概况。2、建立唐诗语料库。将词句按格律细分为子句,统计子句字串,根据频率、共现度等参数抽取结合强度高的字串,结合各种已有的词典资源来建立唐诗词表。根据条件概率对已切分的唐诗进行注音,建立音韵数据库。3、根据唐诗建立相关的语法规范,用确定性自动机(DFA)进行词句语法合法性判断。计算语义度量:通过潜在语义分析和互信息计算词义相关度;通过词典和语料库统计相结合的方法计算词义相似度;成立专家组对高频词进行风格和情感的分级评判。4、基于进化策略建立仿唐诗生成模型。根据唐诗特点,编码方式是基于平仄规律的,适应度函数是基于语法和语义加权值的,选择策略是基于精英主义和轮盘赌算法的。各主要操作的实现步骤在文中都有详细介绍。5、建立基于进化策略的仿唐诗生成系统,包括给出系统框架、主要实现流程和具体的仿唐诗生成实例。并且对实验结果进行了分析和总结。实验结果表明,本文建立的计算模型和设计的系统基本上可以实现计算机自动生成仿唐诗的目标,为今后进一步的研究提供了理论和实验基础。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • Content
  • 第一章 引言
  • 1.1 研究的技术背景
  • 1.2 研究的内容与目标
  • 1.3 本文研究的主要贡献
  • 1.4 论文结构
  • 第二章 诗词生成及汉语计算诗学综述
  • 2.1 计算机诗歌生成综述
  • 2.1.1 随机词汇连接(Word Salada)
  • 2.1.2 基于模版的诗歌生成系统
  • 2.1.3 基于设定模式的诗歌生成系统
  • 2.1.4 基于进化算法的诗歌生成系统
  • 2.1.5 基于实例推理的诗歌生成系统
  • 2.2 汉语古诗词计算机辅助研究综述
  • 第三章 唐诗切分语料库及音韵数据库的建立
  • 3.1 全唐诗切分语料库的建立
  • 3.2 词库的词性标注
  • 3.3 词库的音韵标注
  • 第四章 语法规范的确立和语义度量的计算
  • 4.1 语法规则的判定
  • 4.2 词义相关度的计算
  • 4.2.1 利用潜在语义分析计算词义相关度
  • 4.2.2 利用互信息计算词义相关度
  • 4.2.3 计算结果的综合处理
  • 4.3 词义相似度的计算
  • 4.4 词的风格与情感意义标注
  • 第五章 仿唐诗生成的进化策略
  • 5.1 进化策略简介及适用性分析
  • 5.1.1 基本原理
  • 5.1.2 两种进化策略
  • 5.1.3 进化策略的基本思想
  • 5.1.4 进化策略执行过程
  • 5.2 编码方案
  • 5.3 初始种群的生成
  • 5.4 适应值函数
  • 5.5 选择操作
  • 5.6 重组算子
  • 5.7 变异算子
  • 第六章 仿唐诗生成的系统实现与实验结果分析
  • 6.1 系统框架
  • 6.2 进化策略流程及主要参数确定
  • 6.3 系统的实现与运行情况
  • 6.3.1 开发和运行平台
  • 6.3.2 系统生成实例
  • 6.4 系统性能评价及结果分析
  • 结论与未来展望
  • 参考文献
  • 攻读学位期间发表论文
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于进化策略的仿唐诗自动生成系统
    下载Doc文档

    猜你喜欢