中文词语时代特征的自动获取和语篇风格计算.doc

  • 需要金币500 个金币
  • 资料包括:完整论文
  • 转换比率:金钱 X 10=金币数量, 即1元=10金币
  • 论文格式:Word格式(*.doc)
  • 更新时间:2014-09-01
  • 论文字数:6719
  • 当前位置论文阅览室 > 原创论文 > 文学论文 >
  • 课题来源:(皇族girl)提供原创文章

支付并下载

摘要:时代特征是常见的词语附加义。时代特征能够体现词语所在时代的气息,人们能够根据已有的经验和知识获取词语时代信息,并进一步推断词语所在语篇的时代。计算机自动识别时代特征难度则很大。对此,我们提出了基于历时语料库的词语时代特征自动获取方法,提高计算机对社会体验的缺陷;使用TF-IDF算法为词语加权算分,量化词语的时代风格,并依此计算语篇的时代风格。我们以54年(1946-1999)的人民日报语料进行实验,取得了较理想的结果。

关键词:时代特征,语篇年代,语义计算

 

目录

摘要

ABSTRACT

1-引言-1

2-时代特征和动态流通语料库-1

3-语料来源和统计分析-2

3.1-语料来源-2

3.2-时代统计分析-3

3.2.1-年代高频词-3

3.2.2-月份高频词-3

4-基于TF-IDF的词语时代特征获取-4

4.1-TF-IDF-4

4.2-时代风格量化-4

5-语篇时代风格计算-6

6-结论及未来工作-7

7-谢辞-7

8-参考文献-8