统计语言学

维基百科,自由的百科全书

这是本页的一个历史版本,由Shizhao留言 | 贡献2004年9月14日 (二) 08:27编辑。这可能和当前版本存在着巨大的差异。

(差异) ←上一修订 | 最后版本 (差异) | 下一修订→ (差异)

统计语言学数理语言学的一个分支,是运用统计学的方法研究各种语言现象的学科。

18世纪时,开始用统计学来解释语言的消失与保存。1880年代青年语法学派中的一些学者也使用过统计方法来研究语言。自发明计算机以后,统计语言学得到了迅速发展。

统计语言学主要研究:

  • 语言单位的出现频率
  • 作家的用词频率、词长分布和句长分布,以确定作家的写作风格
  • 计算语言存在的绝对年代以及亲属语言从共同原始语分化出来的年代