統計語言學

維基百科,自由的百科全書

這是本頁的一個歷史版本,由Shizhao對話 | 貢獻2004年9月14日 (二) 08:27編輯。這可能和目前版本存在着巨大的差異。

(差異) ←上一修訂 | 最新修訂 (差異) | 下一修訂→ (差異)

統計語言學數理語言學的一個分支,是運用統計學的方法研究各種語言現象的學科。

18世紀時,開始用統計學來解釋語言的消失與保存。1880年代青年語法學派中的一些學者也使用過統計方法來研究語言。自發明計算機以後,統計語言學得到了迅速發展。

統計語言學主要研究:

  • 語言單位的出現頻率
  • 作家的用詞頻率、詞長分佈和句長分佈,以確定作家的寫作風格
  • 計算語言存在的絕對年代以及親屬語言從共同原始語分化出來的年代