Zipf定律

资料百科

Zipf定律可以表述为在自然语言的语料库里,一个单词出现的次数与它在频率表里的排名成反比乡时。Zipf定律是美国学者G.K.齐普夫1935年提出的。

  • 中文名称 Zipf定律
  • 属性 Zipf
  • 性质 定律
  • 发现年份 1935年

Zipf来自定律描述

  1935年,哈佛360百科大学的语言学专家Zipf在研款将考花拿表眼特送究英文单词出现的频率时,发现如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的频率与它的名次的常数次幂存在简单的反比关系,这种分布就称为Zipf定律,它表明在英语单词中,只有极少数的词被经常使用,助践令政最丰倒商修而绝大多数词很少被使用.实际上,包括汉语在内的许多国家的语言都有这种特点。这个定律官国后来在很多领域得到了同样的验证,包括网站的访问者数量、城镇的大小和每个国家公司的数量。

Zipf其人

容冲活造饭顶击  George Kingsley Zipf 1902年1月出生于一个德裔家庭(其祖父十九世纪中叶移居美国)。1924年,他侵坏远亮以优异成绩毕业于哈佛学院。1925年在德国波恩、柏林学习。1929年完成Relative Frequency as a Determinant of Phonetic Change,获得哈佛比较语文学博士学位。然后,他开始在哈佛教授德语。1931年与Joyce Water我线值督s Brown结婚。1932年出版Selected Studies of the Principle of Relative Frequency in Language。1935年出版The Psycho- Biology of Language:An Introduction to Dynamic Philo牛想万成蛋等航属护logy。1939年被聘为讲师。1949年出版H善条伤划先刚uman Behavior and the Principle of Lea边价黑st Effort:An Introdu从强何绿京轴ction to Huma本老春n Ecology关属唱需聚附控静弦才创。1950年9月因患癌症病领市直父型案顶石初卫逝。(Prün & Zipf 2想永息早002)

Zipf应用

  相信你一定听过这样的说法:

  80%的财富集中在20%的人手中……

  80%的用户只使用20%的功能……

  20%的用户贡献了80%的访问量……

  …………

  你知道我在说"二八原则"或"20/80原则",是的,没错!

  -----------

  如果把所有的单词(字)放在一起看呢?会不会20%的词(字)占了80%的出农铁在期准保该细益现次数?答案是肯定的。

  早在上个世纪30年代,就有人(Zi来自pf)对此作出了研究,并给出了量化的表达--齐普夫定律(Zipf's Law):一个词在一个有相当长度的语篇中的等级序号(该干婷告初充去地难词在按出现次数排360百科列的词表中的位置,他称之为rank,简称r)与该词的出现频率(他称为frequency,简称f)的乘积几乎是一个常数(constant,简称C)。用公式表示,就是 r × f = C 。

  Zipf定律是文献展李执毫室部反来乙可计量学的重要定律之一,它和洛特卡定律、布拉德福定律一起被并称为文献计量学的三王治感大定律。

  Zipf的专业是比较语文学,但是,以其名字命名的定律却早已走出语言学,进入了信息学、计算机科学、企它量依利经济学、社会学、生物学、地理学、物理学等众多研究领域 ,在学术界享有极高的声誉。

  齐夫定律已经在语言学、情报学、地理学、经济学、信息科学等领域有车指革起率鸡药必每了广泛的应用,而且取得了不少可喜成果。中国数学家和语言学家周海中曾经指出:齐夫定律是描述玉起标某卷营宣序从地词频分布规律的强大数学工具;作为经验定律,它仍有不足之处,有待进一步完善。

标签:
声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:yongganaa@126.com

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:yongganaa@126.com