不用猜 我知道

01
许锋 国家会议中心副总经理


今天写个奇葩的,给大家贡献一个类科普的东西。之所以说是类科普,是因为有点儿道理。

有一个“异夫规律”(Zipf’s Law)。先介绍这个叫异夫(George Kingley Zipf)的人。此君1929年毕业于哈佛大学,拿的是比较文学博士学位,后来在哈佛大学教德语,还研究深奥的汉语和人口学。显然,他是一个文科男。

二十世纪四十年代,一群威斯康星大学的学者盯上了名著《尤利西斯》,他们花了一年多的时间把这篇小说从头到尾打印在硬纸板上,把每一个词都剪下来,把相同的词,比如“the”粘在一起,然后数出每一个词汇出现的频率。看,八十年前就有人在玩大数据了!

这个发现引起了异夫的兴趣,他琢磨出里边暗藏玄机。

这本小说中,第一人称大写“I”出现的频率排名第10,在全书中共出现了2653次。“say”这个单词共出现了265次,排名第100。“bag”出现的频率排名是第1000,共出现了26次。排名第10,000的是“orangefiery”(这个词在字典中查不到,orange是橙子,fiery的意思是火红的、暴躁的、辣的),在书里只出现了2次。

02

异夫发现,某个词汇出现的频率排名和这个词出现的次数的乘积几乎是一个常数,如上面的表格所示。第10名出现的次数是第100名的10倍,第1000名的100倍,第10000名的100倍。倒过来算,第2名出现的次数大约是第1名出现次数的1/2,第3名出现的次数大约是第1名出现次数的1/3……后来,人们发现,英语中出现最多的是“the”,第2名是“of”,第3名是“and”。“the”出现的频率是7%,而“of”出现的频率正好是3.5%。

“异夫规律”不仅适用于英语,还适用于其他语言,包括伟大的中文。

异夫老师根本停不下来了,他发现1940年美国人口调查结果中的城市人口竟然也符合“异夫规律”—-一个城市的大小排序和其人口数量的乘积也几乎是一个常数。

1906年,意大利经济学家帕累托就指出,在意大利,20%的人拥有80%的土地。有名的“二八”法则就是发端于此。其实,“异夫规律”和“20/80法则”说的是同一件事,即:一个变量和另一个变量的幂成反比,这就是“幂定律”。幂定律无处不在,比如,时时刻刻都有小的地震,但我们无法感知,大地震次数极少,但一旦袭来,就引发巨大的灾难。

好了,科普铺垫这么多,该说正题了。

我们知道,北京的会展业数据是目前国内唯一由地方统计局发布的官方统计,其他地方的会展业数据都不如北京来得更权威。根据北京2015年的统计年鉴,2014年北京举办了23.1万个会议,会议总收入是102.2亿元,奖励旅游收入8.1亿元,两者合计110亿元。

请注意,我们这里没有用省市自治区这个类别。我们仅比较城市,因为如果用省市自治区的概念,广东显然是GDP排名第一,但我们苦于没有广东省会议业的官方统计。

假设(仅仅是假设啊)一个城市的会议数量和排名的乘积也大约是一个常数,北京会议数量全国第一,大家对这个应没有异议。

01

(上海市旅游局、杭州市旅委、杭州市会展办、成都博览局不要打我哦,还是应该打赏我?)

有了一个确定的参考物及其排序,同类企业的数值,如收入、利润等就基本上就可以算出个八九不离十。

钟兵你老自夸你的发行量最多,你这本杂志经BMP认证的发行量是2.05万本,那么第二名的真实发行量大概就是1万本。我对这个不感兴趣,我想知道你一年下来利润是多少,这样第二名第三名的利润多少就暴露无遗了,如果你的广告价要是便宜一点的话,你的利润(主动)下降10%,第二名第三名的利润减少的幅度就是惊人的。

当然,“异夫规律”无法用来解释很多事情,比如我拿这个去推算国际大会及会议协会(ICCA)的国家数据和国家排序,就不灵光。无论如何,“异夫规律”、“20/80”法则,预言的是一个趋向极端的世界,少数统治多数,少数压倒多数。寡头就是这样的少数。

(此文受何帆的《先放一把火》书中的“异夫的世界”一文启发而写)