编辑: xiong447385 | 2017-09-24 |
事实上,现在大 多数的社会网络研究的框架都可以追溯到埃尔德 什40 年代关于随机图的研究,特别是他和匈牙利 数学家瑞尼(Alfréd Rényi)合写的那篇独创性的文 章《随机图的演化》1 .另一方面,我们要感谢埃尔 德什生前和约五百名合作者共同发表的庞大数目的 数学文章,大约
1500 篇.这惊人的数字刺激了数学 家们在他们的合作活动中寻找相连性,并逐步将它 们升华成数学问题来探讨.数学家戈夫曼(Casper Goffman)1969 年发表在《美国数学月刊》上的一篇文章
2 正式定义了数学家们早已使用 的专用词汇――埃尔德什数(埃数) (Erd?s Number) .严格的定义是这样的 : 保罗 ? 埃尔德 什本人的埃数是
0 ;
他的每一位合作者的埃数是
1 ;
埃数
1 的合作者,但又没有与埃尔德 什合作过的人,拥有埃数 2,并以此类推.如果找不到某人和埃尔德什任何一个层次的合 作者有关系的话,那么此人的埃数是无穷. 美国数学会出版的《数学评论》 (Mathematical Reviews)杂志在互联网上提供了 自1940 年起正式发表过的所有数学文章的准确数据库(以下简称"MR 数据库" ,译者 埃尔德什画像 Jerrold Grossman /文赵京/译 你的埃尔德什数是几? ―― 数字背后的人际网络图 数学文化/第5卷第4期75 数学经纬athematics Stories 注) . 通过 MR 数据库里的信息(本文数据是基于
2004 年的一项研究,我们感谢美国 数学会提供此项数据) ,我们不难发现由埃尔德什合作衍生出的有趣现象,下面我们就 用数学语言来描述一下.假设让字母 B 代表一个二分图(Bipartite Graph) ,图上一部 分的点(Vertices)代表 MR 数据库里的所有文章(文章点) ;
图上另一部分的点代表 MR 数据库里的所有作者 (作者点) ;
每一篇文章和它的每一位作者之间用一条线 (Edge) 相连(相连线) .那么,这样画出的 B 有大约
190 万个文章点 ;
40 万个作者点 ;
290 万 条相连线.通过 B 可以算出 MR 数据库里每位作者平均发表
7 篇文章,标准差是 18. 大学终身职位评估委员会可能更愿意了解作者发表文章数的中位值,它是 2.事实上, MR 数据库里 42% 以上的作者只发表过一篇文章 ;
40% 的作者发表过
3 篇以上的文章 ;
30% 的作者发表过至少
4 篇文章 ;
20% 的作者发表过至少
8 篇文章 ;
10% 的作者至少 发表过
18 篇文章 ;
5% 的作者至少发表过
32 篇文章.现在,让我们从另一个角度来看 看这组数据.二分图 B 显示每一篇发表的文章平均有 1.5 位作者 ;
大约 62% 的文章只 ? 1?90?40??? ? ????????7??? ? 42%??????? ??1??? ? 10%??????? ?18??? ? 5%??????? ?32??? ? ???????1.5??? ? ??62%???? ?1??? ? 8%????3?? ? ? 2%????4?? ? ? ? B ??290? 每篇文章平均有 1.5 位作者 每位作者平均发表
7 篇文章 大约 62% 的文章 只有
1 位作者 42% 的作者终生只 发表过
1 篇文章 8% 的文章有
3 位作者 2% 的文章有
4 位作者 约有
290 万条连接文章 点和作者点的相连线 10% 的作者发表 过至少
18 篇文章 5% 的作者发表过 至少
32 篇文章 文章点 (约190 万个) 作者点 (约40万个) 二分图 B 数学文化/第5卷第4期76 数学经纬athematics Stories 有1位作者 ;