神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:用大数据来分析某类人群并不是新鲜事,本文作者Dasha Metropolitansky就研究了亿万富翁的数量、地理分布、财富来源和净资产方面的趋势。她指出,过去20年间,亿万富翁的数量激增,亚洲富翁数量的增加令人瞩目,而美国则一直领跑全球。在净资产方面,发达国家的富翁要比发展中国家的更富有一些。而金融业则是造富最多的行业。原文标题What Data Tells Us about the World’s Wealthiest。
在哈佛大学的第一个春季学期里,我选修了一门名为“利用大数据解决经济和社会问题”的课程。我们探索的数个话题中,最有趣的话题之一是美国的机会平等。我们了解到,孩子挣得比父母多的机会并不一致:这取决于他们的种族、性别和成长地点。
这门课最主要的内容是研究低收入者的数据,分析其结果。而我对另一个极端很好奇:我想看看世界上最富有的人在数量、地理位置、财富来源和净资产方面的趋势。
图片来源:《福布斯》(Forbes)
我发现了彼得森国际经济研究所(Peterson Institute of International Economics ,PIIE)的研究人员创建的一个数据集,该数据集使用了1996年至2016年《福布斯》全球亿万富翁排行榜的数据。PIIE的研究人员表示:
1996年到2010年的数据包括全球亿万富翁的姓名、排名、国籍和净资产。2011年起的数据增加了财富的来源,以特定的公司或更广泛的行业列入名单。
PIIE的研究人员在《福布斯》的数据中加入了几个变量:亿万富翁的年龄、1996年的净资产(考虑到通货膨胀)、他们国家的GDP和经济发展水平。
除了原始数据集中已有的三位数国家代码之外,我还为大洲和国家名称创建了变量。
以下是我的发现。
过去20年里,亿万富翁的数量翻了两番
图片内容:世界上亿万富翁的数量(1996-2016)
显然,从1996年到2016年,全世界的亿万富翁人数激增(更准确地说,增加了396%)。但增长的轨迹并非一条直线:2000年以前增长几乎停滞,2001年互联网泡沫破裂以及2008年金融危机这两个时间节点之后立即出现负增长,尤其以后者最为明显。
美国一直是亿万富翁数量最多的国家(和地区)
图片内容:亿万富翁最多的10个国家(和地区)排名
这幅动图显示了1996年-2016年间,亿万富翁数量最多的十个国家(和地区)排名。最令人瞩目的发现是:在整个统计周期内,美国丝毫不令人意外地保持了“拥有亿万富翁最多的国家(和地区)”这一称号,即使考虑到人口规模的差异,美国亿万富翁的数量也远多于紧随其后的几个国家(和地区)。除了1999年和2000年两年意外,美国的亿万富翁数量至少是其他国家的2.5倍。然而,这一差距正在慢慢缩小,很明显,中国正在追赶美国:中国在2008年首次上榜(排名第5),自2013年以来一直位居第二。
关于这个榜单,有不少有趣的观察结果:
上榜国家(和地区)总数共19个。
自1997年以来,每年都榜上有名的国家(和地区)只有美国、德国、香港和英国。
该排名反映了日本经济的逐渐下滑:2006年之前,日本一直排在前五名,随后连续几年跌至榜单的后半部分,2011年跌出榜单。
自2005年以来,印度一直名列前茅(通常徘徊在第4-6位)。
自2003年以来,俄罗斯一直排在前5位,尽管自2014年美国和欧盟对其实施制裁以来,俄罗斯亿万富翁的数量大幅减少。
出于我的个人兴趣(和自豪),我要指出:加拿大自1999年以来几乎每年都榜上有名。
亚洲的亿万富翁人数增长最快
图片内容:各大洲亿万富翁数量(1996-2016)
亿万富翁数量增长最快的两个地方是亚洲和美洲,就时间来看,增长最快的是2008年以后。有趣的是,在2000年之前,美洲和欧洲的亿万富翁数量相差不大,但在2000年后,这两个国家的亿万富翁数量突然出现了显著的差异。自那以后,它们的增长波动情况相似,但美洲仍明显高于其它地区。
同样令人惊讶的是,尽管非洲在过去20年间取得了巨大的经济增长,但非洲亿万富翁的数量却一直很少。
发达国家的亿万富翁比发展中国家的亿万富翁更富有
图片内容:发达国家和发展中国家亿万富翁的总净资产对比
2003年之后,亿万富翁的总资产净值飙升,尤其在新兴经济体中,几乎呈指数级增长。直到2008年金融危机爆发,这一数字大幅下降。然而,2010年之后,亿万富翁们逐渐恢复元气,他们的净资产开始再次增长,尽管那些来自发展中国家的亿万富翁资产增速明显放缓。
自2000年以来,全球有超过25%的亿万富翁,其财富来自金融业
图片内容:不同行业的亿万富翁占比
该数据集将亿万富翁的财富来源分为以下6类:
资源行业:能源(不含太阳能和风能)开采、冶金等;
新技术行业:计算机技术、软件、医疗技术、太阳能和风能、制药等;
非贸易行业:零售、娱乐、传媒、电信、建筑、餐饮及其他服务业;
金融行业:银行、保险、对冲基金、私募股权、风险投资、投资、多元化财富、房地产等;
贸易行业:农业,消费品,航运,制造业等;
其他行业:教育、工程、体育基建所有权、无法分到上述几类的其他财富。
尽管大多数亿万富翁的财富一直以来主要来自金融业,但自2008年达到顶峰以来,这一比例一直在稳步下降。另一方面,自2008年以来,来自“新技术行业”和贸易行业的亿万富翁比例一直在持续上升。
不完美的数据集
需要注意的是,这个数据集并不完美。PIIE的研究人员指出了它的一些缺陷:
缺失的数据
报告的亿万富翁人数可能与世界上实际的亿万富翁人数存在差异,因为一些亿万富翁可能更愿意对自己的财富规模保密……
很多私人公司可能被忽视,至少在公司上市或创始人去世等新闻出现之前确实被忽视了。
没能上榜的还有一类人:收入来源非法,包括腐败的政府官员以及毒枭。
样本不一致的报告
《福布斯》这个数据集的另一个缺点是,它对部分样本财富范围的报告不一致。在1996年和2001-14年,亿万富翁只指代个人,除非‘兄弟姐妹之间的所有权划分不清楚’……然而,从1997年到2000年,这份名单按家庭对亿万富翁进行了汇总。
由于这些缺陷,我的分析低估了亿万富翁的数量和他们的总净资产,因而,一些国家和地区的结果不那么准确。
还有一个缺陷是,由于数据质量不够高,我所做的一些分析指向了误导性的结果,所以我选择删掉这些分析。例如,亿万富翁的平均年龄或年龄中位数随时间变化的图表是不准确的,因为很大一部分亿万富翁的年龄被错误地列为0岁(至少我认为这是不正确的……),或者说,他们的年龄在数据集中缺失。
我还想再画一个图表,显示每年新增亿万富翁的数量。但由于未来几年,当前的亿万富翁不太可能从名单上消失,这一数量被夸大了。然而,正如PIIE的研究人员所指出的,那些从私人公司获得财富的人,只有在《福布斯》发现任何关于他们净资产的数据时,他们才会被列入榜单(例如,只有当公司上市时,或者当创始人去世、有人继承了他们的财富时,这个数据才会被公之于众)。这意味着,有些亿万富翁首次上榜的时间要比他们真正成为亿万富翁的时间晚上几年,从而导致“新亿万富翁”这一数据统计结果不准确。
关于世界上的亿万富翁,我们还有很多需要了解的地方。我很好奇,随着时间的推移,性别和年龄的分布发生了怎样的变化,是有更多“白手起家”的亿万富翁,还是更多财富的继承者们。希望随着数据的增多,我们可以开始回答这些、以及更多问题。
你可以在RPubs post和Github repo上找到我所有的数据和代码。
我在这篇文章中引用的PIIE研究是由Caroline Freund和Sarah Oliver合作撰写的题为“超级富豪的起源:亿万富翁特征数据库”的论文。
译者:喜汤