海量媒体报道与政治经济复杂性


海量媒体数据源

LexisNexis News简介

    www.lexisnexis.com是一个通过海量媒体提供法律与新闻服务的咨询公司, 其新闻来自世界各地9000多个资料来源,涵盖全球知名的新闻报纸、时事通讯、杂志、贸易期刊、电信和广播媒体的报道,如《华尔街日报》、 《纽约时报》、《国际先锋论坛报》、《日经新闻周刊》、 《南华早报》、《海峡时报》、CNNBBC等,也包含大量非英语的新闻来源,如德文、法文、意大利文、西班牙文、丹麦语等,因而宣称世界第一。 基本付费用户可以根据关键词、新闻来源与时间查找新闻原文, 但一次查询数量不能超过3000条。

GDELT简介

    GDELT(Global Database of Events, Language, and Tone)是一个 TB量级,基于新闻媒体报导的免费的关于全世界所有重要人类社会活动事件集的库。 GDELT收集的新闻事件覆盖了全世界绝大部分的英语和非英语(65种语言)国家和地方新闻媒体的报道,而且覆盖的地理范围和语言种类仍在不断增加。GDELT搜集了从 1979年 1月1日至今,来自世界上超过 3亿条的新闻事件,并且,数据库现在已实现每 15分钟更新一次。事件分成20类,每类包含几个至几十个独立事件。 每个事件涉及时间、地点(GIS坐标)和两个 actor,如美国和中国, 并有很多属性,包括Average Tone 和 Goldstein scale。后者刻画两个 actor之间合作或冲突的程度,其中,正分表示合作,负分表示冲突。 如下图所示,其数据量远超LexisNexis News,且与经济数据密切相关。

GDELT的数据量远超LexisNexis News




GDP与各国GDELT新闻报道数的关系

    以下散点图每个圈表示一带一路沿线72国中的69国(除黑塞哥维那,黑山共和国, 斯洛文尼亚外),从图中可以看出,经济总量与GDELT媒体报道数(对数坐标)呈较强的相关性。因此深入研究GDELT的新闻报道可以推断各国政治经济的复杂性