当然,由于外交决策是一个特殊的领域,它所面对的并非普通大众,而是社会精英,因此它的数据库与那些面向消费大众的商业性数据库还是有差别的。外交决策的数据库不会收集所有民众的信息,而是收集那些与外交决策相关的社会精英的数据。与小数据时代不同的是,在大数据时代,关于社会精英的数据不再是随机样本,而是以分布式的方法同步建立相关社会精英的个人数据库,这些个人数据库里将储存着社会精英的所有信息资料。当这些个人数据库汇集成一个巨大的数据网络时就变成了大数据系统。外交决策大数据系统又根据数据分析的方法切割成各具特色的子系统,如以收集特定对象所有数据为主的静态系统,或以跟踪事物发展动向为主的动态系统。尽管中国是大国,财力物力和智力资源的基础十分雄厚,但在选取特定对象时不能面面俱到,而应选取最重要、最相关的对象建立数据分析系统。
对中国来说,美国的重要性毋庸置疑,因此可先考虑建立面向美国决策个体的外交决策静态数据系统,以此为样板,推广到其他国家。美国外交决策高层一般也就在1000人左右,包括536名国会议员。与对华决策相关的人员主要由国安会、国务院和国防部负责亚太事务的高级官员构成,这个名单不会超过100人。对外交决策层来说,了解这些对华决策官员的信息尤为重要。因此,大数据系统可从建立这些决策个体的数据库入手,层层切入、逐步完善。在这个决策个体数据库里面,储存着他们个人所有的数据,包括家庭、家族和家乡的背景资料、教育、社交、工作和从政生涯的背景资料,包括价值与利益取向、心理性格特征、健康状况、思维习惯、行为特点以及纳税申报状况的信息数据。在信息社会获取这些数据并非难事,基本上可以从公开渠道获得,如大众媒体、社交网络、学校医院、警察局和法院、图书档案馆、股票及房地产交易所、工商注册和选民登记机构、通讯公司、商业网站和公关公司等。另外可以考虑建立美国对华决策文本数据库,包括历届美国总统对华政策及其相关外交政策的文本;美国国家档案馆解密档案;历届美国国安会与国务院对华政策文本(为了避免与总统政策文本重叠,主要收集层级较低的数据);历届美国两党对华政策的公开辩论与党内文件;美国其他行政部门的对华政策文本。两大静态数据系统建立后,在此基础上建立动态数据库,追踪采集决策个体每日的行动踪影和行为轨迹,包括他会客的对象、接受采访的谈话、参加的重要会议、访问的地方、撰写的文章电邮以及批阅的文件等。这些数据可以通过机器人从网上抓取,然后经过编程自动进入大数据系统。各个学科的专家学者根据大数据系统的数据,对这些决策个体进行会诊,探究其对华决策的境遇,了解其在对华决策中的作用与立场。
总之,外交决策大数据系统建设应该立足于当下,着眼于未来。无论未来信息技术发展趋势如何,数据仍然是最重要的基础。大数据技术如果与其他技术如人工智能技术、数学建模、模拟技术、全球定位、地理信息技术、遥感技术和传感技术等技术相结合,定能让外交决策在新形势下如虎添翼,效率倍增。大数据系统建成之后,以大数据为基础的各种新型决策技术就有可能实现。如外交决策数据的“私人定制”。现在决策高层定期更换,新上任的领导在长年累月的磨砺中形成了自己的决策风格和知识结构,他们中的有些人在外交领域并非是行家。即使是外交部门出身的决策高层,也不可能样样精通,总有自己的知识短板。为了让他们尽快熟知外交决策环境,以便节省时间、提高决策效率,可适当运用大数据技术为其量体裁衣,定制外交数据。这是一项比较成熟的技术,在信息行业,许多软件记录了用户的个性使用习惯,便于软件智能识别,提高运行速度。例如,搜狗输入可以让用户建立个人的打字词库,扩大词汇联想;金山快盘可以让用户拥有私有云,保存私密性的档案资料。这些公司的方法很简单,只要通过电邮注册个人账号,计算机软件就能记录和辨别用户的行为习惯,甚至还会提供智能性的建议。因此,建立在大数据基础上的外交决策智能软件,犹如为决策高层配备了一个“外事秘书”,它记录了领导的行为方式,能够及时弥补领导的专业知识缺陷,能够准确无误地提供外交决策的数据尤其是那些常识性的数据。随着使用次数的增加,这个“外事秘书”越来越熟悉领导的行为方式或思维习惯,因而有可能提出一些具有高级智能的建议。此外,这个“外事秘书”自身也在不断学习,不停地知识更新。它还会与其他机器人“专家学者”交换信息,补充自己的专业知识。