我是谁?数据与DNA解答人类大困惑

导读:据国外科技媒体TheVerge报道,对人类祖先的永恒探求正走向结局。

系谱学(搜寻并考证人类祖先)的下一阶段,将很快得到实现。大量累积的、数字化的可访问数据结合DNA检测的最新进展,意味着人类对家庭的困惑——他们是谁?他们怎样到达这里?他们如何关系到我们?——这些很快能得到解答。实际上,对家族史(假定家族史存在)的追求不会超过20年:大部分的奥秘正在快速消亡。

因此,我们是谁?我们怎么到达这里?我们从何而来?我们去往何处?

上帝之子

对祖先的兴趣可以追溯到历史本身,但对于地球早期的人类来说,只有皇室和超级富豪才能研究血亲家系,目的是巩固权力与财富。然而,现代爱好者家谱目前的做法,则植根于1845年在波士顿创立的新英格兰历史家谱协会,使用家庭“树”推广系统图表。19世纪20年代John Farmer发展了家庭树,并沿用至今。在接下来的10年,类似协会在纽约建立,之后,寻找与开国元勋和其他革命战争人物间的关系十分普遍。“当美国革命之女创建后,五月花协会也随之创建,”托马斯·麦克恩特说,“这就是我所说的系谱学的第一阶段”。美利坚联邦共和国一成立,美国的系谱学就随之应运而生。

新英格兰历史家谱协会成立后不到50年,美国系谱学领域最重要的角色诞生了,就是西部的盐湖城。

托马斯·麦克恩特表示,盐湖城是家族史研究的“麦加”圣地。因为,盐湖城也是耶稣基督后期圣徒教会及其家庭史图书馆的所在地,教会创建于1804年,是犹他州家谱协会;家庭历史图书馆这是系谱学界最大的图书馆,而其在线门户网站FamilySearch,日均浏览量约为1000万。

摩门教的基础教义之一即是家谱

1847年,杨百翰和其他一些后期圣徒创建了盐湖城,盐湖城人口刚过100万,其中半数为后期圣徒教会成员。家庭史图书馆赞助与合作伙伴服务部高级副总裁唐纳德·安德森称,摩门教坚信“永恒的家庭”,坚信家庭有能力去“在生命之外延续”。因此考证祖先是“摩门教义的重要部分”。站在大型银行的微电影当中,他说,“我们都是上帝之子”。

摩门教的基本教义之一就是进行系谱学研究,因为其成员们相信摩门教可以为死去的祖先施洗入教。由代理人施洗家族的行为——即,不知道祖先或未经祖先允许,因为祖先们通常都已过世——备受争议,但那并不是多数系谱学者关注的焦点。FamilySearch和家族史图书馆工作人员欢迎摩门教徒和非魔门教徒,因为图书馆的使用,已经远远超过其宗教目标,且后期圣徒坚信他们的信息传播甚广,且所有信息全部免费。

家族史图书馆是一幢角状的不规则现代建筑,每周六天对外开放,所有服务均免费。家族史图书馆收集了全球最多的与家谱研究相关的文档资料、图书和微电影,因而每年吸引了50万人来此参观,其中许多都是系谱学爱好者,或是专业系谱学者,他们不信仰摩门教。

后期圣徒开始于20世纪30年代末期,他们承办了一个巨型计划,那就是在全球范围内寻找系谱学记载并制作成微电影。借助志愿者和传教士大军,后期圣徒会参观了全球政府和教堂(教堂中保存了大量记载,直到20世纪之交),使用了240万微缩胶卷。家族史图书馆还招募了4600位志愿者,在全球范围内的家族史中心工作。家族史中心是小型研究便利机构,赞助者可以在主要的图书馆订购微电影和图书,然后通过离家近的线下工厂寄送。但在脏兮兮的图书馆(家族史中心是艺术殿堂,实际上一点都不脏),在那些长期被遗忘的泛黄的文件中发掘数据,将迅速走向历史。感谢互联网。

 “看起来似乎互联网为系谱学而生”

对家人的研究过程艰苦,往往吃力不讨好,直到互联网出现。与多数人一样,如果你从头开始——可能你知道四位祖父母的名字,其他所知甚少——就这样开始研究几乎完全不可能。托马斯·麦克恩特的研究开始于20世纪70年代,他说,“不得不直接去档案馆或者仓库”。他很幸运,就读了位于华盛顿特区的一所大学,国家档案馆就在华盛顿特区,那里保留了美国人口普查和军事记载的所有收集资料。“全都是纸质版本”,他说。记载要么是纸质版,要么是微缩胶卷。访问资料需要实地前往,如果实地访问失败的话,就需要一封邮件命令。所有记载当然不可能有索引,因此你得准确知道你需要什么东西:如果你在寻找祖父母的死亡证明,但又不知道确切的死亡日期,那么事情很难办到。当然,所有的家庭树图表,也是纸质版的,因此也很难确定一个表亲与另一表亲间的关系。直到2000年中,这些信息几乎都不能在线阅览。现在,除了某些重大记载(国家法律确定其可用性)和许多军事服务档案外,几乎所有的记载,都有电子版本。

大数据结合DNA检测

3月,近7000人赶至盐湖城的盐宫会议中心,在RootsTech中度过周末。RootsTech是一个年度专注于技术的系谱学会议,由非盈利家族组织FamilySearch和其他一些大牌家族行业赞助。当前系谱学的技术并不总是完全可靠,但RootsTech会议讲述并鼓励两人发展关系。传统而言,近退休年纪的人(多数为女性)希望找到家族组织的这个爱好,在当前是产值达到10亿美元的行业,且年轻人口越来越多。

过去几年,寻找并图表描绘家族史已变成一种潮流,开始搜寻的技术也变得更加简单。许多企业如Ancestry.com和FamilySearch等耗费近十年时间,将他们拥有的工具、文件记载和数据等放在网上,供使用者进行互联网查询,这带来了家谱研究革命——同时,大幅降低搜寻过程的进入门槛。过去老人或拥有可支配收入的专业人士才能参与的事情,现在则迅速变成更为主流的追求。只需稳定的网络连接和一台笔记本电脑,就能一窥过去。

DNA检测几年前还需要花费数千美元,且仅能提供极少的家谱信息。而现在,越来越多的消费者选择采用DNA检测,追溯至数百年前,获取做梦也想不到的大量的关于人类祖先的信息。

植根于普洛佛的家庭树——Ancestry.com

Ancestry.com总部位于犹他州普洛佛市的一座山脚下,距盐湖城仅45英里。Ancestry.com创建于1990年,创始人为保尔·B·艾伦(不是微软的保尔·艾伦)、丹·塔格特(同为杨百翰大学摩门教毕业生)。企业最初作为信息库为人所知,后来则因在软盘上分发圣徒出版物而知名。早年Ancestry.com是一家软件公司,他们在艾伦的汽车旁销售带有圣徒出版物文档的软盘,每份300美元。到1995年,二人将精力放在互联网上,Ancestry.com迅速成为在线家谱研究的领头羊。创建在线家庭树、索引和记载的工具对外免费,但历史文档的真实扫描图片需要付费浏览。通过付费用户,企业赚取了大笔收入。现在,拥有全部访问权限的用户每年服务费用为359美元——每月30美元左右——付费用户则超过了200万。

Ancestry的记载包罗万象,这意味着所有人都可以搭建自己的家庭树。一旦用户找到某个记载——比如说,20世纪40年代的人口普查图——他(她)相信祖父的姓名也在人口普查图中,那么他可以将该记载链接到家庭树上写有祖父姓名的地方。用户的家庭树可以是隐私的,也可以与其他人共享,并将自己的家庭树链接到他人的家庭树上。Ancestry记载功能强大、性能集中,可以合并用户几乎所有的研究数据。许多年前,等量的人类信息就已经填满了手写活页夹与复印纸活页夹的货架,没法简单进行分享。

Ancestry.com是系谱学领域最出名的企业

Ancestry公司CEO蒂姆·沙利文在RootsTech会议上做了主题演讲,他为Ancestry工作了10年。在那之前,他先是世界上最大的婚恋约会网站Match.com的COO,然后担任了Match总裁,他也曾任职于TicketMaster和迪士尼。在沙利文的领导下,Ancestry变成系谱学领域最知名——可能也是最成功的企业。但他仍然平易近人,不似其他多数CEO。当我们走过会展中心的大厅,想找个可以交谈的安静地方时,其他人围过来,对着我们微笑,偶尔也靠近他。“过去五年来,我们一直在搜寻,”但是现在“家族史完全社交化.”人们在一起工作——不管他们知不知道——这改善了他们自己的个人家庭树,也改善了企业数据,因为企业可以将他们的信息拼接在一起。

沙利文的观点十分正确,Ancestry的早期成功几乎可以完全归功于数据搜寻,Ancestry提供了不太匹配但不断改善的搜索算法。基因搜索引擎如谷歌等不能分辨姓与名,而这往往意味着此类工作的全部不同之处,尤其有些祖先的名字相当常见如史密斯或泰勒。但Ancestry(和其他类似企业)创建了特制的用于单一目的的搜索引擎,这种搜索引擎能处理一种需求:与姓相关联的名(包括变化多端的拼写的不同组合)、日期范围、特定范围或宽域文档搜索、宽地理位置(如某一国家)或特定地理位置(如某个小镇)、一些出生日期、出生地点、其他人(如亲戚家的小孩)的名字等。这款搜索引擎每日处理约4500万次搜索量(谷歌搜索数据约为30亿),或许不尽完美,但功能非常强大,且在不断修改升级。搜索结果反馈每次数百条,按匹配度排名。通过挖掘大量的文档和联系数据库,Ancestry也能自动推送“线索”——通过惊人的图文并茂的家庭树之叶展示——基于用户的家庭树,指向潜在亲戚和主要来源。最近,它还首次亮相Facebook分享功能,用户可以将自己和家人的Facebook账号链接到家庭树中,这同样提高了企业搜索的能力。