人工智能在现代人类基因中找到消亡的古代

在上个月发表在《自然通讯》(Nature Communications)杂志上的一篇论文中,研究人员展示了深度学习技术的潜力,这种技术可以帮助填补基因组中的一些甚至连专家都可能没有意识到的缺失部分。他们通过深度学习技术筛选出了另一个“幽灵种群”的证据:欧亚大陆上一个未知的人类祖先,他们可能是尼安德特人和丹尼索瓦人的混血种群,也可能是丹尼索瓦人的近亲。

约3万年前,尼安德特人逐渐灭绝,进而被现代人的祖先取代。

几年前,美国哈佛大学医学院人类遗传学家David Reich发现了一个“幽灵”。该研究小组利用现代人基因重建了欧洲历史。当时,他们发现北欧人和美洲土著间存在联系。他们认为,欧亚大陆北部现已灭绝的人种与欧洲人和后来迁徙到美洲的西伯利亚人出现混合。Reich将这类人称为幽灵人种,因为他们是通过留在基因里的“回声”被鉴别出的,而非骨头或古DNA。

对于我们可以得到数据但不能得到生成数据过程的其他领域来说,情况可能也是如此。大约在科恩和其他种群遗传学家,以及进化生物学家开发基于模拟数据的人工智能技术来解决他们的问题的同时,物理学家也正在使用深度学习技术来研究如何筛选大型强子对撞机和其他粒子加速器产生的海量数据。地质研究和预测地震的方法也开始受益于这种深度学习技术方法。

mg娱乐场线路检测 ,多次见面

mg电子游戏网址 ,渐渐地,新的研究人员正在进入该领域。Bustamante开玩笑道:“如果我能进入,那么任何人都可以。”他的研究最初集中在现代人类的祖先。而几年前,他接到一个有关木乃伊的电话。一个国际研究小组测序了冰人奥茨的基因,冰人奥茨是一具1991年发现于意大利提洛尔阿尔卑斯山的5300年前的冷冻尸体。研究人员想知道Bustamante是否能帮助他们弄清楚冰人的祖先。他们表示,奥茨与生活在撒丁岛和科西嘉岛的现代人的关系,比同欧洲中部人的关系更近,这表明,在他还活着时,欧洲人看起来与现在非常不同。

这并不是深度学习技术第一次被这样使用了。该领域的一些实验室已经在应用类似的方法来解决进化研究的其他线索。俄勒冈大学(University of Oregon)的安德鲁•科恩(Andrew Kern)领导的一个研究小组利用了一种基于模拟的方法和机器学习技术,对物种如何进化的各种模型进行了区分。他们发现,进化所青睐的大多数适应并不依赖于种群中有益新突变的出现,而是依赖于现有遗传变异的扩展。

当然,这里也可能存在另一个人的干扰。

幽灵人种的线索还隐藏在古DNA中。在分析尼安德特人和丹尼索瓦人高质量基因时,Reich和加州大学伯克利分校的Montgomery Slatkin领衔的研究小组发现了一个特殊模式:今天撒哈拉以南地区的非洲人跟尼安德特人的关系比跟丹尼索瓦人的关系更近。但来自其他古老基因的证据显示,这两个古老人群与现代非洲人有相同的联系。在权衡可能性后,科学家认为他们可能发现了另一个幽灵人种。

深度学习技术似乎不太可能解决古生物学家的问题,因为这种方法通常需要大量的训练数据。以其最常见的应用之一,图像分类器为例,当专家训练一个模型去识别猫的图像时,他们有成千上万张可以训练的图片,他们自己知道这个图像分类器是否有效,因为他们知道猫应该长什么样。

尼安德特人的低基因多样性表明,可能在很长一段时间里,他们的人口规模较小,而环境挑战也对他们产生了影响。Schraiber说,此外,尼安德特人的DNA样本显示,其中一些可能是有益的,但其中大部分可能是中性或对我们有害。

这是一种头部长有斑纹并生着驴屁股的奇特的马,最后一头斑驴死于1883年。一个世纪之后,研究人员出版了约200个斑驴核苷酸序列,这些序列取自一块有140年历史的斑驴肌肉。这些DNA碎片(来自死亡已久的生物体的遗传秘密)揭示,斑驴与山斑马截然不同。

使用这种深度学习技术可以让我们发现我们甚至怀疑都没有怀疑过的“幽灵种族”。首先,我们没有理由认为尼安德特人、丹尼索瓦人和现代人是人类进化史中仅有的三个种群,根据霍克斯的说法,这样的种群很可能有几十个。

考古学家认为,现代人从非洲向外扩散时,在欧亚大陆西部遇到尼安德特人,并假定现代人与尼安德特人只发生过一次基因交流。这些遭遇事件在当今非非洲人族群的基因组中留下了印记:该族群约2%的基因组中有尼安德特人成分。

Reich小组正在分析拥有丹尼索瓦人DNA的人类的基因特征,以便找出丹尼索瓦人何时与该神秘人种发生混合。Paabo实验室的阿塔普埃尔卡山人基因研究也可能发现了线索。

目前对共同特征的统计方法涉及到同时检测4个基因组,但这是对相似性的测试,不一定是对实际祖先的测试,因为对于这种方法揭示的少量基因混合可以有很多不同的解释。例如,这些分析可能表明,现代欧洲人与尼安德特人的基因组有某些共同特征,但与现代非洲人不同,不过这并不意味着这些基因来自于尼安德特人与欧洲祖先的杂交,例如,后者可能与另一个与尼安德特人血缘关系非常密切的种族进行了杂交,但不是与尼安德特人。

为了找出答案,我们探索了能解释这一结果的各种人口模型,包括单一混合、多次混合,以及存在一个幽灵人群(稀释假说)。他说。

图片来源:Tetra Images/Alamy

这种新的深度学习技术方法正在试图做得更好,它试图解释基因流动的水平(这些基因流动水平对于通常的统计方法来说太小了),并试图提供更广泛、更复杂的模型。通过训练,神经网络可以学习在基因组数据中根据最可能产生各种模式的人口历史来对各种模式进行分类,而不需要人为告知地、被动地去建立这些联系。

因为一项针对当今东亚人和欧洲人携带的尼安德特人DNA片段的研究显示,尼安德特人与解剖学意义上的现代人的祖先曾在多个时间点发生过基因交流。

在古DNA揭示尼安德特人的性取向或第一个美洲人的祖先之前,这里还有一头斑驴。

普林斯顿大学(Princeton University)生态学家和进化生物学家约书亚·阿基(Joshua Akey)说:“我认为人工智能在基因组学方面的应用被过度夸大了,不错,深度学习技术是一种奇妙的新工具,但它也只是另一种方法罢了,它并不能解决人类进化中的所有谜团和复杂谜团。”

10万年前的一天,尼安德特人第一次遇见一群与他们看上去并不相同的伙伴现代人。虽然双方的初次见面发生了什么也许已无从考证,但之后的数万年间,他们相处得似乎不错。

mg电子游戏网址 1

但越来越多的迹象表明,这段历史其实要复杂多彩得多:例如,一个研究小组去年夏天在《自然》杂志上报道称,他们在西伯利亚的一个洞穴中发现了一块骨头碎片,这块碎片属于一个混血小女孩,她的母亲是尼安德特人,父亲是丹尼索瓦人。这一发现标志着第一代人类杂交的第一个化石证据。

但是,让Schraiber感到困惑的是,东亚人携带的尼安德特人基因比例比欧洲人高出12%~20%。

Meyer和Paabo希望超越来自更温暖地区的古人类样本的DNA极限,例如,直立人化石——发现于亚洲的人类和尼安德特人的共同祖先。Orlando也表示,研究人员可能有新的提取工艺,从埃及木乃伊或弗洛瑞斯人等先前棘手的骨骸里提取信息。弗洛瑞斯人是发现自印尼弗洛勒斯岛山洞的至少有1.8万年历史的古人类。

然而,在其他古生物学家和遗传学家看来,这是向前迈出的一大步,它可以用来预测未来可能发现的化石,以及数千年前人类可能存在的基因变异。劳说:“我认为,深度学习技术将真正推动种群遗传学的发展。”

丹尼索瓦人是生活在距今数万年前的另一个古人类种群,现代人祖先曾与他们共同生活并发生混血。由于丹尼索瓦人和尼安德特人的血缘关系相对较近,一些丹尼索瓦人的基因碎片可能被意外地归类为尼安德特人。我们认为,在一定程度上,这是真实的,但它只代表了我们在分析中使用的尼安德特人基因碎片的很小一部分,不太可能对结果产生巨大影响。Schraiber说。

《中国科学报》 (2014-04-03 第3版 国际)

麻省理工学院和哈佛大学布罗德研究所(Broad Institute of the Massachusetts Institute of Technology)的计算生物学家尼克·帕特森(Nick Patterson)说:“我真的不知道这最终会把我们带到什么地方,我们会拭目以待,但看到新的方法总是好的,如果它能很好地回答我们想要回答的问题的话,我们会在更多的领域里使用这种方法”

但幽灵可能并不存在。我们的证据表明他们(尼安德特人与现代人)只是多次相遇。Schraiber说。

当丹麦哥本哈根大学进化生物学家Ludovic Orlando开始测序一块78万~56万年前的马腿骨DNA时,他并不太抱期望。2003年,他的同事Eske Willerslev在加拿大育空地区的永久冻土层中发现了这块骨头。然后,Willerslev将它丢到冷库里,等待技术有朝一日能解读其中的DNA。(古DNA实验室的冰柜里充满了这种“等等看”的样本。)

我们只是不知道,因为我们缺乏物理证据来表明这些古老的假定基因变异来源(幽灵种族可能在何时、何地以及如何生活,所以也很难说在众多可能的假设祖先中,哪一个才是最可能的。威斯康星大学麦迪逊分校(University of Wisconsin-Madison)的古人类学家约翰·霍克斯(John Hawks)说,这项技术“因为简单而强大,但在理解进化方面还有很多问题悬而未决”。

致命接触

古DNA研究30年纵览

寻找微妙的特征

尼安德特人是远古分布在欧洲大陆的最主要古人类,也是与现代人在进化学上最近的亲族。早在25万年前,尼安德特人就已出现在欧洲和亚洲,而且,他们独占了欧亚大陆,直到现代人的到来,并最终将他们取代。

自那时起,Bustamante便进入古DNA世界。他的团队正在测序记录保加利亚农业出现、美国奴隶交易以及驯化狗等历史的样本。该研究小组正在开发新工具,从而使测序古DNA更便宜、更简单。“我们想要该领域更民主化。” Bustamante说。Reich实验室对农业出现等人类历史越来越感兴趣。去年,Reich参与的研究小组发表了具有1550年~5500年历史的364个欧洲样本的线粒体DNA,以鉴定欧洲新石器时代的大规模人口迁移。

我认为深度学习技术将会给种群遗传学带来巨大的推动。——奥斯卡·劳。

德国莱比锡马普学会进化人类学研究所Sergi Castellano团队曾发现,西伯利亚阿尔泰山脉东部尼安德特人的祖先和现代人的祖先相遇及繁衍的时间可能发生于约10万年前。但约3万年前,尼安德特人完全消失。

2010年的一个晚上,Willerslev打电话给Orlando说,是时候了。Orlando表示怀疑:“我在这个项目开始时怀着坚定的信念:它不可能。”测序古DNA是一场与时间的战斗。生物体死后,在酶的作用下,DNA长链会断裂成短片。低温能减缓这个过程,但最终DNA链会非常短,包含极少量信息。

一些专家甚至持怀疑态度。“我认为数据的密度和质量,除了周详、智能的非人工分析之外,并不适合做其他事情,”哈佛大学(Harvard University)和皮博迪博物馆(Peabody Museum)的古生物学家戴维·皮尔比姆(David Pilbeam)在一封电子邮件中写道。

Schraiber和同事Fernando Villanea运用一个大型现代人基因组数据集,对东亚与欧洲血统个体中源自尼安德特人DNA的图谱进行了不对称性分析。随后基于不同的基因交流次数,他们对解剖学上的现代人基因组中的尼安德特人DNA贡献进行了模拟,并通过机器学习方法,用多种参数对这些复杂模型进行探索。

如果人们证明DNA能长期存活是普遍现象,古生物学、进化生物学、考古学和法医学等领域将受益匪浅。

但由于缺乏相关的人类学和古生物学数据,所以想要利用深度学习技术变得更加聪明的研究人员不得不创造他们自己的数据。“我们像是在作弊,”巴塞罗那国家基因组分析中心(National Center of Genomic Analysis)的研究员、该研究的作者之一奥斯卡·劳(Oscar Lao)说,“我们可以使用无限数量的数据来训练深度学习引擎,因为我们使用的是模拟数据。”

Schraiber提到,可能有一些人居住在东非或北非,因此没有遇到尼安德特人。当他们后来在非洲扩散并为现代欧洲基因库作出贡献时,这些人可能稀释了现代欧洲人基因中的尼安德特人成分。我们没有这个群体的任何直接样本,这就是为什么他们是一个幽灵。他告诉记者。

有时,这些统计“幽灵”也有实体。去年,Willerslev小组发表了具有2.4万年历史的Mal’ta男孩遗骸的基因。相关结果显示,这个在西伯利亚中部发现的男孩,属于跟现代美洲土著和欧洲人都有亲缘关系的人种,这也与Reich的假设相匹配。“这是一个惊人的发现。”他说。

还有谁对今天现代人的基因组做出了贡献?这些所谓的“幽灵种族”长什么样子?他们生活在哪里?他们与其他人类物种互动和交配的频率如何?

mg电子游戏网址 2

这些进步推动了古遗传学的繁荣。去年,研究人员发现了两种有记录的最古老基因:一匹埋葬在加拿大永久冻土层中约70万年前的马基因以及来自西班牙洞穴约40万年的人类近亲基因。

当然了这种技术也带来了一些重大警告。首先,如果实际的人类进化史不像这些深度学习技术的模拟训练模型的话,那么这些技术将会产生错误的结果。这是科恩和其他人一直在努力解决的问题,但要提高其准确性的话,还有很多工作要做。

无论如何,目前仍有很多悬而未决的问题。Schraiber表示,这项研究清楚地表明了人们应该寻找什么:如果我们找到大约6万到4万年前更古老的人类DNA,应该能够看到多重混合的直接证据。

近年来,古遗传学研究进入了Paabo实验室等专业实验室,但几乎没有发现能产生测序全部基因的足够DNA。

炒作和对新工具的希望

但是,虽然该研究的模型支持多重、特定人群的混合,我认为你不应该太照字面意思理解我们的模型 我们认为混合在孤立的群体中是即时发生的,但它可能远没有那么分散。Schraiber说。

更值得注意的是,从那时起,化石研究将不再是探索灭绝生命的唯一方法。美国加州大学伯克利分校遗传学家Russell Higuchi和Allan Wilson及其同事在有关斑驴的论文中提到:“如果人们证明DNA能长期存活是普遍现象,古生物学、进化生物学、考古学和法医学等领域将受益匪浅。”

不幸的是,这样的化石非常罕见(例如,我们对丹尼索瓦人的了解仅仅基于从一根指骨中提取出来的DNA)。许多其他的祖先之间配对可能很容易就会发生,包括那些来自早期杂交群体的组合——但当涉及到物理证据的时候,它们可能实际上几乎很难被发现。相反,它们发生的线索可能只存在于某些人的DNA中,但就算是这样,它们也可能比尼安德特人和丹尼索瓦人的基因更加难以发现。

解剖学意义上的现代人在走出非洲后的3万多年里,与尼安德特人曾在地理位置上相互重叠。在这一时期,尼安德特人与现代人进行了杂交,今天非非洲人携带的尼安德特人部分基因组证明了这一点。该研究通讯作者、美国宾夕法尼亚州天普大学生物学系的Joshua G. Schraiber告诉《中国科学报》记者,但这种融合并非只发生了一次,实际上,人类与尼安德特人之间的相互作用比以前所认为的更长期、更复杂。

要读出这匹马的基因,Orlando需要通过酶处理提取有用的DNA片段,并为它们进行测序准备。Orlando团队发现,准备工作遗失了大量碎片。但随着对实验过程进行微调,例如降低提取温度,研究人员获得比之前多10倍的DNA碎片,并制作了有记录以来最古老DNA的草图。

7万年前,当现代人第一次走出非洲的时候,欧亚大陆至少已经有两个的相关种族在等着他们了。这些物种就是尼安德特人和丹尼索瓦人,他们是两种古代人类们曾经与早期的现代人进行过杂交,在今天的非非洲后裔基因组中留下了他们的DNA片段。

有研究显示,这可能是因为在漫长的演化过程中,来自尼安德特人的基因不适应现代人生存方式,从而在自然选择中被淘汰了。而且,尼安德特人小脑较小,对环境变化的适应能力较差。

情况正在改变。新程序意味着研究人员目前能从最为退化的样本中获得DNA,然后测序他们感兴趣的部分基因组。“我很惊讶全世界只有这么少的实验室在做这些。”德国宾根大学古遗传学家Johannes Krause说,“这不是复杂的事情。”在Paabo实验室里,Krause负责丹尼索瓦人研究。

纽约州立大学石溪分校(Stony Brook University)的人类学家贾森·刘易斯(Jason Lewis)赞同这种观点。他说:“我们的想象力一直受到了限制,因为我们一直关注的是活着的人、或者是我们在欧洲、非洲和西亚发现的化石。深度学习技术可以以一种奇怪的方式来重新聚焦这些可能性,这种方法不会再受到我们想象力的限制。”

换句话说,这些接触对尼安德特人和现代人都产生了不利影响。一方面,尼安德特人最终灭绝,另一方面,有研究发现源自尼安德特人的遗传变异与包括心脏病、动脉壁增厚在内的12种疾病患病风险的增加显著相关。

斯坦福大学人类遗传学家Carlos Bustamante表示,幽灵人种是统计模型得出的结论,当来自化石的基因数据缺失时就需要谨慎处理。

然后,研究小组将人工智能置于现实数据之中,以推断出最符合实际基因组数据的历史。最终,该系统得出结论,一个以前未被确认的人类群体也对亚洲后裔的祖先基因也有所贡献。从所涉及的基因模式来看,这些人本身可能要么是30万年前丹尼索瓦人和尼安德特人杂交产生的一个独特种群,要么是在那个时间段之后不久从丹尼索瓦人后裔中进化而来的一个群体。

Schraiber等人首先认识到尼安德特人DNA在现代人中的分布规律应该能告诉人们一些有关杂交过程的信息。特别是尼安德特人的DNA以大块或碎片的形式出现在现代人身上。于是,他们观察了这些碎片在欧洲人和东亚人之间出现的频率。

能隔离、测序和解释被时间摧毁的古DNA链的技术革新带来了这些飞跃。研究人员能从更古老、更腐朽的残余物里找到DNA,以探索早已死去的人和其他生物的秘密。现在,古DNA能从专家的清洁室转移到考古学家和人类遗传学家的实验室,在斑驴研究30年后,《自然》杂志期待一窥该领域的未来。

这项工作指出了人工智能在古生物学中的未来用途,它不仅能识别不可预见的幽灵,还能在塑造我们成为今天这个样子的进化过程中揭示已经褪色的那些足迹。

历史上的基因交流事件通常会产生双重影响。加利福尼亚大学默塞德分校考古学家Mark Aldenderfer在接受《中国科学报》记者采访时表示,例如,过去500年里,欧洲人曾通过两种方式影响安第斯人的基因:欧洲人带来的流行病杀死了许多安第斯人,降低了现代安第斯人基因的多样性;但一些幸存者出现了对天花等欧洲疾病耐受的基因,而且这种选择在当地的现代人群中依然存在。

去年12月,该研究小组报告了这个古人类线粒体基因组的研究结果。这些序列揭示了阿塔普埃尔卡山人与丹尼索瓦人之间意想不到的关系。丹尼索瓦人是Paabo小组在俄罗斯阿尔泰山数千公里外发现的一批古老人类。Meyer和同事希望能改进技术,获得阿塔普埃尔卡山人的核基因组。“这一定有可能。”Meyer说,“直到工作完成前,我不会休息。”

科恩说,将深度学习技术应用于“这些新问题正产生令人兴奋的结果。”

结果显示,对现代人基因组中观察到的源自尼安德特人DNA的图谱的最佳解释是,尼安德特人与东亚和欧洲人群之间发生过不止一次,而是多次基因交流。相关论文近日刊登于《自然生态与演化》。

谜题将被解开,研究人员推断,如果丹尼索瓦人与在100多万年前离开非洲且分离自人类、尼安德特人和丹尼索瓦人共同祖先的人种混合,那么后来的丹尼索瓦人可能继承了当今非洲人缺失的DNA序列,这解释了为何尼安德特人更接近非洲人。

mg电子游戏网址 3

有一个幽灵

研究人员还转向了30年前启动的问题。Orlando小组开始测序70万年前的马类,他们还关心“更年轻”的样本——斑驴。测序斑驴全部基因的努力是一个大项目的一部分,该项目旨在理解活着和灭绝的马、斑马与驴的进化史。“它显示了该领域的进步。”Orlando说。

研究人员根据不同的人口统计细节(祖先人口的数量、他们的大小、他们产生分支的时间、他们的混血率等等)组合生成了成千上万的模拟进化史。从这些模拟的历史中,科学家们为现代人生成了大量的模拟基因组,他们让深度学习算法在这些基因组上进行训练,使其了解哪种进化模型最有可能产生给定的遗传模式。

借助类似技术,德国莱比锡马普学会进化人类学研究所遗传学家Svante Paabo及其同事,将注意力转向一个“沉睡”在西班牙北部阿塔普埃尔卡山具有40万年历史的现代人近亲。骨骸被保存在稳定低温环境中,这放慢了DNA的分解速度。“如果你能决定古人类埋骨在哪里,你可能会选择这里。”研究负责人、该研究所分子生物学家Matthias Meyer说。

深度学习的人工智能能帮助古生物学家和遗传学家寻找“幽灵”吗?

最初的进展十分缓慢。对古DNA研究真实性的争论分化了该领域,并加深了外部质疑。但多亏实验室近乎偏执的严格,以及帮助科学家确定及排除现代DNA污染的测序技术,争论终于慢慢消失。

模拟历史的真实价值

深度学习技术可以做的是以一种奇怪的方式来重新聚焦这些可能性,这种方法不会再受到我们想象力的限制。——杰森·刘易斯,石溪大学

但统计模型帮助科学家在没有化石数据的情况下推断出了这些种群的存在:例如,根据2013年底发表的一项研究,古人类和现代人的基因变异模式表明,又一个未知的人类种群与丹尼索瓦人进行了杂交。不过专家们认为,这些方法也不可避免地忽视了很多东西。

本文由澳门凯旋门在线注册发布于凯旋门科技,转载请注明出处:人工智能在现代人类基因中找到消亡的古代

TAG标签:
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。