南岛西部人群和壮侗人群父系的紧密遗传关系
李辉、文波、陈叔倬、宿兵、帕门佳果-帕查闰、柳杨帆、潘尚领、覃振东、刘文泓、程栩、杨宁宁、李昕、陈亭平、卢大儒、许木柱、代卡-兰江、马苏其-桑国、谈家桢、金力
摘 要 (中国恐龙网.分子人类学论坛.baiyueren翻译)
背景:南岛语是在东南亚、大洋州和印度洋地区扩展最广的语系。以他们语言的相似性为基础,这个语系包括了马来-波利尼西亚和台湾土著语。语言上的相似性还导致了有争议的台湾是南岛语原乡的假说,在民族学家、语言学家、考古学家和遗传学家中都有争论。普遍公认东部南岛语人(密克罗尼西亚人和波利尼西亚人)源自西部南岛语人(东南亚岛屿和台湾原住民),而且大陆上的壮侗族群则被假定为所有南岛语人的源头。
结果:在报告中,我们研究了30个中国壮侗族群,23个印度尼西亚和越南的马来-波利尼西亚族群,共1509个Y染色体的非重组区的20个SNP位点和7个STR位点。这三个群体在父系遗传谱系方面显示出许多共同之处,混合分析证实了壮侗族群在遗传方面几乎未受中国汉族影响,而且构成了印尼人的遗传的主体。O1a*在大部分族群的样本中高发,而在其他语系族群中十分少见。O1a*单倍群的网络图解释了印尼人的世系并非如语言学研究结果的那样源自台湾原住民,而是来自壮侗族群。
结论:我们发现,与台湾原乡假说相反,东南亚岛屿族群在父系遗传谱系上并非台湾起源。另外,我们的还发现台湾原住民和印尼人在父系上很可能都源自壮侗族群。这两支人群似乎都经历了独立发展的过程,我们的研究结果显示遗传上支持一个包括台湾原住民、壮侗族群和马来--波利尼西亚族群在内的大族群。

结果
为确定壮侗人群和南岛西部人群的遗传关系,我们测定了23个东南亚岛屿族群和11个台湾原住族群(群体所在地见图1,族群信息见表1),1509个Y染色体的非重组区的20个单核苷酸多态性位点和7个短串重复序列位点。本次研究囊括了几乎全部中国壮侗族群和台湾原住族群的样本。
另外,现已完成了对包括所有东亚和东南亚语言集团在内的134个东亚族群SNP位点定义单倍群的主成分(PC)分析。结果显示语其他东亚和东南亚群体相比,壮侗人群最为接近西部南岛族群(图2),表明壮侗人群和西部南岛族群有很近的遗传关系。壮侗-东南亚-台湾集团从其他种群中的分异与主成分2有高度相关性(详见附件1)。此外,O1a-M119是台湾原住民的优势单倍群(平均77%),检测值从54%至100%不等(见表2,O1a*和O1a2之和),但其他东亚族群中则不然(<5%)。因此,预计O1a-M119能为勾画壮侗族群和西部南岛人群的关系提供丰富的信息。

图2中的主成分图显示一些壮侗族群接近汉藏族群的簇。可能是因为壮侗族群和汉藏族群有共同的祖先,可能导致他们在遗传上有相似之处。然而,对此也可以有另一种解释,就是东亚大陆上的壮侗族群在遗传上可能受到过中国汉族的影响,因为他们从2500年前就开始比邻而居。混合分析可以评估假定现代壮侗人群的壮侗或汉族祖先的比例,而一些被隔离的壮侗族群可以作为混合分析中的父系族群。海南的原住族群(黎族、加茂人和仡隆人)和台湾原住岛民可以假定为相对孤立的,因为他们的文化很少受到大陆上的外来文化的影响。所以,在遗传结构上这些原住岛民可能很类似于壮侗祖先。
为评估假定的大陆壮侗族群中的汉族遗传影响,我们将大陆壮侗族群、海南原住民、台湾原住民和中国汉族的Y-SNP数据应用于混合分析中。为了分析,我们将后3个群体合起来视为大陆壮侗族群的父系群体。结果显示海南原住民的遗传贡献非高(2.145±0.927),然而中国汉族(-0.314±0.422) 和台湾原住民(-0.831±0.662)的贡献几乎没有。这里的ADMIX程序算出的遗传贡献负值暗示对现代壮侗族群没有贡献的可能。这个结果显示壮侗族群的父系遗传谱系是相当清晰的,壮侗人群与西部南岛人群之间的遗传关系几乎未受族群混杂的影响。
东南亚岛屿族群可能也是混合的。在我们的研究中,假设东南亚岛民在父系遗传上是是三个群体的混合:壮侗人群、台湾原住民,以及很接近巴布亚人的巽他群岛土著居民。我们完成了印度尼西亚人的混合分析,并在分析中加入了从文献中得到的巴布亚人数据作为父系族群结构之一。我们的分析显示如下的混合比例:壮侗群体(0.713±0.124),台湾(0.143±0.125)和巴布亚人 (0.144±0.050),表明壮侗祖先对印尼人的父系遗传贡献是最强势的。在这些数据中存在一些不确定性,因为我们关于东南亚岛民是混血的假设是无法得到检验的。
正如O1a*是壮侗和西部南岛人群最具特色的单倍群,我们使用O1a*个体的7个STR位点评估了壮侗人群、印尼人和台湾原住民之间的遗传距离,(遗传距离见图3,STR原始数据见附件2)。我们的研究显示台湾和印尼族群之间遗传距离是最大的,几乎差不多是壮侗群体和台湾原住民遗传距离的3倍。壮侗群体和印尼人之间的遗传距离很接近壮侗人群和台湾原住民的距离。这些发现表明印尼人和台湾原住民在遗传上都与壮侗族群的更接近,超过了这两个西部南岛群体之间的距离。此外,在O1a*个体的7个STR位点上的多态性在壮侗语人中比在印尼人和原住民中更高发(图3)。多态性最高的族群未必总是最古老的,也可能是与周边族群混血的结果。但是,壮侗语人O1a*单倍群较高的多态性应该是族群年代最古老造成的,因为这种单倍群在周边人群中几乎不存在,所以不是混血导致了更高的多态性。我们所取得多态性和分歧时间结果显示,壮侗人群很可能是印尼人和台湾原住民父系遗传世系上的祖先群体。其他的Y单倍群(如O3-M122、O2a-M95)也呈现与O1a*相似的图谱,显示壮侗人群与印尼人和台湾人的遗传距离比后两个族群之间的距离更接近(表3)。有趣的是O2a甚至可能进一步追溯到南亚语人群,正如近期研究所提出的观点。

我们用三个人群O1a*个体的7个STR突变位点构建了中接网络(图3)。假如东南亚岛民的台湾原乡假说(THH)是真的,也就是说东南亚岛屿个体来源于台湾原住民,那么网络中的东南亚世系和台湾世系就应该有共享节点和(或者)连线。在图3中,壮侗世系(绿色节点)构成了网络的中心。所有的东南亚世系(黄色节点)和台湾原住民世系(蓝色节点)直接或是间接地共享或连接着壮侗世系。相反地,没有台湾世系(除了一个)分享或者连接到东南亚世系的节点。这些发现表明东南亚岛民并非直接源自台湾原住民,而应该是东南亚岛民和台湾原住民各自独立地起源于壮侗群体。
我们进一步观察网络中那些与东南亚世系相连的壮侗族群世系。有趣的是,大部分与东南亚相连的壮侗单倍型不是来自海南,就是来自海南西北面的广西(图3中带深绿外圈的绿色节点)。这些海南和广西族群均位于北部湾周边区域(即东京湾,Gulf of Tonkin)。特别是越南南部的属于马来-波利尼西亚族群的占人(cham),以及海南的回辉(Tsat),可以看到他们在网络中联系着壮侗人群和印尼人。所以我们假设东南亚岛屿族群起源于北部湾周边地区,他们穿过印支半岛到马来半岛向南迁徙,而后再扩散到太平洋和印度洋的大部分岛屿。
我们估算了网络中O1a*单倍群的年代。总体年代是33765±5221年,与末次冰期相吻合。网络中所有壮侗系样本的年代是33193±5577年,与O1a*的总体年代很接近。由于台湾与壮侗的单倍型大范围交叠,很难估计台湾簇的真实年代。有些交叠表明发生过从壮侗族群到台湾原住族群的多次移民。我们估计网络中左侧那个台湾簇的有14659±3110年。所有台湾样本的总体年代估值为21268±3148年。有趣的是,后面这个年代值很接近台湾已发现的最早的人类遗存,即左镇人。由此我们推断O1a*个体从大陆向台湾岛的移民出现在旧石器时代。
由于在网络中可以观察到两个清晰明确的东南亚岛屿单倍型的簇,我们计算了两者的年代。左边的东南亚簇的年代是9895±2393年,可是右边的簇却达25880±7137年。语言学上对马来—波利尼西亚语的起源年代的估计比我们的估值要年轻得多,大约5000-6000年前。此外还可发现在网络中到壮侗单倍型和东南亚岛屿单倍型有一些交叠,说明在东南亚人脱离壮侗祖先群体向外移民过程中可能发生过瓶颈效应。地理学上的瓶颈效应可能来自狭窄越南海岸。所以O1a*单倍群很可能在马来—波利尼西亚语7500年产生之前由此向东南亚岛屿扩散。但是晚近时期O1a个体向东南亚岛屿移民的可能性是不能忽视的,因为遗传学时间估计的精度不足以排除这种可能性。
应当注意的是,在“特别快车”假说中存在两种不同的角度:(1)移民的起源,也就是台湾原乡说,以及(2)移民模式,也就是从印尼开始的快速扩散。在研究中,为验证台湾原乡说,我们检测了先前研究中很少涉及的包括壮侗语人和东南亚岛民在内的西部南岛人群。我们发现台湾不象是东南亚印尼人的原乡,至少不是其父系主体世系的故乡。尽管台湾原住民和印尼人都源自壮侗人群,但两者父系主体世系并非单一起源表明其分化是相互独立的事件。
有意思的是,我们的研究表明家猪在东南亚群岛和太平洋地区的分布与西部南岛族群分布基本一致。台湾及远到密克罗尼西亚的家猪都直接来源于东亚大陆,而那些东南亚群岛和波利尼西亚的家猪是来自印支半岛。假设家猪是被人类群体在早期迁徙中引入的,那就意味着人类同样可以顺着这两条的路线抵达东南亚和太平洋岛屿。
事实上我们的检测结果与澳泰语群单一起源理论相一致,澳泰语群由壮侗语、马来—波利尼西亚语和台湾土著语组成。我们的检测结果表明,在这次研究加入壮侗人群和东南亚岛屿人群对研究南岛人群的起源是绝对必要的。如果不加入这些群体,波利尼西亚和台湾原住民会显得相互十分接近,从而导出所有南岛人都是起源于台湾的结论。
我们的结果表明北部湾极有可能是东南亚岛屿族群的原乡。鉴于人类群体从印尼东部向太平洋岛屿移民过程的复杂性,以及西部和东部南岛人群在遗传方面的显著区别,我们在研究中没有选择波利尼西亚的数据。作为替代,我们只分析了西部南岛群体。波利尼西亚族群缺少O1a-M119的事实是令人好奇的,而且不能简单地以瓶颈效应来给出波利尼西亚人Y染色体单倍型表现出高多态性的原因。
与我们对父系遗传谱系的发现相一致,对马来半岛群体的线粒体DNA研究也表明,大约在末次冰期(Last Glacial Maximum)时原始马来人的祖先居住在印支半岛。后来这支祖先群体经由马来半岛扩散到东南亚岛屿。对东南亚岛屿人群的mtDNA研究也表明,即使发生过一次南岛语人从台湾的移民,在人口统计学上也是一个次要的事件。
我们的大部分结论都是基于对O1a*的分析,一个在这些族群Y染色体谱系中只占少部分的单倍群。O1a*谱系的频率在台湾族群中显著高发,不过在马来—波利尼西亚人和壮侗人群中并不特别多。一些族群事件可能还涉及到其他的Y染色体谱系。有其他次要的、不同来源的父系谱系也很正常,比如说南岛群体到来之前的印尼土著族群,还有更晚近来自南亚的移民。东亚和东南亚人之间遗传关系的复杂程度超出了我们的预料。
结论
我们的结果显示,在父系遗传谱系上壮侗人群比其他东亚民族群体更接近西部西部南岛族群。O1a-M119是壮侗族群和西部南岛族群中主要的Y染色体单倍群,其STR多态性表明西部南岛的两个群体——台湾原住民和东南亚岛屿土著,各自独立地起源于壮侗群体。因此,东南亚岛屿族群很可能起源于北部湾地区——壮侗民族的原乡,然后经越南走廊迁徙至印度尼西亚。与此相反,台湾原住民族是从中国大陆直接移民。我们的研究结果表明从遗传上可以推断出一个包括台湾原住人群、壮侗族群和马来—波利尼西亚人在内的大群体。

族群 | 中文名 | 位置 | 语言 |
Bolyu | 俫人(珀琉) | 广西隆林 | 孟高棉珀琉语 |
Yerong | 夜郎 | 广西那坡 | 卡岱语Bu-Rong |
Qau | 仡佬-稿 | 贵州毕节 | 卡岱语Ge-Chi |
BlueGelao | 仡佬-蓝 | 广西隆林 | 卡岱语Ge-Chi |
Lachi | 拉基 | 云南马关 | 卡岱语Ge-Chi |
Mollao | 木佬 | 贵州麻江 | 卡岱语Ge-Chi |
RedGelao | 仡佬-红 | 贵州大方 | 卡岱语Ge-Chi |
WhiteGelao | 仡佬-白 | 云南麻栗坡 | 卡岱语Ge-Chi |
Hlai-Qi | 黎族-杞 | 海南通什 | 卡岱语黎语 |
Jiamao | 黎-加茂 | 海南保亭 | 黎语 |
Buyang | 布央 | 云南广南 | 卡岱语yang-biao |
Cun | 仡隆 | 海南东方市 | 卡岱语yang-biao |
Laqua | 普标 | 云南麻栗坡 | 卡岱语yang-biao |
Man-Caolan | 高栏山仔 | 广西防城港 | Be–Tai |
Zhuang-N | 北壮 | 广西武鸣 | Be–Tai |
Zhuang-S | 南壮 | 广西崇左 | Be–Tai |
Lingao | 临高 | 海南临高 | Be–Tai |
E | 五色人 | 广西融水 | 侗水语 |
AiCham | 锦家 | 贵州荔波 | 侗水语 |
Kam/Dong | 侗族 | 广西三江 | 侗水语 |
Sui | 水族 | 广西融水 | 侗水语 |
Mak | 莫家 | 贵州荔波 | 侗水语 |
Mulam | 仫佬 | 广西罗城 | 侗水语 |
Maonan | 毛南 | 广西环江 | 侗水语 |
Biao | 讲标人 | 广东怀集 | 侗水语 |
Then | 徉徨人 | 贵州平塘 | 侗水语 |
Danga | 疍家 | 海南陵水 | |
DornQdayc | 宕傣(马桥原住民) | 上海闵行 | |
CaoMiao | 草苗 | 广西融水 | 侗水语 |
Laka | 拉珈 | 广西金秀 | 侗水语 |
Amis | 阿美 | 台湾花莲 | 南岛语排湾语 |
Pazeh | 巴则海 | 台湾苗栗县卓兰 | 南岛语排湾语 |
Siraiya-Makatao | 西拉雅、马卡道(平埔) | 台湾花莲 | 南岛语排湾语 |
Thao | 曹人 | 台湾南投 | 南岛语排湾语 |
Paiwan | 排湾 | 台湾台东 | 南岛语排湾语 |
Atayal | 泰雅 | 台湾宜兰 | 南岛语泰雅语 |
Rukai | 鲁凯 | 台湾屏东 | 南岛语排湾语 |
Pyuma | 卑南 | 台湾台东 | 南岛语排湾语 |
Tsou | 邵人 | 台湾嘉义 | 南岛语邵语 |
Bunun | 布农 | 台湾花莲 | 南岛语排湾语 |
Saisiyat | 赛夏 | 台湾宜兰 | 南岛语排湾语 |
Batak | 巴塔克 | 印尼 | 西部南岛语 |
Bangka | 邦加 | 印尼 | 西部南岛语 |
Malay(Riau) | 马来人(廖省) | 印尼 | 西部南岛语 |
Minangkabau | 米南加保 | 印尼 | 西部南岛语 |
Palembang | 巴邻旁(巨港) | 印尼 | 西部南岛语 |
Nias | 尼亚斯 | 印尼 | 西部南岛语 |
Dayak | 达雅克 | 印尼、马来 | 西部南岛语 |
Banjar | | 印尼 | 西部南岛语 |
Javanese | 爪哇 | 印尼 | 西部南岛语 |
Tengger | | 印尼 | 西部南岛语 |
Balinese | 巴厘 | 印尼 | 西部南岛语 |
Bugis | 布吉 | 印尼 | 西部南岛语 |
Torajan | | 印尼 | 西部南岛语 |
Minahasa | | 印尼 | 西部南岛语 |
Makassar | 望加锡(锡江) | 印尼 | 西部南岛语 |
Kaili | | 印尼 | 西部南岛语 |
Sasak | 莎莎克 | 印尼 | 西部南岛语 |
Sumbawa | 松巴哇 | 印尼 | 西部南岛语 |
Sumba | 松巴 | 印尼 | 中部南岛语 |
Alor | | 印尼 | 中部南岛语 |
Irian | 伊里安 | 印尼伊里安查亚 | 吉伶克湾语 |
Cham | 占人 | 越南南部 | 西部南岛语占语 |
Tsat | 回辉(回族) | 海南三亚 | 西部南岛语占语 |
《科学公共文库-一线》3卷2168篇 隔离于东亚入口处的海南原住民父系遗传结构
隔离于东亚入口的海南原住民父系遗传结构
李冬娜,李辉,区采莹,陆艳,孙元田,杨波,覃振东,周贞鉴,李士林,金力
节选翻译 (中国恐龙网.分子人类学论坛.baiyueren翻译)
要点:为评估孤立的海南岛遗传结构和南方入口处最早的遗传结构,我们研究了全部6个族群的405个海南原住民Y染色体,他们受到新近大陆人群变动和混杂的影响很小,这里我们报告在海南原住民中O1a*和O2a*单倍群是占优势的。此外,大陆上占优势的单倍群O3在原住民中的频率很低,说明他们是孤立的群体。聚类分析性表明海南原住民在2万年前被隔离,在两种主要的单倍群进入东亚之后(3.1-3.6万年前)。

结果和讨论
在我们的研究中,我们分析了海南原住民6个人群的Y染色体差异。我们检测了405个海南男性个体的22个单核苷多态性(SNPs),核7个短串重复(STR)多态性,并确定了基于YCC和ISOGG标准命名法的单倍群。我们建立了在Y-SNP单倍群频率方面非常近似的族群取样。O1和O2是在各人群中出现最多的,而且很可能是海南原住民的原始单倍群,在海南原住民之一的杞黎中,这些单倍群的总频率达到了100%。表明这是一个显著瓶颈效应的人群。事实上,杞黎分布在偏僻的山区,而且是由一个很小的人群发展起来的,杞黎Y-STR多态性较低支持了这个观点。O1和O2都是台湾原住民和东亚最南部常见的单倍群。在中国东部和南部沿海、婆罗州和菲律宾的南岛语人群中O1和O2也高发,他们的语言由语言学上近似的壮侗语和南岛语组成。与壮侗族群相比,其他族群的O1比例相对较低,特别是在印支半岛西部的操南亚语的土著人群中。O3是汉藏语族群我的ID同的单倍群,汉族(50.51%),藏缅族群(54.70%),在海南原住民中是很少的(6.91%),虽然在台湾原住民中的频率达11.36%(0%-37.6%),以及在大陆南方(壮侗19.6%)和中部(孟高棉54.02%)原住族群中有较高的频率。这表明与台湾和大陆南方土著族群相比海南群体与汉族的男性遗传混杂较少。还有与大陆族群不同,D、P、N、Q等单倍群未出现在海南原住民中。
壮侗语和南亚语族群是散居于大陆南方并交错分布。我们假定在他们之间必然有充分的基因流动,而且可以被归入一个群体,这与他们的Y-SNP频率的情形是相似的。黎族亚群构成了南部群体的外部分支,而且其中的瓶颈和被隔离的黎族杞黎,更是处于这个分支的外侧。这个结果显示黎族完全不同于大陆上混杂的族群。在北方群体中,孟高棉、中国汉族和藏缅系人群相互之间是最接近的,虽然在遗传上南岛语和阿尔泰人群的全部影响都来自汉藏语系群体。我们找到了这个群体中的外部分支是台湾原住民和海南仡隆人,呈现出相对较低的单倍群差异。但是还不清楚为什么发现仡隆人和台湾原住民接近。
主成分分析也显示南方和北方的族群是分开的。在主成分图的基础上,台湾原住民接近北方族群,而海南原住民是分为两支不同的群体。仡隆人可以与台湾原住民一起被放到北方族群中。所有的海南黎族群体非常接近南北分布的南部边缘,再次验证了他们孤立的遗传结构。这种分化尤其准确地显示了杞黎是处于南部边缘的位置。
依据SNP分析,海南原住民与北方族群是隔离的,特别是在华北人群向南方移民时携带着高频的O3单倍群。孟高棉族群向南的移民可能也为O3在华南的频率的增加作出了贡献。我们最近的研究显示孟高棉和汉藏语族群最近其的共同祖先在中国西南部地区。正如我们提到的,海南原住民中缺少O3。但是海南原住民占优势的单倍群O1和O2,同样也在大陆壮侗族群和台湾原住民中占优势。单倍群SNP分析不排斥海南原住民和壮侗-台湾人群之间的基因流动。
在这个网络中,涉及的数据是来自台湾原住民,以及海南北面的两个省份广东、广西的壮侗语人群。在图3网络的每个顶端,海南原住民(显示为黑色节点)从其他族群中很少的个体中形成了几乎独立的分支(粗线显示),暗示海南原住民是从其他壮侗人群与台湾原住民中隔离出来的。此外,黎族大部分的单倍群位于顶部的分支,虽然仡隆人的单倍群在两者的网络中形成了两个很小的分支(在网络较低的部分的黑色节点)。黎族分支的尺度相对较大,几乎占据了网络的三分之一。
在O2a*的网络中,黎族的分支比大陆和台湾的部分更大,说明黎族是比大陆壮侗族群和台湾原住民更古老,而不是源自大陆壮侗族系的群体。从STR来看这些大尺度的分支是通过相当长的时间所变异和形成的。
我们估计人群年代为:O1a*约3.6万年,在O1a*网络中海南分支的年代大约1.9万年,而O2a*的年代是3.2万年,在O2a*网络中海南分支的年代大约2.6万年(表2)。请注意我们对O2a*的估值是基于华南人群,因此不同于世界范围内O2a*的年代。这两个单倍群同样很少出现在华北,在华南人群中这两个单倍群的年代很可能就是他们进入东亚的时间。O1a*和O2a*的年代很接近,下限分别是1.8万年和2.6万年。这个时间框架与末次冰期高峰期相吻合,这时中国海洋的大陆架在海平面以上而且对现代人进入东亚来说提供了一个捷径。
对于早期迁徙进入东亚的现代人来说可能存在一条以上的通路。另一种可能的进入东亚的途径是从东南亚-东亚的西部接壤(从缅甸到云南和中国内地,图1A)。我们假定O3单倍群是经这条西部路线由汉藏和孟苗祖先群体带入的,尽管还没有足够的证据(我们最近对苗瑶和孟高棉人群的研究给出了可能存在西线的线索)。然而,O3也可能是通过相同的一条东部路线出现的,但是晚于O1a*和O2a*出现的时间。O3单倍群后来通过重新分布影响了很多其他人群。根据O3在海南岛孤立族群中很少来判断,当壮侗人的祖先首次进入东亚时,没有O3从海南岛附近进入。无论如何,可以确定最早沿东线进入东亚的移民携带的O2a*是一个最古老的单倍群(超过4万年,金力未公开的数据)。O2a*单倍群可能也是最早抵达海南岛的人群。海南岛上的O2a*分支的年代已确定约为2.6万年前,这个数据比海南最古老的三亚落笔洞遗址更久远。我们提出这就是海南原住民被隔离的年代。将来可能会在海南岛发现更早的考古遗址。
我们的O1a*网络分析图显示台湾节点比海南节点更接近网络的中心,表明在地理上台湾很接近这个单倍群的起源地。因此,O1a*可能起源于海南岛以东区域,而后倒流回海南,可以确定海南O1a*分支比O2a*分支更年轻。O1a*同样可以在5000年前的中国东部沿海的新石器时代的样本中找到。东亚的新石器时代始于8000年前。O1a*也有随着新石器文化扩散到海南岛的可能。O1a*在海南的年代(约1.8万年前)比海南的新石器时代遗址(约6000年前)更古老。一种可能的解释是这个年代实际计算的是在到达海南岛之前,O1a*人群离开O1a*祖先群体(可能是台湾原住祖先)的时间。我们计算出台湾和海南原住民O1a*之间的分歧时间是2.2(95%置信区间1.25-4.68)万年。
总之,我们的发现揭示了海南原住民来源于末次冰期进入东亚的早期移民,并从那时起就与世隔绝。海南原住民几乎没有受到东亚大陆上人群重新分布的影响,海南原住民的Y-SNP图谱最接近最初的遗传结构。我们认为海南原住居民的不仅能揭示东亚人的起源以及他们的遗传特色,而且也可以当作东亚人群遗传研究的模型。
我们知道,隔离的人群对一些遗传学研究来说是很有用的。例如,复杂病症的致病因素显然在隔离人群中可以被简化,更便于分析。此外,相对较大的族群和久远的历史使得大多数海南原住民不太可能发生遗传漂变,却可以发展出与低Y-SNP多态性相对而言更高的Y-STR多态性。可以确信海南原住民也有着比其他东亚人群更高的常染色体变异多态性,更低的连锁不平衡(linkage disequilibrium),这在疾病关联性研究中可以消除由高连锁不平衡引起的错误的阳性结果。因此,我们认为在许多遗传学研究中都可以将海南原住民作为东亚隔离人群的模型。