|
| 现代人类学通讯 第一卷 2007年 2007年5月27日 http://COMonCA.org.cn 28 动态评论 南亚语系人群源于印度蒙达部落群 兰 海 编辑提要:南亚语系人群主要分布于东南亚的中南半岛和印度,可能是蒙古人种中最古老的族群,在东亚人群起源研究中极为关键。这个族群的体质特征非常多样,遗传背景也较为复杂。对其主要Y单倍群O-M95的多样性分析发现,南亚语系的分支,印度的蒙达语族群体多样性远远大于东南亚的另一个分支孟高棉语族群体。因此南亚语系群体可能起源于印度。但是该项研究中涉及的孟高棉语族样本较少,结果或许存在偏差。(李辉,耶鲁大学遗传学系) 关键词:南亚语系;蒙达部落;Y染色体;东南亚人群起源 库玛等的论文《Y 染色体证据显示南亚语系人群有共同的父系起源》比较了南亚语系下面三个语族(蒙达,卡西-克木,孟高棉)人群的Y染色体多样性,发现O-M95是整个南亚语系人群中最重要的单倍群。其中印度的蒙达语人群的STR多样性最高,因此得出O-M95起源于蒙达语人群的结论。并通过比较三个语族人群 Y 染色体和 mtDNA 成分的不同,得出东南亚的南亚语系人群是从现在的蒙达语族人群地区经由印度东北走廊迁徙而来的结论。这个结论与语言学证据一致,后者认为蒙达语族是南亚语系中语法和语音都最复杂的语族。 该论文的推理过程的逻辑性很清晰。一个单倍群最有可能起源的地方可以用两个特征来推断:高的频率和高的多样性。在东南亚的南亚语系人群中,O-M95的最高频率为35%(除了3个样本过小的人群)。而蒙达语族人群的样本量都很大(35~109,除了2个),O-M95的频率平均为 63%(排除了3个起源有争议的人群)。这明显比东南亚的南亚语系人群的要高。而且,STR网络结构图显示蒙达语族人群样本的多样性比东南亚的南亚语系人群要高得很多。 以上结论补充或动摇了之前相关研究得到的一些观点,如Basu 等[1]发现蒙达人有很高频率的 K- M9,因此推断这些南亚语系人群是从非洲经由中亚迁入印度的。库玛等[2]通过研究印度和东南亚的 9bp 缺失/重复的多态性,认为印度的南亚语系人是多重起源的,特别是孟高棉语的亚洲起源和蒙达语的非亚洲起源。 此项研究得出的迁徙路线为:蒙达语地区(~65,000YBP)―印度东北(~57,000YBP)―东南亚(~8,000YBP)―尼科巴群岛(~17,000YBP)。这一结论将有助于对中南半岛人群的结构进行更深入的研究。我们注意到,作为南亚语系特征型的O-M95在侗台语,苗瑶语,藏缅语诸民族也有高频存在。比如壮族的38.3%[3],纳西族的47.5% [3],瑶族的 20%[4]。这一点提示我们语言与人群的复杂关系:在某些民族中,O-M95 是主要单倍群,但其语言并不属于南亚语系。另外,新近的一项研究提到,O-M119 的年代约为20,000YBP[5]。比较本论文提供的 O-M95 单倍群和O-M119的分布:相对来说,在东南亚,O-M95主要分布内陆而O-M119主要沿海岸线分布,而 O-M119 向西的迁徙发生得较为晚近的[5]。因此我们可以确定 O-M95 比 O-M119的年代要古老得多。这个结果也将有助于研究澳泰语系的扩散对南亚语系的影响。 文中也有一些欠缺:1、得到的 O-M95(O2a*)的年代超过所有先前研究关于 O/N得到的年代。文中有提到,用全部的样本计算时,"发现随着 MCMC 循环次数的增加,Nposterior值下降了而扩张时间增大了,(计算结果)在109时也不稳定"。所以没有使用全部的样本来计算。这有可能导致误差;2、文中关于单倍群 N 的讨论没有利用到最新的信息。文中提到,"现代人可能从非洲迁往中亚,单倍群 N-LLY22g 和 O-M175 在那里起源"。而 Siiri Rootsi 等[6]的最新研究认为,"N系下频率最高的N3,可能起源于中国"。另外,从文中 N*的分布图我们可以看出,N 是由东南亚向北扩散的;3、文中提到尼科巴人是从泰国和缅甸南部海岸迁往安达曼和尼科巴群岛的。但文中给出的证据不能完全排除经由苏门答腊岛的可能;4、本文的语言分类与规范的语言学分类不一致[7]。在语言学界的传统分类法中,卡西-克木语仍属于孟高棉语族北高棉语支,整个孟高棉语族分为孟,京芒,北高棉,俫,东高棉,尼科巴,以及阿斯利等语支。但这种分类的不同对结果应该没有影响。 我们也很关注 STR 分析涉及到的样本结构。相对于东南亚的孟高棉群体庞大的人口数来说,它在该文中样本量很小,很多重要群体都没有分析。因为样本不全,孟高棉群体 Y 染色体的多样性有可能被低估因而在分析中显得边缘化。如果加大东南亚的样本量,结果会更令人信服。 原文翻译 兰海 译 Y染色体证据显示南亚语系人群有共同的父系起源 摘要 南亚语系被认为是印度所有语系中最古老的,它在东南亚也有大量分布。但是,印度的南亚语系各语族间以及印度,东南亚两地的南亚语系人群之间可能的基因联系至今都没有被研究清楚。因此,为了追溯印度境内的南亚语系人群的起源以及历史上的扩张,我们分析了来自印度25个人群1222个样本的Y染色体SNP和STR数据。其中包含南亚语系部落的三大支系,即蒙达,卡西-克木,孟高棉,以及已经公开发表的亚洲和大洋洲的 214 个人群的数据。结果 我们的结果显示,不但印度境内的南亚语系各群体之间,而且他们与东南亚的南亚语系人群之间都有明显的父系遗传联系。但是,基于mtDNA的母系研究没有得到类似证据。我们的结果也指出,单倍群O-M95约于~65,000年前(95%CI: 25,442-132,230)起源于印度的南亚语系人群,然后通过印度东北走廊向东南亚扩散。而后,东南亚操孟高棉语的人群在相当晚近的一个时间到达了安达曼和尼科巴群岛。结论 我们的结论与语言学证据一致。语言学证据认为南亚语系的祖先起源于印度然后向东南亚迁徙。 背景 印度次大陆现在居住着四个主要的语群:南亚语系,德拉维达语系,印欧语系和藏缅语族。他们在不同的时间进入印度。由于观察到其中南亚语系的名词分化程度最高[1]以及其他的一些语言学特征(稍后详细讨论),所以南亚语系被认为是四个语系[1,2]中最古老的。南亚语系在印度境内包括三个语族[3]:1、蒙达语族,使用者为中部和东部印度焦达讷格布尔高原上的一些部族;2、孟高棉语族,使用者为安达曼和尼科巴群岛上的尼科巴人和匈蓬人;3、卡西-克木语族(早先被认为孟高棉语族的一部分),使用者为印度东北的卡西部落(图 1 )。印度的卡西语支和克木语支人群有东亚人群的体质特征,而蒙达语族的一些体质特征与德拉维达语系相似。另外,除了蒙达语族使用者局限于印度外,其他两个语族的使用者包含大量的东南亚人群。尽管印度次大陆被认为是前往东南亚的迁徙重要走廊,印度的南亚语系各语族间的遗传联系,印度-东南亚两地的南亚语系人群之间的可能遗传联系却至今都没有被深入研究。 基于语言学,考古学和经典遗传标记的研究认为,南亚语系进入印度可能经由两种 (尼科巴人和卡西人)有东亚特异的mtDNA,Kayser等[16]和Thangaraj等[6]认为他们来自东南亚。但是,在蒙达部落与东南亚的人群间没有相似的母系基因联系[8~10]。我们分析了1147个样本,包含了大部分蒙达部落以及过渡群体,完全没有发现东亚特异的mtDNA单倍群[Kumar V,Reddy BM and Langstieh BT等未发表的数据],显示印度境内南亚语系的三个语族有不同的母系遗传历史,这一点与早期共同的父系遗传是不同的。我们是怎样得到这个结论的既然南亚语系各语族有共同的单倍群O-M95而mtDNA没有发现类似情况,那么,一个男性占主导的前往东南亚的迁徙就是极有可能的。但更重要的是,O-M122被认为是东南亚人群的特征单倍群,在蒙达部落中它完全不存在。而任何分析关于始自东南亚的迁徙都是要以O-M122为基础的[18,20,33]。 单倍群计算得到O-M122的年代在15,000~60,000年前[18]之间,而东南亚的O-M95计算结果为~8,000年前[16]。如果印度的南亚语系人群确实来自东南亚,那么他们应该包含有O-M122,而且印度的南亚语系人群中,O-M95的TMRCA计算结果应该比现在得到的~65,000年前要低(表4)。虽然说这个值的置信区间很大(25,442~132,230),应该谨慎对待。无论如何,蒙达人这个值的下限依然比Kayser等[16]得到的上限要大,而且没有重叠。因为Kayser等[16]应用了16个位点中突变速率相当快的7个,我们用这7个位点和与Kayser相同的突变速率重新计算了我们的数据,发现得到的TMRCA结果相似(~65,000年前)。这个结果显示,本文的计算并不是由于大数目的位点和低的突变速率造成的人为后果。另外,蒙达人被认为是传统的食物采集狩猎者,现在他们的居住地不适合于耕作,这可能反映了他们传统的生存模式。因此,尼科巴人在新石器时代农业人口的扩张时期进行了迁徙[16],这对蒙达人来说是不可能的。基于这些证据,我们认为,现今蒙达人的祖先从印度迁徙到了东南亚,而不是相反。这个情形与以下事实是一致的:蒙达语族是南亚语系中语法和语音都最复杂的语族,它比其他的语族更接近于原始南亚语。因此这个语系的祖先起源于印度。更多的分析显示,O-M95最有可能起源于现今蒙达人群的祖先,而后携带着它迁往东南亚。 表4 计算得到的各语族的O-M95的TMRCA
AMOVA结果(表3),M-J网络结构图(图4)和O-M95的TMRCA(表4)显示,蒙达人和其他的南亚语系人群很早就分开了。因为分离得很早,我们希望这些群体的O-M95样本至少形成单独的支系。但是,没有发现一例O-M88(图2)。直到现在,O-M88仅在柬埔寨和老挝发现一例[40],暗示这个支系的频率很低并局限那个地区。因此如果有下游支系存在,它应该由其他未知的双等位标记点定义。因为卡西人有相当高频的O-M122(29%),且卡西-克木语族各语支的分布局限在缅甸和泰国北部,我们推断卡西语族人群是从印度迁往东南亚的。然而,卡西人中O-M122的存在是来自加若人的基因交流,说明这个人群最早并不含有这个单倍群。此外,印度的mtDNA单倍群贡献了卡西人30%的mtDNA成分(Reddy等未发表的数据),而这些单倍群在他们的藏缅语族邻居中完全缺失[8,41]。因此,卡西人中的东亚特异的mtDNA可以认为是来自相邻的加若人和其他的藏缅语族群体,后两者事实上只含有东亚特异的mtDNA。这一点加强了以下观点:蒙达人和卡西人分离得很早,后者可能经由东北印度走廊迁往东南亚,正如地图所示的那样(图1)。由基于Y- S T R s的AMOVA结果(表3)和M-J网络结构图(图4)显示,尼科巴人与蒙达人以及卡西部落都很不一样。尼科巴人只含有东亚特异的mtDNA[6,7]和父系的O-M95(图2及表2)。我们也对属于孟高棉语族的匈蓬人进行了基于16个STR的AMOVA分析。 |