平话人群是汉族一致性遗传结构的例外(节选翻译) >>>
中国恐龙网 分子人类学论坛 baiyueren 翻译
摘 要:汉族是世界上最大的单一民族群体,由十种汉语方言支系构成。平话支系是个例外,这个群体的遗传结构已被广泛研究,Y染色体和mtDNA数据证明了所有汉族人群遗传结构的一致性。因此,尽管分布在壮侗系和苗瑶系民族比汉族人数更多的广西自治区,但我们相信平话人群这个汉族中的早期分支应该也不会例外。我们研究了470个平话群体的个体样本(其中包括195名男性)以及来自广西壮族自治区北部六个地区(贺州、富川、罗城、金秀、三江和武宣)其他的族群(壮族、侗族、仫佬、拉珈和瑶族)。对这些样本的mtDNA和Y染色体进行了检测。在平话人群中发现了高频的Y染色体单倍群O2a和O*,这两种单倍群总是高频出现在南方少数民族中。只有罗城县和金秀县的平话群体保持着汉族常见的O3a5a。在平话人群中找到的mtDNA谱系有B4a、B5a、M*、F1a、M7b1和N*,呈现出类似周边原住族群尤其是壮侗民族的遗传图谱。平话人群、其他汉族支系以及其他东亚族群的遗传分支分析(系统树、主成分分析和STR网络),表明平话人群比其他汉族支系更接近南方少数民族。混杂分析同样证实了这个结果。在语言、文化和自我认同方面,平话人群的祖先被汉族所吸收,从而导致平话人群成为汉族一致性遗传结构的例外分支。
附件: 您所在的用户组无法下载或查看附件
材料与方法
族群样本
我们采集了来自广西壮族自治区的贺州、富川、罗城、金秀、三江和武宣县的197个平话人群的样本。血液样本随机选自健康和无关的个体,包括101名男性和96名女性。这些样本分别取自居住在不同乡镇的个体以避免取样偏差。临近的对照样本同样选自广西原住少数民族,包括拉珈人、壮族、仫佬族、侗族和瑶族。对照样本也来自健康和无关的个体,样本数273个(94名男性和179名女性)。(以下略)
结果
Y染色体单倍群频率
195个男性个体的Y染色体单倍群是根据ISOGG分类法确定的。数据来自我们新近采集的样本,在表1中给出。平话人群主要的单倍群是O2a*、O3a5a和O*,接近于周边的少数民族的遗传图谱(O2a*、O3*、K和O*)。但是汉族的高频单倍群O3a5a似乎只在罗城和金秀两组较小的样本中有较高的发生频率。和之前研究的结果一样,O3a5a在原住人群中是比较罕见的。一些单倍群的分布与种族有关:O1a和O2a*在壮侗人群中高发;而O3*和O2a*在苗瑶人群中高发;O3、O3a5和O3a5a在汉族中较常见。O2a*在平话人群中发生频率最高,说明该群体更接近南方少数民族而不是其他的汉族群体。
mtDNA单倍群频率
在470个样本我的ID发现了43种mtDNA单倍群(表2)。平话人群中高发的mtDNA单倍群是B4a、B5a、
M*、F1a、M7b1和N*,这很类似周边少数民族的发生频率,尤其是壮侗族群。金秀的平话群体有高频的F3单倍群,有别于其他群体。罗城的平话人群常见M7*单倍群,频率也比其他人群高。这两组人群的mtDNA和Y染色体单倍群图谱都有别于其他平话人群,但是也可能是样本数较少的缘故。B、F、R9a、R9b、N9a和M7单倍群是南方原住族群常见的单倍群。壮侗族群的特征单倍群是B4a、B5a、F1a、M7b1、M7b*、M*、R9A和R9b,苗瑶的的特征单倍群是B4a、B5a、M*、M7b*、C、B4b1、M7b1、F1a、B4*和R9b,汉族则是A、C、D、G、M8a、Y和Z。平话人群的mtDNA单倍群图谱与南方原住民族的图谱更接近,而与汉族有一定差异。
系统树聚类分析
在图2的系统树中,我们对多个东亚族群的Y染色体和mtDNA数据进行聚类分析。在分析时合并了属于相同语群的群体。十个汉族分支和六个其他语群以族群平均发生频率进行合并。
附件: 您所在的用户组无法下载或查看附件
在Y染色体单倍群的系统树中,除平话人群以外,所有汉族分支聚为一个组,表明汉族群体父系遗传结构具有高度一致性。藏缅族群落入了汉族的簇中,这与汉藏语群的分类地位相吻合。南方原住民族语群构成了另一个簇。而平话人群的分支落入了这个聚类中,显示了平话人群的南方特征。北方主要的语群——阿尔泰语系,独立于上述两个聚类之外。在汉藏聚类簇的内部,人群主要是按地理位置而不是按语言聚类。在地理上接近的湘语和粤语分支同样在聚类树上也最接近,尽管在语言上湘语应该属于吴、徽、和赣方言的语支。在mtDNA数据的聚类上地理的影响表现得更为清晰。最南方的群体(壮侗、苗瑶、平话、粤、闽)全部聚为一个簇。
主成分分析
附件: 您所在的用户组无法下载或查看附件
在平话人群的主成分分析中用到了汉族和少数民族的数据。在图3a的Y染色体散点图中,可以看到在主成分1和主成分2上南方和北方汉族群体都紧密地聚集成一个簇,在图3b的mtDNA散点图中,北方和南方汉族仍然紧密聚集,只有少数南方汉族群体出现离散。因此,主成分分析反映出汉族高度一致的遗传结构,而南方少数民族数据的分布普遍很分散。在Y染色体散点图上,除了金秀和罗城的群体外,其他平话人群都是很远离汉族的聚类簇。在mtDNA的散点图上,所有的平话群体都离散于南方少数民族之中,也反映出族群之间基因流动上的性别差异。母系遗传谱系总是在父系支配婚姻下非常频繁地流动。因而平话人群的母系遗传谱系才会比父系更接近他们周边的民族——壮侗和苗瑶族群。
主要单倍群的STR网络分析
附件: 您所在的用户组无法下载或查看附件
Y染色体单倍群的主体是O2a*、O*、O3a5a。在参考族群中,我们只发现在壮族中有高频的O*;而在汉族群体大量可用的数据中,O*很罕见或者未测出。因此我们无法分析O*的网络结构。在图4中,我们分析了O2a*、O3*和O3a5a单倍群的6个短串重复序列多态性(STRP)特征,并将平话群体样本的STRP单倍型与汉族、壮侗族群和苗瑶族群进行比较,发现O2a*网络中至少存在两个核心单倍型:一个在图上部,而另一个在近中间的位置。上方的分化中心为壮侗、孟棉和平话群体占据。绝大多数其他的汉族分支在图上半部分,可以看到一个汉族特有的小分支存在于粤东闽南语人的末端节点中。这个汉族小分支源自苗瑶族群的单倍型,并与相邻的汉族和畲族(东部苗瑶族群)的历史相吻合。纯粹的壮侗族群或者苗瑶族群同样可以观察到,这表明STR网络提供了与种族有关的信息。大多数壮侗和苗瑶民族的单倍型位于O2a*网络的中心。而大多数平话及其他汉族群体很可能源自这个单倍型,因为他们大都位于网络的末端。平话人群与南方少数民族共享的单倍型更多一些,而与其他汉族群体共享的较少。他们也有很多单倍型与南方少数民族相连,表明大部分携带单O2a*单倍群的平话人来源于南方少数民族。如果与两大原住族群比较的话,平话人的单倍群与苗瑶族群有着更密切的联系。在O3*的网络中,苗瑶单倍型更接近中心,汉族的小分支出自苗瑶的单倍型,而壮侗的单倍型处于外围。平话个体和壮侗个体共享更多的单倍型。在O3a5a的网络中,平话个体与汉族个体的关系最为密切,这些样本都来自罗城,在平话群体中罗城的样本具有最高频率的O3a5a。
附件: 您所在的用户组无法下载或查看附件
附件: 您所在的用户组无法下载或查看附件
mtDNA的HVS-1(高可变I区)主题和RFLP(限制性片段长度多态性)信息在表2中给出。在这个遗传主题的基础上,我们分析了mtDNA单倍群B4*、B4a、B5a、N9a、F*、F1a、R9b和M7(图5)。mtDNA的HVS-1主题取自有关文献资料。mtDNA的网络全都呈现“太阳”形,由巨大的核心单倍型和四周围绕的大量“日光”般的单倍型所组成。可以看到各语言群体之间错综复杂的融合关系。在F*、M7和N9a的网络中,平话的样本与其他汉族群体关系最密切,表明平话人保持着比汉族父系成分更多的源自汉族母系的成分。但是就总体而言,平话人群的母系遗传仍然与南方少数民族更为接近。
混合分析
汉族起源于华北(山西省一带)并在2500年前开始向南方地区扩展。因而南方汉族遗传上可能的来源是北方汉族和南方少数民族(主要是壮侗和苗瑶族群)。华南汉族群体中这两种亲本族群的混合比率可以用混合分析进行评估。我们使用两种程序(ADMIX2.0和LEADMIX)来估算平话人群父系和母系遗传谱系的混合比。我们假定混血始于2500年前,鉴于其他汉族群体在遗传上相互都很类似,我们将那些样本(1693个Y染色体和2159个mtDNA个体,见表3)汇总为一个可能的亲本人群。我们汇总了华南全部的壮侗和苗瑶族群作为另一可能的南方少数民族亲本族群,(1677个Y染色体和2374个mtDNA个体)。表3清楚地显示出两种程序得出了基本相同的结果。无论在父系还是母系遗传上,南方少数民族对平话人群的贡献率都大大高于汉族群体,表3中所示汉族比率为负值,也许意味着汉族对南方少数民族的贡献率甚至高于对平话人群的贡献率。STR网络所反映的平话人群与两个亲本族群的关系同样也包含在表3中。在Y染色体网络中,平话样本与南方少数民族共享或邻接单倍型明显很多,超过了与汉族共享或邻接的数量。而在mtDNA网络中,平话人群却不特别接近南方少数民族。作为结论,我们主张平话人群的父系主要来自南方少数民族,而母系受到其他汉族群体的影响。
讨论(节选)
……
然而我们未能证实现代平话人群继承了古代平话人群的遗传结构。平话人群可能起源于早期汉族移民,并且保持着源于汉族的核心遗传成分。例如在O3a5a(汉族中常见的单倍群)的网络中(图4),平话样本更接近其他汉族样本而不是南方少数民族,而且有些平话样本处于网络的末端。这意味着平话人群与其他汉族群体分离后,两者的父系遗传谱系各自独立地发展了若干世代。因此也存在另一种可能性:古汉人(从遗传和文化上定义)在广西定居下来之后,曾发生过来自周边原住族群的大规模基因流动,从而使平话人群的古汉族遗传特征显著淡化。也就是说,平话人可能是“遗传上转变了的”汉族移民后裔。