汉族母系线粒体DNA主成分浅析

来源:兰海的分子人类学论坛 作者:baiyueren

    前言

    其实我认为汉族是一个晚近时期形成的文化共同体,而不是一个血缘和遗传共同体。但是从另一角度来说,以往大量的文献和数据都揭示了华中和北方地区的汉族在血缘上的交流混合更加均匀。个人认为这个过程并不是始于汉族(或其前身华夏族)形成之后,而是在汉族(华夏族)形成之前,从农业文明兴起开始,在广阔的东亚大地上这种血缘交流与融合已经进行了很长时间。而这种混血融合的所形成的东亚遗传连锁群体,应该都保留在现在所谓的“汉族人群”中。因此把汉族当作一个界定参与混合的东亚遗传人群的来进行分析,至少有一部分结果应该是有现实参考和指导意义的。

    鉴于分析是前几年完成的, mtDNA数据主要来自复旦和云南所的论文,分型比较粗,基本只到亚单倍群的级别,所以不再正式发表论文而只在网坛披露主要分析结果。欢迎转载,注明原作者即可。

    本文线粒体数据的分型:A、B4*、B4a&B4b、B5b、C&Z、D*、D5*、D5a、F1a、F1b、F1c、F2a、*、M*、M7*、M7b&M7b1、M7b2、M7c、M8a、M9a、N*、N9a、R9F、Y、West(西部欧亚)

    本文涉及的汉族样本:新疆汉族、北京汉族、大连汉族、甘肃汉族、青岛汉族、陕西汉族、青海汉族、淄博汉族、香港汉族、四川汉族、台湾汉族、武汉汉族、昆明汉族、凤城汉族、泰安汉族、安徽汉族、长汀汉族、广州汉族、湛江汉族、湖南汉族、江苏汉族、江西汉族、上海汉族、四川汉族、曲靖汉族、浙江汉族、河南汉族、山西汉族、潮汕汉族、闽南汉族、莆仙汉族、赤峰汉族

    正文

    汉族第一主成分

    汉族第一主成分占总信息量的53.9%。相关性分析显示与D*(含D4但不含D5,下同)单倍群关联性最大。从分布上看汉族各地区都有分布,但是北方的频率更高,特别是在陕西、山西、宁夏一带更为高发。但是因此这基本上可以看成是东亚人遗传成分中最古老的底层。

    汉族第二主成分

    第二主成分占总信息量的10.6%,其高发区域非常明确,核心是在广西和广东西部地区,云南南部地区也有一定分布。进一步的分析显示第二主成份与M*B4aB4b关联性最为密切。我个人认为第二主成份很可能代表了在某一史前时期(也许是农业文明初期)自北部湾地区开始扩张的一支祖先人群的遗存。从梯度分布判断迁徙的主体方向是向北。

    汉族第三主成分

    第三主成分占总信息量的6.7%,主要分布在东、西两个区域:其中西部云南一带最为高发,东部则是在福建-华中-中原一带比较高发。分析显示第三主成分主要与M7bF1a相联系。目前尚难以判断这支人群具体的动向,从分布上看似乎是从北部湾地区迁出后分为东西两支:东支往北向东亚大陆腹地迁徙;西支向云南一带迁徙,从流向上判断应该最终进入了印支半岛。

    汉族第四主成分

    第四主成分占总信息量的4.7%。从完成的分布图上看呈现一个很小的分布核心,从鄂豫皖三省交界一直延伸至河南北部。主要与AG单倍群相关联。这似乎与历史上关于华夏族在中原形成的传说想吻合,个人认为是代表了汉族(华夏族)的起源时期的遗传学痕迹。相反地,第四主成份在陕甘宁一带的分布频率很低,这是否说明了至少在母系上西北部氐羌人群并非是汉族的正源?

    汉族第五主成分


    第五主成分占总信息量的4.1%。从图上看呈现河南北部、四川成都平原、江西北部等多个中心。其确切含义并不很明确,也许是历史上汉族曾出现过大量人口增殖的地区。

    相关:

    D(xD4)

    D5x

    D5a

论坛讨论 >>>