Daic博士论文:澳泰族群的遗传结构

复旦大学.023 生命科学学院.人类生物学.

        由于学科领域的自然哲学的发展,特别是方法论的发展,分子人类学已经脱离了遗传学的范畴,真正的成为了一门独立的融汇自然科学和人文科学为一体的交叉科学。在分子人类学的研究中,人体的DNA材料作为工具,来分析群体中的各种结构关系,获得的结果叫做遗传结构,以此来与各种其它领域的人类学研究结果综合判断群体的系统发生历史。本文就是以这种方法来探索澳泰族群的系统发生和发展。

       本文用的DNA材料主要目前是分子人类学中最为有效的Y染色体单倍群结构和线粒体单倍群结构,分别代表着群体的父系和母系结构。本文所研究的澳泰族群,包括分布于中国大陆和东南亚各国的侗傣、黎仡族群,中国台湾岛的原住民,分布于东南亚、太平洋、印度洋岛屿的马来-波利尼西亚族群。采集的样本量有1,325例,包括了大陆和台湾几乎所有的澳泰群体,以及越南、泰国、印尼的大量群体。通过与大量东亚其他族群的数据比较,发现这些澳泰族群不仅文化上有许多共同之处,遗传结构上也有非常明显的共性。澳泰族群最明显的特征性标记是Y-SNP单倍群O1。整个澳泰族群的演变过程基本上可以根据对O1单倍群的内部结构观察得到。另外,线粒体单倍群B4a,B4b,M7b等等也具有澳泰族群的特征。研究发现,澳泰族群是5万年前走出非洲的现代人类的一个分支。现代人类来到远东地区以后,形成了蒙古利亚人种的群体,并由东南亚向东亚大陆进发。大约3万年前,群体在云贵高原两侧分为两条路线北上,南亚-苗瑶-汉藏从西线走缅甸-云南路线;澳泰族群从东线走越南-广西路线。在北部湾一带,澳泰群体孕育了很长时间,O1单倍群就是2万多年前在此出现的。

       澳泰族群的分化和扩张分为三个阶段。

       第一个阶段是旧石器时代的分化,首先是广西内陆的山地群体和北部湾沿岸的群体发生了差异。山地群体后来发展成为雒越。O1出现在沿海群体中,并随后者的沿海岸迁徙扩张开来,在海南岛的黎族中保存了最古老的结构。一万四千多年前,沿海群体向东迁徙,散布到了整个广东和台湾的海岸线上。台湾的原住民就是从那个时期开始形成遗传基础。稍后,北部湾的沿海群体又有部分沿着越南海岸南下,后来发展成马来族群。所以我们观察到,遗传结构中台湾和马来族群相隔得非常明显,两者都联结在大陆的侗傣族群上。在大约一万年前,广东西部的群体和东部的群体发生了差异,西部群体后来大部分演化成仡佬族,而东部是侗傣族群的祖先。所以我们发现与仡佬族遗传关系最密切的是现代的侗水族群。

       第二个阶段是新石器时代的扩张和分化。大约8000多年前,广东东部的某一个部族中开始萌发新石器文化和农业文明,并迅速扩张开来。这次扩张先是形成了三个族群,向浙江的迁徙形成了江浙的越族祖先,并发展出了辉煌的河姆渡文化和良渚文化;向台湾的渡海迁徙形成了台湾平埔族的一部分;在广东和福建的内部扩张形成了侗傣族群的第二个遗传层次。对O1的年代估算确实发现,江浙的越裔人群、侗水族群、台湾原住民的这一部分年代都是8000多年。到了5000年到3000年期间,闽越和南越发生了分化,闽越向北分出了东瓯,南越向西分出了西瓯。西瓯和雒越融合形成了壮傣族群的祖先。而仡佬族的祖先向西北迁徙到了贵州,建立了夜郎诸国,同化了当地的许多南亚语百濮族群,使得我们现在观察仡央族群遗传结构的时候可以看到明显的二元性。

      第三个阶段是历史时期的流散和迁徙。2000千多年前,在汉族的扩张压力下,澳泰族群百越民族纷纷离开东南沿海。特别是闽越在强制移民政策下,几乎完全离开了福建。故而在福建几乎看不到澳泰遗传特征了。部分闽越群体逃亡到了广东,并渐渐向西迁徙到贵州,演化成了今天的水族类民族。我们可以观察到,大陆的民族中与台湾遗传联系最多的是水族。广东的南越群体也大规模地向西北迁徙,形成了今天的侗族类群体。壮傣族群中有一部分人向中南半岛迁徙,渐渐分化成了现在的傣泰族群。我们通过分子人类学的遗传结构分析,大致了解了澳泰族群源头的发生历史。但是还有大量的向外流散过程还没有调查分析。对古代族群的研究推断还没有足够的实证。所以澳泰族群的遗传结构研究还任重道远。

文波先生博士论文:Y染色体、mtDNA多态性与东亚人群的遗传结构

作者简介:文波,1975年5月出生,2000年9月师从于复旦大学金力教授,于2004年7月获博士学位。

中文摘要

    单系遗传的Y染色体DNA和线粒体DNA(mtDNA)已经成为研究人类遗传结构最有效的工具之一。本论文分析了120个东亚群体5131例个体的Y染色体DNA多态性,以及101个东亚群体4238例个体的线粒体DNA多态性。这些群体几乎覆盖了东亚所有的地区及语系。本论文对这些数据进行了系统的分析,以期从父系遗传和母系遗传两个角度探讨东亚人群基因库的构成、遗传变异的地理结构、遗传进化与语言进化的相关性,以及人群的迁徙和融合等问题。

    关于现代人起源的“走出非洲”假说已经得到了遗传学证据的广泛支持,但是现代人走出非洲以后的迁徙路线,特别是进入东亚地区的路线还存在很多争议。先前的研究提出了两条主要的迁徙路线,一条由中东进入中亚和东亚北部(北线),另一条沿着亚洲大陆海岸线进入南亚和东亚南部(南线)。为了探讨这两条迁徙路线对东亚人群基因库的相对贡献,本论文第一、二章分别考察了Y染色体、mtDNA单倍群在东亚及周边地区的分布并结合基因多样性的比较,提出Y染色体的O-M175、C-M130、D-YAP单倍群以及mtDNA的B、R9、M单倍群为南线成分,两者分别构成了80%和85%的东亚人群父系、母系基因库;而来自北线的谱系仅仅包含了9%和1.2%的东亚人群Y染色体和mtDNA。这一结果充分表明史前来自南线的遗传成分构成了当今东亚人群基因库的绝对主体。

    遗传变异的地理分布格局是人群遗传结构研究的基本问题之一。第三章通过对Y染色体、mtDNA以及常染色体STR数据的分析探讨东亚人群遗传变异的地理结构。Y染色体和mtDNA主成分综合图显示出南北方向的梯度变化,南北大致以长江为界,与经典遗传标记的分析结果相一致;对STR数据的多维尺度分析也显示出南北人群的分化。空间自相关分析进一步揭示出南北人群之间显著的渐变格局,Mantel检验表明遗传距离和地理距离在总体上呈显著正相关。按照地理区域分组进行分子方差分析得到非常显著的组间差异,尤其是按照南北分组。以上分析结果表明东亚人群的遗传变异从父系遗传和母系遗传的角度看均存在显著的地理结构,其中最明显的特征是南北人群之间的遗传差异。

    探讨语言分类与遗传变异之间的相关性是人类群体遗传学研究中的重要问题之一,但是东亚地区的相关研究还比较缺乏。第四章探讨语言分类与遗传变异之间的相关性。对东亚人群Y染色体、mtDNA数据的主成分分析和分子系统学分析显示同一语系人群的Y染色体有聚类倾向,而mtDNA没有明显的趋势。分子方差分析进一步表明Y染色体按照语系分组有非常高的组间差异(6-10%),而mtDNA的组间差异非常小(0-3%),有的情况下甚至不显著。说明东亚人群的Y染色体与语言有显著相关性,而mtDNA与语言学分类之间没有明显的关联。因此,从遗传学的角度看,“父语”是对东亚地区基因进化与语言进化相对关系更恰当的表述。

    第五章比较东亚人群mtDNA和Y染色体的群体间差异(固定指数),发现东亚人群Y染色体的分化程度(约16%)远大于mtDNA的分化程度(约4%),提示女性的迁徙率远大于男性。这一结果说明婚后居住在男方(Patrilocal)的婚姻组织结构对东亚人群遗传多态的影响非常明显,导致男性之间的遗传差异远远大于女性之间的差异。

    历史学证据以及先前的遗传学研究均提示汉藏语系(包括汉语族和藏缅语族)人群共同起源于中国北方。近2500多年来汉藏语系人群向南方发生了大规模的迁徙,当时居住南方的主要是说侗台、南亚和苗瑶等语言的人群。需要回答的问题是这些人群到达南方以后是否并且在多大程度上与南方当地人群发生了基因交流?本论文第六章对汉藏语系人群的遗传结构进行分析,通过单倍群频率比较、主成分分析和分子方差分析,显示现居住南方的藏缅语人群在父系遗传上接近北方人群,而母系遗传上更接近南方人群。对混合比率的估计显示南方藏缅人群的Y染色体平均有62%的北方成分,而mtDNA则平均只有44%的北方成分。这些结果说明藏缅语人群南迁以后和南方人群发生了大范围的基因交流,并且在交融过程中存在明显的性别偏向性,北方人群的Y染色体和南方人群的mtDNA 分别构成了其父系和母系基因库的主体。

    对汉族的分析也得到了类似的结果。Y染色体的主成分分析显示几乎所有的汉族人群形成一个聚类,而对mtDNA的主成分分析则显示出南北方汉族之间的明显差异。混合分析结果表明南方汉族在父系遗传上保留了大部分北方汉族的成分(平均北方成分约80%),而母系遗传上则融入了相当多的南方民族血缘(平均北方成分约50%)。这一结果与历史记载的汉族南迁相一致,提示汉文化由北向南的传播主要是人口迁徙驱动的过程。

    第七章综合了遗传学和其它相关学科的证据,对南北东亚人群之间的遗传差异进行了定量描述,并对南北差异产生的机制以及南北分化的时间进行了探讨。分子方差分析结果显示,南北东亚人群之间Y染色体和mtDNA的差异分别为8.2%和5.9%,各占群体间总差异的38%和69%,说明南北人群之间的遗传差异是非常可观的。综合前六章的分析结果,提出由南向北的迁徙以及随后的地理限制性扩张是导致南北差异最主要的原因,北线成分在东亚分布的地区性差别进一步加剧了南北差异。自然选择也可能是造成这一差异的原因之一,但尚需进一步的研究。根据分子钟估计,南北分化的时间在2万年之内,第四纪末次冰川开始缓解到消失的1.8-1万年前可能是形成南北差异的关键时期。近2500年来汉藏语系人群向南的扩张在一定程度上缓解了南北人群之间的遗传差异。

    关键词:东亚人群,Y染色体,mtDNA,遗传结构,南北差异,汉藏语系,迁徙,融合

谢选华硕士论文:从Y染色体遗传结构看藏缅语族人群的起源

复旦大学.023 生命科学学院.人类生物学.

摘要:据历史文献记载,现代藏缅人群源于原始氐羌部落。在过去2000-3000年里,由于受到秦和其他王朝的压迫,他们被迫从中国西北地区南迁,进入四川、西藏、云南和东南亚地区。过去对藏缅人群遗传结构的研究主要集中于藏族和南方藏缅群体,而对更能代表原始氐羌部落的氐(白马)和羌族一直缺乏必要的了解。对藏族人群的Y染色体多样性的研究导致了藏族的多重起源假说:一支携带高频D-YAP+单倍群的中亚人群在较晚近的历史时期与另一支携带高频O3-M122的东亚人群混合而成。本文通过分析46个藏缅人群的Y染色体非重组区单倍群分布从父系遗传学角度证实北方藏缅群体(氐、羌、藏)更能代表原始藏缅人群;而南方藏缅人群则与当地其他语系(苗瑶、侗台、南亚和南岛语系)的人群发生了较大规模的基因交流;同时,部分生活在云南西北部和印度东北部的藏缅群体(独龙、景颇等)经历了极强的瓶颈效应,形成了高频的O3e-M134单倍群。进一步对8个北方藏缅人群的Y染色体单倍群研究显示了明显的双重结构:高频的D-YAP+和O3-M122。通过考察两者在世界和东亚人群中的分布,发现原始氐羌人群很可能是由两个不同时代到达东亚地区的人群混合而成:旧石器时代(甚至更早)的D-YAP+和新石器时代的O3-M122人群。白马人(氐人后裔)显示了最高频的D*(50%)和D(75%)单倍群,以及最低频的O3-M122,因此最可能代表旧石器时代人群的后裔;而羌和藏可能是由新、旧两个时代人群混合而成。

《美国体质人类学学报》东亚南方的线粒体DNA多样性和群体分化

李辉,蔡晓云,文谷-伊丽莎白,文波,程栩,覃振东,刘文泓,柳扬帆,潘尚领,钱吉,谈家桢,金力

    中国南方的民族系统中,藏缅、汉、苗瑶的线粒体遗传结构都做过系统的研究,但是还缺乏侗台和南亚语族群的系统研究。侗台是中国南方最主要的民族系统,对东亚和东南亚各个民族的遗传结构产生过非常大的影响。对中国境内所有的侗台群体和部分越南群体(共30个)的774个体进行了线粒体单倍群的分型,发现侗台群体具有高频率的南方类型比例,是典型的中国南方民族群体。中国南方和越南的南亚系统的14个群体126个体的HVS-1序列和功能区酶切的新数据也作了报道. 利用已发表的东亚群体线粒体多态数据和本文的新数据,勾画了中国南方各个线粒体单倍群的网络结构, 发现各个族系之间有大量的共享单倍群,说明他们有高度的同源性。同时,在某些单倍群上,南方最大的两个族群侗台和苗瑶之间发生了分化。对各个高频的单倍群作时间估计,发现中国南方单倍群B,F,M7,R等在大约5万年前就形成了,而发生民族分化的分支的年龄都在2万年左右。这说明现代人在中国南方有着悠久的居住历史,但是民族分化是较晚发生的事件,并且分化之后的交流已就比较频繁。侗台和南亚语族群等中国南方群体的线粒体数据对分析东亚地区的群体历史有非常重要的意义。