第八章 群体遗传学

 

  研究生物世代之间遗传信息的传递规律,就必须以同种生物的许多个体构成的群体来实现,需要在群体水平上分析遗传现象。

  从遗传学意义上讲,群体(population)不是个体机械的集合体,而是指可以互相交配并能繁殖后代的一个自然群体,特称为孟德尔式群体(Mendelian population)。如所有中国人即可视为一个孟德尔式群体。但是居住在同一地域的同种个体,未必属于一个孟德尔式群体。如南非共和国的白种人和黑种人,由于种族歧视,禁止黑种人和白种人结婚,阻碍了两者之间的基因交流,所以保持着各自不同的基因库。这就是说在同一地域的同一物种内,可以共存若干个孟德尔式群体。在这个群体中全部个体所有基因的总和称为基因库(gene pool)。群体中每个个体的基因,都是群体基因库中的组成成分,在一群体内,不同个体的基因可能有不同的组合,但群体中所有的基因总是一定的。

第一节 群体遗传学的基本概念

 

一、群体遗传学

 

  研究群体内基因的传递规律和基因频率变化的科学称群体遗传学(population genetics)。它应用数理统计学方法,研究群体中基因频率以及影响基因频率的各种因素,由此探讨进化机制,是遗传学的分支学科。

  研究群体遗传学的目的,是揭示群体遗传组成变化的机制。如何表达群体遗传组成,并具有可分析的形式,这就需要定量表示,即群体的等位基因频率和基因型频率,进而研究群体中不同世代遗传结构的演变方式和比较群体间的遗传差异。

 

二、基因频率

 

  基因频率(gene frequency)是指在一群体中某一等位基因中的一种基因,在该基因位点上可能有的基因数与总基因数的比率。即:

 

  基因频率=其染色体上某基因的数目/该基因的等位基因总数基因频率是表示群体遗传组成的基本数量,是决定一个群体性质的基本因素。环境条件稳定且遗传结构不变时,基因频率也就不会改变。

  在群体中任何一个位点的全部等位基因频率之和等于1或100%。如一对等位基因A和a,假定A基因数和a基因数相等时,则A基因和a基因各占总数的50%,即A和a基因频率各为0.5。用符号p代表显性基因频率,q代表隐性基因频率(表8-1),则p+q=1。

 

三、基因型频率

 

  基因型是基因的一种组合,它决定着个体性状的表现型,任何一个群体都是由它所包含的各种基因型组成的。某一种基因型个体数在总群体中所占的比率称基因型频率(genotypic frequen-cy)即:

 

  基因型频率总和也等于1100%。

  用符号D代表显性纯合子基因型频率;H代表杂合子基因型频率;R代表隐性纯合子基因型频率(表81)即D+H+R=1

  在分析研究群体的遗传组成时,由于我们能直接感知的是个体性状的表现型,而个体某性状表现型,又是个体所具有的两个等位基因组成的基因型来决定的。因此,群体中的基因频率可以由基因型频率推算出来。如一等位基因Aa,可构成三种不同的基因型AAAaaa,其个数分别为n1n2n3,设总数为N,则n1+n2+n3=NN个体共有2N个基因;其中A基因的个数是2n1+n2a基因的个数是2n3+n2。因此, Aa的频率分别为:

 

  如果用基因型频率来计算时,基因型DR分别是:

D=n1/N

R=n3/N

  则基因频率pq可改写为:

  p=D+(1/2)H

  q=R+1/2H 2

  现以人类MN血型为例说明。在上海居民中调查的1788人中,M型为397人,N型为530人,MN型为861人,求基因型频率和基因频率。

  现已知MN血型是一对等位基因LMLN决定的,两基因是共显性,所以MMNN这三种血型相应的三种基因型为LMLMLMLNLNLN。其频率是:

D=n1/N=397/1788=0.222

H=n2/N=861/1788=0.482

R=N3/N=530/1788=0.296

  根据公式(1)求出

 

  根据公式(2)求出

P=D+1/2H=0.222+1/20.482=0.463

q=R+1/2H=0.296+1/20.482=0.537

  结果,等位基因频率LMLN分别为46%和 54%。

  因为p+q=1,所以当计算出pq中的一个,则另一个可用1减去即可求出它的值。如上例中p=0.463,则q=1-0.463=0.537

  如果一对等位基因有显性和隐性之分,即杂合子的表现型与纯合子相同,同样可用上法计算。

 

四、随机婚配

 

  随机婚配(random mating)是指在人类群体中,每个个体之间婚配机会相等。在人类的婚配中,有一些性状(如身高、体型、才智、肤色等)是有选择的,是非随机的。但有一些特定性状(如血型、酶等)是随机的(因为我们不会根据血型和酶的情况选择对象)。这些性状与其被选择的性状之间是不相关的。所以人类群体中,随机婚配的范围还是很广的。在研究群体遗传时,随机婚配是一个必要条件,以此为标准与其他的婚配(如近亲婚配等)进行比较。在随机婚配的情况下,两个基因型婚配的频率等于各自基因型频率的乘积。

第二节 群体的遗传平衡及其多态现象

 

一、哈带-温伯格定律

 

  哈带-温伯格(Hardy-Weinberg)定律即遗传平衡定律(lawof genetic equilibrium),是指在一个随机交配(婚配),而又无限大的群体内,所有配子生活力相等,在没有突变、选择、迁移的条件下,基因频率和基因型世代相传保持恒定不变,其基因型频率是基因频率决定的,这是英国数学家G.H.Hardy和德国医生WihelmWeinberg1908年各自独立提出来的,所以称哈带-温伯格定律。

  为了说明这个定律,假设一对等位基因Aa在群体中遗传,它们的频率分别是pqp+q=1,当随机交配(婚配)其子代产生的基因型AAAaaa(表82),它的频率为 D=p2H=2 pqR=q2,则这三个基因型个体产生配子的频率应是:

A=D+1/2 H=p2+1/22pq=p2+pq=pp+q=p

a=R+1/2H=q2+1/22pq=q2+pq=qp+q=q

 

  由此可见,子代基因A频率仍为p,基因a仍为q,而且将以这种频率在所有世代传递下去,这就是遗传平衡。假定上述亲代A基因频率p=0.6a基因频率=0.4,则p+q=0.6+0.4=1(表82),在随机交配(婚配)中,其子代(AA)个体是p2,(Aa)个体的频率是2pq,(aa)个体频率是q2。因此,子代A基因频率是:

p2+1/22pq=p2+pq=0.36+0.24=0.6

  同理,a基因频率是q2+1/22pq=q2+pq=0.16+0.24=0.4

  可见Aa频率仍和亲代相同,并未发生变化,这是一对等位基因世代相传的平衡公式,可概括为:p2+2pq+q2=1

  在群体中亲代的3种基因型个体在随机婚配中,就有9种不同的婚配形式,可合并为6种类型,通过各种婚配型所产生的子代基因型汇集起来(表83),其结果仍是AA=p2 Aa=2pqaa=q2。由此类推,群体中的基因频率和基因型频率就可以一代代保持平衡。

  以上说明,在一个大的随机交配(婚配)群体中,一对等位基因在没有突变、迁移及选择的条件下,则基因频率和基因型频率,世代相传保持恒定不变。基因型频率是由基因频率决定的;对一对等位基因来说,随机交配(婚配)一个世代,就可达到平衡。但如超过一个位点以上,则需要交配(婚配)几代才能达到平衡;一个群体在平衡状态时,基因频率和基因型频率的关系是:D=p2H=2pq R=q2

 

  根据哈带-温伯格定律能够比较容易的推算出隐性基因的频率,以及表型正常,基因型为杂合体的隐性基因携带者在群体中的概率。例如,苯丙酮尿症是人类一种代谢疾病,是由隐性基因引起的。婴儿出生几天后即可鉴别出隐性纯合体aa。我国曾在11个省市检查332 183个新生儿,其中19人为苯丙酮尿症。据此可计算出患儿的频率以及在正常个体中杂合隐性基因携带者的频率。即:

  隐性纯合子(患者)的频率q2=19/332 138=0.000057

  

  等位基因A的频率p=1-0.0076=0.9924

  杂合子的频率H=2pq=2×0.0076×0.9924=0.015

  由计算可知携带致病基因a的杂合体比患者多近300倍。

  根据哈带-温伯格遗传平衡定律,还可以计算出某一性状在群体中是否处于遗传平衡。可采用X2测验法进行验证。如果实得基因型频率与预测基因型频率差异小或符合程度大,则表明群体已达遗传平衡,如果差异大或符合程度小,则说明此群体未达到平衡,必须经一代随机婚配才能达到平衡。如前面所列举上海居民MN血型的调查例子中,总人数是1788,其基因型频率D=0.222H=0.482R=0.296;基因频率q=0.463q=0.537,据此,各基因型频率的预期值应为:

  MM=P2N=0.4632×1788=383

MN=2pqN=2×0.463×0.537×1788=889

  NN=q2N=0.5372×1788=516

 

  由此求出下列的X2(表84)。

  计算结果X2=1.770.10P0.20,表明三个基因型频率符合哈带-温伯格定律的群体(此时X2的自由度是1)。

 

三、遗传的多态现象

 

  在同一群体中共同存在着两种或两种以上不同遗传类型的个体的现象,称遗传的多态现象(polymorphism)。从基因频率的角度可认为是指同一位点上的两个或两个以上等位基因在群体中共存,其中频率最低的等位基因频率也超过基因突变和选择平衡所预期的频率。例如,人的ABO血型就是遗传多态现象。该血型系统是由同一位点3个复等位基因决定的,在各型间区分明确,在同一地区有一定的频率分布,而在不同的群体中各个基因频率也不相同。

  遗传的多态现象是广泛存在的。有时表面上相似的个体,实际上也是经常具有遗传的多态性,用电泳技术分析研究不同个体之间的同一蛋白质成分,或用限制酶分析人群间的同一DNA区段,几乎都发现其多态性,从而确认在大多数自然群体内存在大量的基因变异,多态性就表明变异的多样性,这就意味着进化。

  遗传多态可以在许多世代保持稳定,这是平衡多态。这多数是杂合体具有选择优势的情况下维持下来的。如镰状红细胞性状就是最典型的例子。镰状红细胞性状是受等位基因Hbs控制,HbA为正常红细胞等位基因。在非洲某些群体中,镰状红细胞贫血病患者(HbsHbs)几乎在未成年即死亡,基本上不留后代,有正常血红蛋白的正常人(HbAHbA)可因患恶性疟疾而死亡,所以在群体中其频率大大降低,只有杂合子的携带者(HbAHbs)因对疟疾有较强的抵抗力,即不患疟疾,也不患严重贫血而被维持下来。因此,使Hbs基因在后代保留下来。据调查,在非洲某些部落约有40%的人携带这种等位基因。这是杂合子的携带者占有选择优势而造成的。由于杂合子增高的生殖力可补偿生病隐性纯合子的消灭,使群体保持平衡多态。

  若该地域疟疾受到控制或被根除时,这种多态性就会逐渐消失,有利于镰状红细胞的选择也将被除去,平衡的多态性也不再存在。

 

第三节 影响遗传平衡的因素

 

  哈带-温伯格定律所讲的群体是个理想的群体,严格的说,在人类社会中是不存在的,而在自然界中,常有各种因素影响到群体的遗传平衡(如突变、选择、迁移和遗传漂变等)。这些因素都会打破原有的平衡,引起生物类型的演变,从而促进生物的进化

 

一、突变

 

  基因通过突变能形成另外的等位基因,从而影响基因频率的变化。设一对等位基因a的频率为qA的频率为p=1-qA突变为a的正突变率为ua的反突变为A的突变率为v。即:Aa Aa,则每一代中共有(1-quA突变为aqva突变为A。若(1-qu qv时,则:a的频率增加,若(1-ququ时,则A的频率增加,一般情况下,正的突变往往高于反向突变,在处于平衡状态时,即:

1-qu=qvu-qu=qv

  由此可知基因频率完全由突变率uv决定。但绝大多数基因的突变率很低,人类基因自然突变率为10-410-6,即在一万到百万个生殖细胞中,才有一个基因发生突变,由此看来,以基因突变改变基因频率是一个缓慢的过程,是需要很多世代的,在人类更是如此。

  突变在人类群体遗传中的作用,一方面突变是生物群体中遗传性变异的根本来源,通过突变为生物的进化提供了原材料,再加上自然选择和随机漂变等因素作用,从而导致生物的进化;另一方面由于反复突变,就使以低频率存在的有害基因,在人类和生物群体中被保持下来而不能被消灭。

  还应指出的是,在自然界中,突变和选择往往共同作用影响基因频率。

 

二、自然选择

 

  在一定自然条件下,群体内某些基因型个体比另一些基因型个体具有更高的成活率和生殖力。因此,在群体内就会逐渐占优势,这样在自然界的一个群体内,造成不同基因型个体成活率和生殖率差异的过程称为自然选择(natural selection)。

  我们知道,每个基因都制约着生物体的形态结构和生理特征,而这些特征、特性又都或多或少的影响着个体的生活力和繁殖力,影响其传给后代的能力。由此而论,大多数基因都要受到自然选择的作用。

  如果隐性基因是有害的,选择对隐性纯合体就是不利的,在群体中若一对等位基因有差异,它们可组成三种基因型,显性完全时,选择只对隐性纯合体起作用。因为显性纯合体和杂合体表型一样,不受选择的作用,所以使群体中隐性基因频率增高,而对一些对环境适应能力差的个体基因型频率降低,从而使基因频率也发生变化。当隐性基因频率很低时,选择对隐性基因的选择效果就会明显降低,这是因为大部隐性基因存在于杂合子中,选择对它不起作用。因此,隐性有害基因(人类中的色盲、血友病基因),难以从群体中完全除去。

  显性基因也有对生存不利的,它们也在选择作用下降低在群体中的比例,而且更为有效。这是由于具有显性基因的个体,不论是纯合体还是杂合体,都要受选择的作用。所以使基因频率的变化更为显著。如果显性基因是致死的或不育性的,只要经过一代便可淘汰。

  在自然选择中,突变和选择这两种因素是同时作用于一个群体的。一般来说,隐性基因在纯合状态时,选择对其是不利的,可是在群体中总还是有一定的比例,这是因为新突变不断产生的缘故。即,选择使隐性基因减少,突变又使隐性基因增加,在一定的条件下,它们可以达到平衡。

  自然选择是生物进化的动力,对生物体所发生的遗传变异有着去劣存良的作用,由于选择可使一些对环境适应能力强的个体基因型频率增高,而对一些对环境适应能力差的个体基因型频率降低,结果导致群体中基因型频率向着更适应环境的方向变化,因此说自然选择是自然界中的一种创造力。如在黑人群体中,较强的运动能力优势,与环境的适应和自然选择均有关系。

 

三、迁

 

  一个群体个体迁移至另一个群体,并与另一群体的个体婚配,称为迁移(migration),由于发生基因交流又称基因流(geneflow)。

  在一个大群体里,迁移引起基因频率的改变并不明显,这是因为迁入的个体数与大群体的个体数相比太小。如果迁入个体至小群体中,两群体间基因频率有差异时,则引起迁移后所构成的新群体基因频率的变化。而基因频率的变化是取决于两群体间基因频率的差异和迁移率(每代迁入者在群体中所占的比率)。

  假设一群体每代的迁移率为m,则原有个体所占的比例为1-m,设迁入个体等位基因的频率为qm,同一基因在原群体中基因频率为q0,这样,在新形成的群体内基因a的频率q1是:

q1=mqm+1-mq0=mqm-q0+q0 1

  在迁入一代后,引起的基因频率变化率△q,应该是迁入以前的基因频率与迁入后的基因频率之差,即:△q=mqm-q0+q0-q0=mqm-q0

  由公式可见,迁入率越大,两个等位基因的差数越大,则等位基因频率的变化率△q愈大,只有迁移停止,即m=0时,这个变化才会停止,否则等位基因频率将陆续变化,一直要到两个群体等位基因频率相等,即qm=q0时才停止。

 

四、遗传漂变

 

  哈带-温伯格平衡定律适用于无限大的群体,这样基因频率才不致因取样误差而随机波动,然而群体并非总是无限大的,因而基因频率也会发生波动,这种在有限的群体内,由取样误差而产生的基因频率随机波动,称为遗传漂变(genetic drift),也称随机漂变。这是由于在一个小群体内与其他群体隔离,不能充分的随机婚配,因而在群体内基因不能达到完全自由分离和组合,致使基因频率容易发生偏差,这种偏差不是突变、选择等因素引起的,而是由于小群体内基因分离和组合时产生的误差所引起的。

  尽管遗传漂变在任意群体中都能发生,但群体越小,遗传漂变对基因频率的影响愈大。在自然界的某些局部地区,由于气候剧变、地质结构变化、传染病流行或天敌侵害,使动植物个体数量显著减少时,遗传漂变的影响就相当明显,从而引起群体的遗传组成改变。所以有些遗传学家认为,遗传漂变也是进化的一种方式。许多中性和非适应性性状的存在,不能用自然选择来解释,可能是遗传漂变的结果。例如人类中的ABO血型是属于非适应性的中性性状,A型(或其他血型)的人并不比其他血型的人有更大的生存性,但是人类不同种族里基因IAIBi的频率是有差异的(表87),这种差异可能就是祖先发生变异随机扩散的结果。

 

    

  人类群体中血清蛋白、同工酶以及各种生理特征的多态现象,似乎都可用小群体内的随机漂变来解释。

  复习思考题

  1.名词解释

  孟德尔式群体、群体遗传学、基因频率、基因型频率、遗传多态现象

  2.哈带-温伯格定律的内容是什么?

  3.影响基因频率的因素有哪些?各因素的具体作用是什么?

  4.在人类群体中,白化病患者发生率为1/20 000,求白化病基因携带者的频率以及携带者人数为患者数的倍数(白化病为常染色体隐性遗传病)。

  5.1000人的群体中,已知O448人, A 298人,问其余两种血型的人数是多少?

  6.在一群体中,男性红绿色盲的频率7%,求该群体中女性红绿色盲和携带者的频率(红绿色盲为X性连锁隐性遗传病)是多少?