76
通常
群体
遗传学家使每条
种系树
水平线的长度
,
与遗传改变的量成正比
例。长度越长,核苷酸差异越多。
假设核苷酸差异是由于突变随着时间发生
,
并假设突变发生的速率是恒定的
(
这并不是肯定的事
),
人们可以向后倒数到在
进化史的估计时间
(
在这种情况下,
50
和
250
年前
),
并通过画一条与树垂直的
线
,
线穿过
种系树的交叉
,
确定在每一个特定的时间中出现多少独立的谱系。
如果所有的估计是正确的,这棵树
50
年前有五个谱系
, 250
年前有两个谱系。
根据这一程序
,
阿亚拉计算
,
在我们最后与黑猩猩共同祖先的估计时间
,
是四百万至六百万年前(并非肯定的事
,
这些估计数字不断变化)
,
群体中
HLA-DRB1
基因共有
32
个分别的版本
。
为了让所有这些基因变异可以遗传到现
代,他还估计祖先人数的最低不少于
4,000
,长期平均有效群体的大小为
100,000
。
(
注
5)
像阿亚拉的稳定状态的人口模型
,
这个大数位是必要的。
在
这种条件下,假设随机交配和基因漂流,随着时间的推移
,
基因是容易丢失
的,这样一个大的始创族群是必要的,可以保证所有的基因继续传播。
因为这
个最小估计是
4,000
,阿亚拉声称,人类群体在任何时间内
,
都不可能只通过两
个人的基因瓶颈遗传而来。
在他看来,在
HLA-DRB1
的变异实在有太多祖先的多
样性。
对挑战的挑战
让我们回来检查阿亚拉的分析是怎么做的。
他反对亚当和夏娃的两人袓
先
谱系
,
是基于群体遗传学模拟随着时间而来的人群基因变化频率,以及祖先
基因谱系如何易于凝聚在一起。
他用来重建这些
谱系
树并计算祖先族群大小
的方程式有赖于简化和假设,使数学可以运作,正如我前面所言。
这些明确
的假设包括在时间过程中有一个
恒定背景突变率
,
正在研究的
DNA
序列中
缺乏遗
传基因的拣选
,群体的成员
随意交配
,
繁殖的群体大小
没有因移民增加或缩
小
,并有
恒定的群体人口
。
如果这些假设变得不切实际的话,这模拟的结果可
能存有严重的缺陷。
群体遗传学模型中也有埋着
隐藏
的假设
,
是被依赖来证明它们的结论,例
如,谱系树的绘制法假定共同祖先树的存在。
群体遗传学公式还假设随机过程
是遗传变化在历史中发生的唯一原因,这是从自然主义得来的一个假设。
如果
有非自然的因素,甚至是未知的自然原因
,
不按着随机过程进行干预而产生的
遗传变化
,
就不是在它的解释范围之内。
事实证明,从阿亚拉用于他的分析的特定
DNA
序列
HLA-DRB1
,是
保证会
获
得高估的数据,因为他没有充分安排两个上述的假设
---
假设正在研究的
DNA
序列中
缺乏遗传基因的拣选
,
和在时间过程中有一个
恒定背景突变率。
HLA-
DRB1
被称为是有被强烈选择的异合子性能,这意味着有两个不同版本的基因给
你一个更好的机会对付寄生虫和疾病。
不仅如此,阿亚拉研究的特定区域
(
外
显子
2)
似乎有一个比背景突变率要高得多的突变率。
事实上,它是在我们的基
因组的最可变基因之中的最可变区
,
并且它可能是一个
基因转变的热点
(
hotspot for gene conversion
)
这种突变特别可能混淆以共同祖先和简约系