导航:首页 > 研究方法 > 分子进化分析的主要方法

分子进化分析的主要方法

发布时间:2022-05-15 13:20:02

❶ 分子进化的核酸进化

核酸是遗传物质,可以明显地看到在生物进化过程中各种生物每一基因组的核酸的量在总的趋势上逐渐增加(表1)。
从总的趋势来看,愈是低等生物DNA量愈少,愈是高等则愈多。但是这规律对于某些生物显然并不适用,原因是多方面的。一般生物愈是高等则所需要的基因愈多(见基因),可是进化达到某一阶段以后,基因的数目便不再相应地增加。细菌的呼吸代谢和氨基酸、核苷酸代谢途径与人没有多大差别,这一事实足以说明有关的酶的结构基因没有太大的增加。倍性对于每一细胞中的DNA的含量有很大的影响。纤毛虫的DNA含量特别高便是由于这一原因。例如双小核草履虫(Paramecium aurelia)的大核是860倍体,梨形四膜虫(Tetrahymena pyriformis)的大核是100倍体。被子植物的每一细胞中的DNA含量较高也是由于这一原因(见染色体倍性)。各种生物的不编码蛋白质的重复序列和内含子的量不同是使 DNA含量不同的另一原因。 生物进化过程中 DNA的质也在发生变化。用分子杂交方法可以分析各种生物的DNA的相似程度(表2)。
对于某一类生物来讲,例如在灵长类动物和细菌等生物中都可以用同样的方法来测定它们的亲缘关系(图1)。
进化中的保守性 分子杂交测定的结果只能说明两种生物的DNA的相同或不同程度,通过DNA顺序分析才能知道它们怎样相同或不同。对于大肠杆菌和λ噬菌体等的46个启动区进行核苷酸顺序分析,发现在每一个基因的mRNA转录位置前面相隔10个碱基对的地方有一个称为普里布诺顺序的保守区,它包括核苷酸顺序TATAATG。这里面特别是从左面开始第1、第 2和第6这几个碱基如果变为G或C就会导致转录效率下降,尤其是第6位上的T,在46个例子中从没有发现过例外。在高等生物中存在着的类似保守区称为霍格内斯顺序。
在 5个肠道杆菌科(Enterobacteriaceae)细菌中曾经分析了它们的染色体DNA复制起点的245个核苷酸的顺序,发现它们的相同的顺序可以多达85%,同样说明这一顺序具有很强的保守性。
这一类保守区的存在说明这些结构对于各自的功能是十分重要的,因而在生物进化过程中不容轻易改变。至于个别基因或染色体片段的位置改变则在进化过程中可以发生而保存下来。个别核苷酸的改变同样可以发生而保存下来,这些变化可以清楚地反映在各种近缘生物的染色体和遗传学图的比较研究中,也可以反映在蛋白质的比较研究中。

❷ 分子进化树的构建主要有哪些算法

简单步骤

1 序列的比对,然后将比对好的序列转化成.nex格式

2 运行MrBayes,简单步骤如下:(依次输入命令,完成简单也最常用的分
析):Execute filename.nex,打开待分析文件,文件必须和mrbayes程序在同一目录下。Lset nst=6 rates=invgamma,该命令设置进化模型为with gamma-distributed rate variation across sites和a proportion of invariable sites的GTR模型。模型可根据需要更改,不过一般无须更改。

3 mcmc ngen=10000 samplefreq=10,保证在后面的可能性分布中probability distribution至少取到1000个样品。默认取样频率:every 100th generation。

4 如果分裂频率分支频率split frequencies的标准偏差standard deviation在100,000代generations以后低于0.01,当程序询问:“Continue the analysis? (yes/no)”,回答no;如果高于0.01,yes继续直到该值低于0.01。

5 sump burnin=250(在此为1000个样品,即任何相当于你取样的25%的值),参数总结summarize the parameter,程序会输出一个关于样品(sample)的替代模型参数的总结表,包括mean,mode和95 % credibility interval of each parameter,要保证所有参数PSRF(the potential scale rection factor)的值接近1.0,如果不接近,分析时间要延长。

6 sumt burnin=250,总结树summarize tree。程序会输出一个具有每一个分支的posterior probabilities的树以及一个具有平均枝长mean branch lengths的树。这些树会被保存在一个可以由treeview等读取的树文件中。

什么是分子进化列举分子进化的研究方法

分子进化列举分子进化的研究方法

**************************************************************
如果你对这个答案有什么疑问,请追问,
另外如果你觉得我的回答对你有所帮助,请千万别忘记采纳哟!
***************************************************************

❹ 运算最慢的分子进化树构建方法

运算最慢的分子进化树构建方法是贝叶斯法。
从计算速度来看,最快的是基于距离的方法,几十条序列几秒钟即可完成。其次是最大简约法。最大似然法就要慢得多。最慢的是贝叶斯法。但是不算准确度来看,算得最慢的贝叶斯法确是最准确,而算得最快的基于距离法结果确是最粗糙。从实用的角度,建议使用最大似然法。因为这种方法价从速度还是准确度都比较适中。
虽然软件可以快速自动地完成系统发生树的构建,但是对于基本算法的了解还是必不可少的。以非加权分组平均法(UPGMA法)为例,介绍如何通过计算所有序列两两间的距离,再根据距离远近构建系统发生树。序列两两间的距离可以用双序列比对得出的一致度/相似度代表,或用其他简化值代替。
虽然软件可以快速自动地完成系统发生树的构建,但是对于基本算法的了解还是必不可少的。
(4)分子进化分析的主要方法扩展阅读:
保守区用于构建进化树
保守区选择是系统发育分析过程中一个重要的步骤。分析时可以选择保守位点,也可以选择基因全长序列,但是当序列差异大时,建议保留保守序列用于进化树构建。常用的保留序列保守区的软件有Gblock、MEME等。
进化树构建方法的选择
算法英文名算法中文名
ML,Maximum likelihood 最大似然法
NJ,Neighbor-Joining 邻接法
MP,Maximum parsimony 最大简约法
ME,Minimum Evolution 最小进化法
Bayesian 贝叶斯推断
UPGMA 不常用

❺ 分子进化的蛋白质进化

蛋白质差异 可以用免疫学方法测定各种生物的蛋白质的亲缘关系,例如用人的清蛋白注射家兔,从家兔取得抗血清,把抗血清分别和人、大猩猩、黑猩猩等的清蛋白进行沉淀反应测定,可以看到愈是亲缘关系相近的清蛋白沉淀反应愈强。
同工酶的电泳测定是70年代发展起来的可以用来比较生物蛋白质的亲缘关系的方法。同工酶是功能相同而一级结构不相同的酶。一种蛋白质中任何一个氨基酸的替代,只要它带来用电泳方法可以区分的电荷差别就可被检出,但如果没有带来电荷差别便不能检出。由于这一方法简便、快速,所以在分子进化的研究中常被采用。例如曾用电泳方法对包括魏氏果蝇 (Drosophilawil-listoni)在内的9种果蝇14个亚种的 36种酶的同工酶进行分析,根据分析的结果可以绘制出它们的系谱图。

❻ 分子进化的简介

分子进化
molecular evolution
生物进化过程中生物大分子的演变,包括前生命物质的演变;蛋白质分子和核酸分子的演变以及细胞器和遗传机构(例如遗传密码)的演变。分子进化的研究可以为生物进化过程提供佐证,为深入研究进化机制提供重要依据。
广义的分子进化有两层含义,一是原始生命出现之前的进化,即生命起源的化学演化;二是原始生命产生之后生物在进化发展过程中,生物大分子结构和功能的变化以及这些变化与生物进化的关系,这就是通常所说的分子进化。

❼ 什么是酶分子定向进化有哪些方法

酶分子定向进化:模拟自然进化过程(随机突变和自然选择)在体外进行酶基因的人工随机突变,建立突变基因文库,在人工控制条件的特殊环境下,定向选择得到具有优良催化特性的酶的突变体的技术过程。

筛选方法:平板筛选法,荧光筛选法,噬菌体表面展示法,细胞表面展示法,核糖体表面展示法

❽ 分子进化与小进化讲了不一样的故事,两者的区别和联系在哪里

分子进化(Molecular Evolution)(Molecular Evolution)(Molecular Evolution)(Molecular Evolution)与系统发育分析
系统发育学研究的是进化关系,系统发育分析就根据同源性状的分歧来推断或者评估这些进化关系。通过系统发育分析所推断出来的进化关系一般用分枝图(进化树) 来描述,这个进化树描述了分子(基因树)、物种以及二者之间遗传关系的谱系。由于“Glade”这个词(拥有共同祖先的同一谱系)在西腊文中的本意是分支,所以系统发育学有时被称为遗传分类学(cladistics) 。
在现代系统发育研究中,重点己不再是生物的形态学特征或其他特征,而是生物大分子尤其是序列,对序列的系统发育分析又称为分子系统学或分子系统发育研究。它的发展得益于大量序列的测定和分析程序的完善。比起许多其他实验性学科,分子系统学与其他进化研究一样有其局限,即系统发育的发生过程都是己经完成的历史,只能在拥有大量序列信息的基础上去推断过去曾经发生过什么,而不能再现。由于系统发育分析不太可能拥有实验基础,至多是些模拟实验或者病毒实验:如何处理序列从中得到有用信息、如何用计算的办法得到可信的系统树、如何从有限的数据得到进化模式成为这个领域的研究热点。
1进化树构建
构建进化树的方法包括两种:一类是基于序列类似性比较,主要是基于氨基酸/核酸相对突变率矩阵计算不同序列差异性积分作为它们的差异性量度而构建的进化树;另一类是在难以通过序列比较构建进化树的情况下,通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立的进化树。
2评估进化树和数据
现在己经有一些程序可以用来评估数据中的系统发育信号和进化树的健壮性。对于前者,最流行的方法是用数据信号和随机数据作对比实验(偏斜和排列实验):对于后者,可以对观察到的数据重新取样,进行进化树的支持实验(非参数自引导和对折方法)。似然比例实验可以对取代模型和进化树都进行评估。本文只阐述几个常用的方法:
偏斜实验(Skewness Test):统计的临界值随着分类群数口的不同和序列中点的不同而不同,对随机数据集呈现的信号很敏感,可以用来决定系统发育信号是否保留着。
排列实验(PTP, permutation tail probability):对MP树的分值和那些通过对每一个位点都进行大量排列组合而得到的数据所推算出来的进化树的分值进行比较,从而决定在原始数据中是否存在系统发育信号。
自引导评估(bootstrap ): Bootstrap是由Felsenstein (1985)引入分子分类领域的,现己成为分析分子树置信区间最常用的方法。其原理是假定某序列Ao有N个位点,Bootstrap复制时从Ao中随机取N个位点。Ao中的某些位点可能被随机遗漏,而某些位点则可能取到不仅一次,由此组成一个新序列A1。对一组数据复制n次,则可得到Ao衍生的n组数据。由此可构建n个分子树,根据“多数规则”( majority rule)从这n个分子树中统计得到一致树(consensus tree ),一致树中各分支结构在n个分子树中出现的比率便表示原始数据对该结构的支持率。
可以对任何建树方法进行评估。模拟研究表明,在合适的条件下也就是各种替换速率基本相等,树枝基本对称的条件下,如果自引导数值大于70,那么所得的系统发育进化树能够反映真实的系统发生史的可能性要大于95 % 。
3 线性树(Linearized Tree)
在进化中,虽然核酸或氨基酸的替代绝不会是严格恒定的,但是在估计序列间分歧时间方面,分子钟依然有用。当今我们对物种间的分歧时间或基因重复事件发生的时间仍知之甚少,因此为了理解进化过程,即便粗略地估计分歧时间也是十分重要的。排除比平均速率显着慢或快的谱系,并对剩余的谱系按分子钟假说构建进化树,就有可能估计不同谱系对间或不同序列对间粗略的分歧时间。按此途径构建的树称为线性树。线性树始终遵循分子钟假说。线性树的构建分如下几个步骤:(1)用无需速率恒定假说的构树法对一组序列构建可靠的树,并用外类群序列定出树根。(2)对所用序列检验速率恒定假说,并删除与平均速率有显着偏差的序列。 (3)用速率恒定假说对剩余的序列重建一棵系统树。(4)如果己知某一序列对的分歧时间和序列分歧度,则能标定进化时间。
进化树的构建方法
1 建立数据模型
建立一个比对模型的基本步骤包括:选择合适的比对程序,然后从比对结果中提取系统发育的数据集,至于如何提取有效数据,取决于所选择的建树程序如何处理容易引起歧义的比对区域和插入/删除序列(即所谓的空位状态)。一个典型的比对过程包括:首先应用CLUSTALW程序及类似程序,进行多序列比对,最后提交给一个建树程序。这个过程有如下特征选项:①部分依赖于计算机;②需要一个先验的系统发育标准(即需要一个前导树);③使用先验评估方法和动态评估方法对比对参数进行评估;④对基本结构(序列)进行比对;⑤应用非统计数学优化。这些特征选项的取舍依赖于系统发育分析方法
2 决定替代模型
替代模型既影响比对,也影响建树。因此需要采用递归方法。对于核酸数据而言,可以通过替代模型中的两个要素进行计算机评估,但是对于氨基酸和密码子数据而言,没有什么评估方案,其中一个要素是碱基之间相互替代的模型。另外一个要素是序列中不同位点的所有替代的相对速率。还没有一种简单的计算机程序可以对较复杂的变量(比如,位点特异性或者系统特异性替代模型)进行评估,同样,现有的建树软件也不可能理解这些复杂变量。
(1)碱基取代模型。
一般而言,生物化学性质相近的碱基之间的取代频率较高。在DNA中,四种转换(A→G,G→A,C→T,T→C)的频率比颠换(A→C,A→T,C→G,G→T)以及它们的反向取代的频率要高。这些偏向会影响两个序列之间的预计分歧。各残基之间的相对取代速率一般用矩阵形式给出:对碱基而言,行和列都是4,对于氨基酸,行和列都是20(如PAM矩阵)。对于密码子,行和列都是61(除去终止密码子)。矩阵中对角元素代表不同序列拥有相同碱基的代价,非对角线元素对应于一个碱基变为另一个碱基的相对代价。固定的代价矩阵就是典型的静态权重矩阵,MP法中使用的就是这种,如图5。又如在ML法中,代价值是山即时的速率矩阵得到,如图6,这个矩阵代表了各种取代可能会发生的概率的ML估计值。
图6中,非对角线兀素an代表一个变化的瞬时速率、不同取代之间的相对速率和目标碱基的频率。而对角线兀素是非零值,很有效说明了一种可能性,即序列之间的分歧度越大,越有可能在很偶然的情况下拥有相同的碱基。还有一种模型称为“时间可逆”,认为“前进”和“进化”的取代速率相同。任何一种“时间可逆”的核葺酸取代模型都可以用图2-5的矩阵来刻画,只用其中任何一个速率和其他任何速率的差异即可,在任意组合中,最多可达6个参数,每个速率参数都是独立的。图5 权重矩阵
(2)位点之间取代速率模型。
除了前面取代模型的多元化外,序列中各个不同位点之间的取代速率差异也会对进化树的结果产生深远影响。关于位点之间的速率差异(位点异质性),一个最明显的例子就是在三联体编码中,第三个编码位点比前两个更加容易发生变化。在分析编码序列时,许多发育分析都会将第三个位点排除:然而在某些情况下,速率差异模型会更加敏锐,如rRNA的保守序列。对位点差异的取代速率予以估值的方法有非参数模型、不变式模型和Gamma模型。非参数模型在MP法中使用,对ML法被认为在计算上不可行。不变式模型对一定比例的位点进行估值,而这些位点不能自由变化,其余的位点假定为等概率变化。Gamma模型假定一给定序列变化的概率服从Gamma分布,据此指定位点的取代概率。Gamma分布的形状决定于其参数,描述了一个序列中各个位点的取代频率分布。目前DNA的替代模型有十种之多,再加上不变位点参数和形状分布参数。Gamma,模型更有几十种之多, 几种有代表性的替代模型是JC, F81, K80, HKY和GTR。
(3)取代模型的选择
最好的取代模型并不一定总是拥有最多参数的模型。因为对每一个参数进行估值都会引入一个相关变量,从而使整体的变数增加,有时甚至会对模型起到抑制作用。在PAt中可以对DNA序列的取代模型进行规范一个较好的策略,使用似然法同时评估几个,可逆的取代速率、gamma分布的形状参数和不变位点的比例。通过估算的取代参数,可以通过比较较多参数和较少参数分别评估得到的似然分值,决定一个简化的模型是否合理。目前较好的选择模型方法是似然比检验(LikelihoodRatio Test)
3建树方法
目前,三种主要的建树方法分别是距离法(如Neighbor joining , NJ) 、最大简约(Maximum parsimony, MP )和最大似然(Maximum likelihood ML)。最大似然方法考察数据中序列的多重比对结果,优化出拥有一定拓扑结构和树枝长度的进化树,这个进化树能够以最大的概率导致考察的多重比对结果。距离法考察数据组中所有序列的两两比对结果,通过序列两两之间的差异决定进化树的拓扑结构和树枝长度。最大简约方法考察数据组中序列的多重比对结果,优化出的进化树能够利用最少的离散步骤去解释多重比对中的碱基差异。距离方法简单地计算两个序列的差异数量。这个数量被看作进化距离,而其准确大小依赖于进化模型的选择。然后运行一个聚类算法,从最相似(也就是说,两者间的距离最短)的序列开始,通过距离值方阵计算出实际的进化树,或者通过将总的树枝长度最小化而优化出进化树。
用最大节约方法搜索进化树的原理是要求用最小的改变来解释所要研究的分类群之间的观察到的差异。 最大似然方法是评估所选定的进化模型能够产生实际观察到的数据的可能性。进化模型可能只是简单地假定所有核苷酸(或者氨基酸)之间相互转变的概率一样。程序会把所有可能的核苷酸轮流置于进化树的内部节点上,并且计算每一个这样的序列产生实际数据的可能性(如果两个姐妹分类群都有核苷酸+ A‑,那么,如果假定原先的核苷酸是“C",得到现在的“A-’的.可能性比起假定原先就是“A+’的可能性要小得多)。所有可能的再现(不仅仅是比较可能的再现)的几率被加总,产生一个特定位点的似然值,然后这个数据集的所有比对位点的似然值的加和就是整个进化树的似然值。
4 进化树搜索
单一的进化树的数量会随着分类群数量的增长而呈指数增长,从而变为一个天文数字。由于计算能力的限制,现在一般只允许对很小一部分可能的进化树进行搜索。具体的数量主要依赖于分类群的数量、优化标准、参数设定、数据结构、计算机硬件以及计算机软件。
现在有两种搜索方法保证可以找到最优化的进化树:穷举法(exhaustivealgorithms)和树枝一跳跃法(BB, branch -and-band)。对于一个很大的数据集,这两种方法都很不实用。对分类群数量的限制主要取决于数据结构和计算机速度,但是对于超过20个分类群的数据集,BB方法很少会得到应用。穷举法要根据优化标准,对每一个可能的进化树进行评估。BB方法提供一个逻辑方法,以确定哪些进化树值得评估,而另一些进化树可被简单屏蔽。因此BB方法通常要比穷举法快得多。
绝大多数分析方法都使用“启发式”的搜索。启发式算法(heuristic algorithms搜索出相近的次优化的进化树家族(“岛屿”),然后从中得到优化解(“山顶”)。不同的算法用不同程度的精确性搜索这些岛屿和山顶。最彻底也是最慢的程序(TBR, treebisection-reconnection,进化树对分重接)先把进化树在每一个内部树枝处劈开,然后以任意方式将劈开的碎片重新组合起来。最快的算法(NNI , nearest-neighborinterchange)只是检查一下相邻终端的不太重要的重新组合。因此,倾向于找到最近的岛屿的山顶。
降低搜索代价的最好方法是对数据集进行剪除。影响优化搜索策略选择的因素(数据量数据结构,时间量,硬件,分析口的)太复杂,无法推荐一个简单可行的处方。因此,进行搜索的用户必须对数据非常熟悉且有明确的口标,了解各种各样的搜索程序及自己硬件设备和软件的能力。
除上述当前应用最广的方法外,还有大量的建立和搜索进化树的其它方法。这些方法包括Wagner距离方法和亲近方法(距离转化方法):Lake的不变式方法(一个基于特征符的方法,它选择的拓扑结构包含一个意义重大的正数以支持颠换):Hadamard结合方法(一个精细的代数方阵方法,对距离数据或者观察到的特征符进行修正):裂解方法(这个方法决定在数据中应该支持哪一个基于距离的.IJ选的拓扑结构):四重奏迷惑(Quartet puzzling)方法,该法,可以为ML,建树方法所应用,这个算法相对而言是个较快的进化树搜索算法。
5 确定树根
上述的建树方法所产生的都是无根树(进化树没有进化的极性)。为了评估进化假说,通常必须要确定进化树的树根。确定系统发育进化树的树根并不是个简单问题。一种确定树根的好方法就是分析时加入一个复制的基因。如果来自绝大多数物种或者所有物种的所有的平行基因在分析时都被包含进去,那么从逻辑上我们就可以把进化树的树根定位于平行基因进化树的交汇处,当然要假定在所有进化树中都没有长树枝问题。

❾ 如何从分子生物学水平讨论生物进化

从分子水平来研究生物进化通常有两个途径:蛋白质序列的比较和DNA序列的比较。
蛋白质序列比较常见到的是细胞色素C的氨基酸序列在不同物种之间的差异。因为几乎任何生物体的细胞内都存在细胞色素C。例如人的细胞色素C与黑猩猩的差异为0,与猕猴的差异为1,与马的差异为12,与果蝇的差异为27,与向日葵的差异为38。可以根据各种生物的细胞色素C氨基酸一级结构的差异导出一个生物进化树,这个进化树要比传统的靠外观分析描述出的进化树更具科学性。
随着各种生物的DNA序列逐步被破译,通过DNA序列进行生物进化研究是近些年来更加盛行的,一个非常重要的比较是人类与黑猩猩的DNA序列比较分析:美国加州大学伯克利分校的进化生物学家Allan Wilson和他的研究生Mary-Claire King认为,人类和黑猩猩的基因差异仅有1%。在一片质疑声中,最终DNA测序研究支持了他们的观点,这也成了人们的普遍认识。这一研究甚至导致了对人类的生物学分类的挑战,认为黑猩猩应当归于人属,这是不是分子水平对生物进化的研究成果呢?
更有意义的是:人类与黑猩猩相比所具有的高度只能只是由于这1%的DNA序列不同导致的!这些差异到底表现在哪里,是那几个基因引起了如此巨大的差异呢?这个问题是不是很令人兴奋?
进一步的研究表明,虽然DNA的变化总体只有1%,但在黑猩猩第22染色体和对应得人类第21染色体的比较,差异达到1.44%,表现为68000个碱基对,约400多KB的差别,但这些差别导致了83%的蛋白质表达出现差异,而蛋白质氨基酸序列的差别造成活性和功能有了差别,于是差异便被放大了。还有研究表明人类的染色体中比黑猩猩多处很多重复片断,是否由于这些好似没有功能的重复片断影响到智力的差异呢?这些问题还有待研究。

阅读全文

与分子进化分析的主要方法相关的资料

热点内容
桃木剑打磨方法视频 浏览:643
脑神经用什么方法治疗 浏览:935
眼睛黄素瘤治疗方法 浏览:829
回血鸽子配对方法视频 浏览:183
蜂蜜怎么熬制作方法 浏览:214
平板闪退的解决方法 浏览:453
单色釉真假鉴别方法 浏览:434
适用于对比研究的方法 浏览:311
荒岛上快速获得淡水的方法 浏览:157
增多肌肉的训练方法 浏览:846
劓刑读音是什么行刑方法 浏览:621
控制器参数的工程整定方法有哪些 浏览:671
嘌呤片计算方法 浏览:271
室内隔热条的安装方法 浏览:542
紫草油宝宝使用方法 浏览:293
沙漠空气取水方法图片 浏览:385
治疗香港脚的方法 浏览:270
郑强教学方法有哪些 浏览:196
研究方法中的测验 浏览:652
党校开展课题研究的方法 浏览:969