进化树进化树分支上的数字表示什么?进化树的长度呢/。

进化树  时间:2021-07-28  阅读:()

进化树的序列进化树

构建序列进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估。

建立一个比对模型的基本步骤包括:选择合适的比对程序;然后从比对结果中提取系统发育的数据集,至于如何提取有效数据,取决于所选择的建树程序如何处理容易引起歧义的比对区域和插入/删除序列(即所谓的indel状态或者空位状态)。

一个典型的比对过程包括:首先应用CLUSTALW程序,然后进行手工比对,最后提交给一个建树程序。

这个过程有如下特征选项:(1)部分依赖于计算机(也就是说,需要手工调整);(2)需要一个先验的系统发育标准(即需要一个前导树);(3)使用先验评估方法和动态评估方法(推荐)对比对参数进行评估;(4)对基本结构(序列)进行比对(对于亲水氨基酸,推荐引入部分二级结构特征);(5)应用非统计数学优化。

这些特征选项的取舍依赖于系统发育分析方法。

三种主要的建树方法分别是距离、最大节约(maximum parsimony, MP)和最大似然(maximum likelihood,ML)。

最大似然方法考察数据组中序列的多重比对结果,优化出拥有一定拓扑结构和树枝长度的进化树,这个进化树能够以最大的概率导致考察的多重比对结果。

距离树考察数据组中所有序列的两两比对结果,通过序列两两之间的差异决定进化树的拓扑结构和树枝长度。

最大节约方法考察数据组中序列的多重比对结果,优化出的进化树能够利用最少的离散步骤去解释多重比对中的碱基差异。

距离方阵方法简单的计算两个序列的差异数量。

这个数量被看作进化距离,而其准确大小依赖于进化模型的选择。

然后运行一个聚类算法,从最相似(也就是说,两者之间的距离最短)的序列开始,通过距离值方阵计算出实际的进化树,或者通过将总的树枝长度最小化而优化出进化树。

用最大节约方法搜索进化树的原理是要求用最小的改变来解释所要研究的分类群之间的观察到的差异。

最大似然方法评估所选定的进化模型能够产生实际观察到的数据的可能性。

进化模型可能只是简单地假定所有核苷酸(或者氨基酸)之间相互转变的概率一样。

程序会把所有可能的核苷酸轮流置于进化树的内部节点上,并且计算每一个这样的序列产生实际数据的可能性(如果两个姐妹分类群都有核苷酸“A”,那么,如果假定原先的核苷酸是“C”,得到的“A”的可能性比起假定原先就是“A”的可能性要小得多)。

所有可能的再现(不仅仅是比较可能的再现)的几率被加总,产生一个特定位点的似然值,然后这个数据集的所有比对位点的似然值的加和就是整个进化树的似然值。

单一的进化树的数量会随着分类群数量的增长而呈指数增长,从而变为一个天文数字。

由于计算能力的限制,一般只允许对很小一部分的可能的进化树进行搜索。

具体的数目主要依赖于分类群的数量、优化标准、参数设定、数据结构、计算机硬件以及计算机软件。

有两种搜索方法保证可以找到最优化的进化树:穷举法和树枝 跳跃法(BB)。

对于一个很大的数据集,这两种方法都很不实用。

对分类群数量的限制主要取决于数据结构和计算机速度,但是对于超过20个分类群的数据集,BB方法很少会得到应用。

穷举法要根据优化标准,对每一个可能的进化树进行评估。

BB方法提供一个逻辑方法,以确定那些进化树值得评估,而另一些进化树可被简单屏蔽。

因此BB方法通常要比穷举法快得多。

绝大多数分析方法都使用“启发式”的搜索。

启发式现搜索出相近的次优化的进化树家族(“岛屿”),然后从中得到优化解(“山顶”)。

不同的算法用不同程度的精确性搜索这些岛屿和山顶。

最彻底也是最慢的程序(TBR,tree bisection-reconnection,进化树对分重接)先把进化树在每一个内部树枝处劈开,然后以任意方式将劈开的碎片重新组合起来。

最快的算法只是检查一下相邻终端的不太重要的重新组合,因此倾向于找到最近的岛屿的山顶。

降低搜索代价的最好方法是对数据集进行剪除。

影响优化搜索策略选择的因素(数据量,数据结构,时间量,硬件,分析目的)太复杂,无法推荐一个简单可行的处方。

因此进行搜索的用户必须对数据非常熟悉且有明确的目标,了解各种各样的搜索程序及自己硬件设备和软件的能力。

除上述当前应用最广的方法外,还有大量的建立和搜索进化树的其它方法。

这些方法包括Wagner距离方法和亲近方法(距离转化方法);Lake的不变式方法(一个基于特征符的方法,它选择的拓扑结构包含一个意义重大的正数以支持颠换);Hadamard结合方法(一个精细的代数方阵方法,对距离数据或者观察到的特征符进行修正);裂解方法(这个方法决定在数据中应该支持哪一个基于距离的可选的拓扑结构);四重奏迷惑(Quartet puzzling)方法可以为ML建树方法所应用,这个算法相对而言是个较快的进化树搜索算法。

已经有一些程序可以用来评估数据中的系统发育信号和进化树的健壮性。

对于前者,最流行的方法是用数据信号和随机数据作对比实验(偏斜和排列实验);对于后者,可以对观察到的数据重新取样,进行进化树的支持实验(非参数自引导和对折方法)。

似然比例实验可以对取代模型和进化树都进行评估。

微生物进化树有什么作用

碱基替代实际上是一种模型,就是描述4种碱基间的发生突变替代的概率情况。

有不同的模式,1参数模型:4种碱基间变化概率都一样 A->T 0.25, T->C 0.25, G-A 0.25, .... ,4参数模型,6参数模型等,c常见的分析GTR + I + model (a General Time Reversible model with a proportion of invariable sites and a gamma-shaped distribution of rates across sites). 上述模型仅适合分析基因序列。

用蛋白序列的需要用其他模型。

分析几个同源基因的变化可以画个简单的树,用NJ方法就行,但是如果要研究家族功能,进化等,需要用极大似然基于统计模型的方法。

进化树分支上的数字表示什么?进化树的长度呢/。

进化树分支上的数字表示产生新的基因复制或享有共同祖先的生物体的歧异点。

树枝的长度反映当这些事件发生时就存在的蛋白质与蛋白质之间的进化距离。

根据进化树不仅可以研究从单细胞有机体到多细胞有机体的生物进化过程,而且可以粗略估计现存的各类种属生物的分歧时间。

通过蛋白质的分子进化树分析,为从分子水平研究物种进化提供了新的手段,可以比较精确的确定某物种的进化地位。

对于物种分类问题,蛋白质的分子进化树亦可作为一个重要的依据。

扩展资料:? 生物界各个物种和类群的进化,是通过不同方式进行的。

物种形成(小进化)主要有两种方式:一种是渐进式形成,即由一个种逐渐演变为另一个或多个新种;另一种是爆发式形成,如多倍化种形成,这种方式在有性生殖的动物中很少发生,但在植物的进化中却相当普遍。

世界上约有一半左右的植物种是通过染色体数目的突然改变而产生的多倍体。

物类形成(大进化)常常表现为爆发式的进化过程(如寒武纪大爆发),从而使旧的类型和类群被迅速发展起来的新生的类型和类群所替代。

参考资料来源:搜狗百科-进化树

.asia域名是否适合做个人网站及.asia域名注册和续费成本

今天看到群里的老秦同学在布局自己的网站项目,这个同学还是比较奇怪的,他就喜欢用这些奇怪的域名。比如前几天看到有用.in域名,个人网站他用的.me域名不奇怪,这个还是常见的。今天看到他在做的一个范文网站的域名,居然用的是 .asia 后缀。问到其理由,是有不错好记的前缀。这里简单的搜索到.ASIA域名的新注册价格是有促销的,大约35元首年左右,续费大约是80元左右,这个成本算的话,比COM域名还贵。...

如何低价香港服务器购买?有没有便宜的香港服务器推荐?

如何低价香港服务器购买?想要做一个个人博客,想用香港服务器,避免繁琐备案,性能不需要多高,只是记录一些日常而已,也没啥视频之类的东西,想问问各位大佬有没有低价的香港服务器推荐?香港距大陆近,相比美国服务器最大的优势在于延迟低,ping值低,但是带宽紧张,普遍都是1M,一般戏称其为“毛细血管”。同时价格普遍高,优质稳定的一般价格不菲。大厂云梯队阿里云、腾讯云两家都有香港服务器,要注意的是尽量不要选择...

Linode 18周年庆典活动 不断改进产品结构和体验

今天早上相比很多网友和一样收到来自Linode的庆祝18周年的邮件信息。和往年一样,他们会回顾在过去一年中的成绩,以及在未来准备改进的地方。虽然目前Linode商家没有提供以前JP1优化线路的机房,但是人家一直跟随自己的脚步在走,确实在云服务器市场上有自己的立足之地。我们看看过去一年中Linode的成就:第一、承诺投入 100,000 美元来帮助具有社会意识的非营利组织,促进有价值的革新。第二、发...

进化树为你推荐
腾讯win10升级助手电脑管家win10升级助手在哪qq空间维护qq空间相关功能升级维护怎么解除?垃圾文件清理bat一键清理系统垃圾文件.bat 的原理dnf客户端消失最近DNF玩着玩着客户端忽然无故消失,怎么回事人脸检测综述人脸识别的主要应用方向及其优缺点?创业好项目论坛谁能提供点真实可靠的,网络创业赚钱项目?cf服务器爆满CF老是服务器爆满nero教程如何使用NERO刻碟操控人心如何笼络人心,如何让别人有危机感。联通玩电信游戏关于联通到底能不能去电信区玩游戏。。。。
tier linkcloud 2014年感恩节 腾讯云数据库 主机屋免费空间 国外空间 铁通流量查询 韩国网名大全 可外链相册 美国堪萨斯 流媒体加速 宏讯 独享主机 新加坡空间 个人免费邮箱 可外链的相册 netvigator 小夜博客 winserver2008 WHMCS 更多