Ka/Ks基础知识:
Ka/Ks表示的是非同义替换(Ka)和同义替换(Ks)之间的比例。这个比例可以判断是否有选择压力作用于这个蛋白质编码基因;了解Ka/Ks之前,首先要清楚同义/非同义突变概念。
同义突变表示突变后氨基酸序列并没有改变,氨基酸没有改变就不会影响蛋白质的结构的与功能,这样生物活性没有受到损失,也就不会被自然选择掉,因此这些突变碱基就会保存下来,其保留下来的碱基等于其突变率。非同义突变:表示氨基酸发生了改变,这样就影响了蛋白质的结构与功能,这样生物的生存能下降,有的则死亡,被自然选择掉。这样有些突变没有被保留下来,这样保留下来的突变碱基低于实际的突变率。
一般认为,同义突变不受自然选择,而非同义突变则受到自然选择作用。在进化分析中,了解同义突变和非同义突变发生的速率是很有意义的。常用的参数有以下几种:同义突变频率 (Ks)、非同义突变频率(Ka)、非同义突变率与同义突变率的比值(Ka/Ks)。如果Ka/Ks>1,则认为有正选择效应。如果Ka /Ks=1,则认为存在中性选择。如果Ka/Ks<1,则认为有纯化选择作用。
Ks = 同义突变SNP数/同义位点数, 即同义突变率
Ka = 非同义突变SNP数/非同义位点数, 即非同义突变率
同义突变SNP数= Σ同义SNP
非同义突变SNP数= Σ非同义SNP
同义位点数= Σ同义位点
非同义位点数= Σ非同义位点
Ka>>Ks或者Ka/Ks >> 1,基因受正选择(positive selection)
Ka=Ks或者Ka/Ks =1,基因中性进化(neutral evolution)
Ka<<Ks或者Ka/Ks << 1,基因受纯化选择(purify selection)
Ka/Ks的计算:
今天给大家分享一款比较好用的Ka/Ks计算软件-KaKs_Calculator,该软件既可以在windows系统操作,也可以在linux系统下运行。我知道很多人都习惯了windows系统,但是在使用KaKs_Calculator计算Ka/Ks时有一步文件格式转化(将同源序列比对文件转化为axt格式)只能在linxu上进行(小编还没找到在windows编译的程序),因此今天跟大家分享的方法也是基于linux系统,不用担心,其实很简单。
软件下载
KaKs_Calculator下载地址:https://sourceforge.net/projects/kakscalculator2/
跳转到下载首页点击下载即可。
计算Ka/Ks分两步:
1、同源序列比对
2、计算Ka/Ks
序列比对
首先你需要安装虚拟机,安装虚拟机的免费教程可以点击下文获得。
安装好虚拟机,将序列文件及解压过的KaKs_Calculator文件夹放入到一个本地文件夹,打开biolinux系统,将这个本地的文件夹配置成共享文件夹。这里对序列文件是有要求的,每个文件中只能存放一对同源序列。
下面就开始序列比对,在biolinux界面的输入clustalw,点击enter就会进入到clustalw交互界面,在界面输入1点击enter,出现第二个红框输入序列所在文件名按enter键进入下一步。
会出现如下图界面,输入2(多序列比对)点击enter。
出现下图界面,选择1点击enter。
接下来就是结果输出文件,它也会给你一个推荐的名称,推荐使用这个推荐的名称,输入名称之后还是点击enter。
上一部分分析完就会出现下图界面,让你输入第二个结果输出的文件名称,推荐使用这个推荐的名称,输入名称之后还是点击enter。
比对分析完会出现下图界面,输入x结束,然后ctrl+c退出序列比对界面,接下来是计算ka/ks。
使用软件计算Ka/Ks
在进行完同源序列比对之后就可以计算ka/ks,首先是文件转化,将序列比对结果文件中的aln文件转化为axt文件,如下图所示的一行命令。
转化完就可以计算,命令如下图所示,id1.kaks就是结果输出文件。
结果注释参照下图参数。
这些就是小编今天分享的内容,希望对大家有所帮助。