「本系列教程内容大纲」
目录
第三章 参考基因组序列和注释文件的下载
3.1 有独立的网站基因组文件下载
3.2 NCBI 中下载基因组文件
3.3 注释文件gtf格式和gff格式
GTF格式与GFF的之间的转换
前面三天的教程,我们学习《转录组的上游分析》第一章节和第二节的内容。本系列教程前面三章的内容都算是比较基础的知识,但是,也是我们必须所了解的。
模式植物中,拟南芥、番茄、 烟草等都有自己的基因组网址。
茄科类作物基因组:https://solgenomics.net/organism/solanum_lycopersicum/genome
这仅仅只是我们举的其中一个例子,具体的参考基因组网址你需要自己查询。自己对于自己做的这块的网址应该是很熟悉的,我们这里就不多做讲解。
我们点击,Tomato就可以进入到我们的网址界面,如下图所示。
这里显示了,Tomato最新的参考基因组序列和注释文件(SL 4.0
和ITAG4.0
),以及也有JBrowse
等工具链接。进入对应的网址,即可下载参考基因fa文件和注释文件(gtf
或gff
格式)
注释文件
可以根据NCBI中进行下载
步骤:
#转录组上游分析教程 | 零基础