欢迎关注”生信修炼手册”!
全基因组关联分析是目前研究复杂疾病易感性的最有效手段之一,通过芯片或者高通量测序得到全基因组规模的SNP分析结果,再结合卡方,费舍尔精确检验,线性回归等统计方法,快速分析与表型相关联的SNP位点。本文整理了GWAS数据分析相关的资料。
GWAS芯片是常用的SNP分型平台,但是其位点相比全基因组还是不够,此时可以通过基因型填充技术提高SNP位点数目
对分型结果进行质控后,就可以进行了GWAS分析了。GWAS的基本分析中设计到了卡方检验,费舍尔精确检验,线性回归,逻辑回归等统计方法
对于GWAS的分析结果,最常见的图表就是QQ图和曼哈顿图,以及locuszoom
传统的GWAS分析对象为SNP, 还可以进一步在gene, pathway等水平来进行关联研究
meta分析可以整合多个gwas分析的结果,增大样本量,提高检验效能
也可以将基因和基因之间的互作,基因和环境因素之间的互作考虑进来,一起分析
GWAS除了识别与表型关联的位点,还有很多应用
GWAS经过这么多年的发展,有很多已发表的公开数据集被收录到数据库中
GWAS要求的样本量很大,可以看到别人发表的高分文章中样本量在几千到几万的水平,整个实验的话费是比较高昂的。在GWAS的分析中,核心就是各种统计学方法的应用。
·end·
—如果喜欢,快分享给你的朋友们吧—
往期精彩
3DIV:染色质空间互作数据库
扫描下方二维码,关注我们,解锁更多精彩内容!
生物信息入门
只差这一个
公众号