「摸鱼快报010」一个基于低覆盖度的全基因组测序的群体遗传学数据分析教程

摸鱼快报是一档致力于轻量化地收集优质生物信息学及相关领域资料带给大家的小栏目, 力求废话不多, 干货为王.

项目地址:https://github.com/nt246/lcwgs-guide-tutorial

image-20210312145237654

这个教程用到的数据是一种叫做Menidia menidia的小鱼(如下图所示), 内容涉及到数据处理(从fastq到bam文件)、Genotype和SNP calling(一时想不到怎么翻译成中文)、连锁不平衡分析、种群结构分析和自然选择分析的内容.

(其实如果只是学习方法论的话, 什么数据都无所谓的啦~)

Throughout this course, you will be working with data from the Atlantic silverside, Menidia menidia, a small estuarine fish.

image-20210312145553299

把整个教程浏览完之后我的感觉是这个教程短小精悍, 内容看起来不多但是极其丰富.

比如说第一天教你从测序的fastq数据处理到bam文件, 也就是上游分析, 这个过程中提供了大量的shell脚本的写法, 是很好的学习用shell脚本来处理生物信息学数据的范例.

image-20210312183357853

还有一个很有意思的发现: 这个教程里用于SNP calling的软件既不是主流认为的金标准软件`GATK或者是samtools+bcftools的流程, 而是一个没怎么听说过的ANGSD(Analysis of Next Generation Sequencing Data, 文章链接: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-014-0356-4)

奇怪的知识增加了~

后面的内容还没怎么看, 就留给感兴趣的各位自行发掘吧~