跳转至

VCFtools

VCFtools是一款常用的生物信息软件,用于处理和分析VCF(Variant Call Format)文件,这些文件包含了基因组变异数据。VCFtools提供了一系列命令和参数,用于过滤、统计、转换和注释VCF文件

官方文档:https://vcftools.github.io/man_latest.html

安装

git clone https://github.com/vcftools/vcftools.git
cd vcftools/
./configure
make
make install

基本使用

# 1.对得到的VCF文件进行过滤
vcftools --gzvcf marge_296_VCF.vcf.gz \
    --not-chr ChrSy \
    --not-chr ChrUn \
    --recode-INFO-all \
    --max-alleles 2 \
    --min-alleles 2 \
    --minDP 4 \
    --minQ 30 \
    --max-missing 0.2 \
    --out RNA_296_raw_snp \
    --recode \
    --remove-indels

# 2.计算每个样品的缺失率
vcftools --vcf Last_101.vcf \
    --missing-indv \
    --out Last_101_miss

常用参数

vcftools --vcf <input.vcf> 
# 指定要处理的VCF文件

--out <output_prefix>
# 指定输出文件的前缀,VCFtools将生成以该前缀命名的输出文件。

--remove <exclude_samples.txt>
# 指定一个包含要排除的样本名称的文本文件,VCFtools将从分析中排除这些样本。

--keep <include_samples.txt>
# 指定一个包含要保留的样本名称的文本文件

--recode
# 使用 --recode 参数,VCFtools将对VCF文件进行重编码

--freq
#  使用 --freq 参数,VCFtools将计算每个位点的等位基因频率。