Somatic Variation Detection

🔬 癌症驱动基因与突变分析流程总览

一、常见癌症的驱动基因(Driver Genes)

癌症类型 常见驱动基因 说明
肺癌(NSCLC) EGFR, KRAS, ALK, TP53, BRAF EGFR 和 KRAS 突变常用于靶向治疗判断
肝癌(HCC) TP53, CTNNB1, AXIN1, TERT TERT 启动子突变常见
胃癌 TP53, ARID1A, PIK3CA, CDH1 与 WNT/PI3K 通路相关
大肠癌(CRC) APC, KRAS, TP53, PIK3CA Wnt 通路异常(APC 突变)
乳腺癌 BRCA1/2, PIK3CA, TP53, ERBB2(HER2) BRCA 突变相关于遗传性乳癌
黑色素瘤 BRAF, NRAS, NF1 BRAF-V600E 为靶向治疗重要突变
白血病(AML) FLT3, NPM1, DNMT3A, IDH1/2 多个基因可能共突变

🧪 二、常用的癌症突变检测工具和数据库

🛠️ 工具类(基因组分析)

工具名 用途/特点
Mutect2 (GATK) 检测肿瘤样本中的体细胞突变(与正常对照)
Strelka2 高灵敏度检测 SNV 和 InDel
VarScan2 检测突变和 CNV,适合低深度数据
SomaticSniper 老牌体细胞突变检测工具
FACETS 拷贝数变异与纯度/杂合度估计

🧬 数据库类(已知突变注释)

数据库/平台 功能
COSMIC 全球最大癌症突变数据库
TCGA (via GDC) 大规模癌症全基因组数据平台(含表达、突变等)
cBioPortal 可视化 TCGA、ICGC 数据;浏览癌症基因突变
OncoKB 癌症突变功能注释库,适合靶向药物关联
ClinVar 提供临床意义注释,如是否为致病突变

📘 三、推荐突变分析流程

样本准备 
    ↓
比对 (BWA) 
    ↓
去除重复 (Picard) 
    ↓
突变检测 (Mutect2, Strelka2, VarScan2) 
    ↓
注释 (ANNOVAR / VEP) 
    ↓
功能解释 (OncoKB, COSMIC, cBioPortal)

🧬 四、突变检测与注释:实际操作(从 BAM 到注释 VCF)

✅ 输入需求:

  • 肿瘤 BAM 文件(推荐同时有正常对照 BAM)
  • 参考基因组(例如 hg38.fasta
  • 索引文件(.bai, .fai
  • 工具安装:GATK, VEP, 或 ANNOVAR

🛠️ 常见工具推荐

工具 特点 输入要求
Mutect2 (GATK) 最佳的肿瘤–正常突变检测 肿瘤 + 正常 BAM
Strelka2 快速、准确检测 SNV/InDel 肿瘤 + 正常 BAM
VarScan2 可支持 tumor-only 模式 mpileup / VCF
LoFreq 高分辨率 SNV 检测 肿瘤 BAM(可选)

🧪 示例:使用 GATK Mutect2 检测体细胞突变

🔹 Tumor–Normal 模式(推荐)

gatk Mutect2 \
  -R hg38.fasta \
  -I tumor.bam \
  -I normal.bam \
  -tumor TumorSample \
  -normal NormalSample \
  --germline-resource af-only-gnomad.vcf.gz \
  --panel-of-normals pon.vcf.gz \
  -O somatic_raw.vcf

gatk FilterMutectCalls \
  -V somatic_raw.vcf \
  -R hg38.fasta \
  -O somatic_filtered.vcf

🔹 Tumor-Only 模式(无对照)

gatk Mutect2 \
  -R hg38.fasta \
  -I tumor.bam \
  -tumor TumorSample \
  --germline-resource af-only-gnomad.vcf.gz \
  -O somatic_raw.vcf

🧠 突变注释工具

1. Ensembl VEP

vep -i somatic_filtered.vcf \
    -o annotated.vep.vcf \
    --vcf \
    --cache \
    --offline \
    --assembly GRCh38 \
    --dir_cache /path/to/.vep \
    --everything

✅ 适用于通用功能预测、插件丰富(如 COSMIC、gnomAD)


2. ANNOVAR

convert2annovar.pl -format vcf4 somatic_filtered.vcf > input.avinput

table_annovar.pl input.avinput humandb/ \
   -buildver hg38 \
   -out annotated_annovar \
   -remove \
   -protocol refGene,clinvar_20240129,cosmic70,gnomad_genome \
   -operation g,f,f,f \
   -nastring . \
   -vcfinput

✅ 适合癌症、临床相关变异注释(COSMIC、ClinVar、gnomAD)


🚦 工具选择建议

使用场景 推荐工具
全面功能预测 VEP
癌症为重点 ANNOVAR
兼顾两者 同时使用更好

Leave a Reply

Your email address will not be published. Required fields are marked *