🔬 癌症驱动基因与突变分析流程总览
一、常见癌症的驱动基因(Driver Genes)
癌症类型 |
常见驱动基因 |
说明 |
肺癌(NSCLC) |
EGFR, KRAS, ALK, TP53, BRAF |
EGFR 和 KRAS 突变常用于靶向治疗判断 |
肝癌(HCC) |
TP53, CTNNB1, AXIN1, TERT |
TERT 启动子突变常见 |
胃癌 |
TP53, ARID1A, PIK3CA, CDH1 |
与 WNT/PI3K 通路相关 |
大肠癌(CRC) |
APC, KRAS, TP53, PIK3CA |
Wnt 通路异常(APC 突变) |
乳腺癌 |
BRCA1/2, PIK3CA, TP53, ERBB2(HER2) |
BRCA 突变相关于遗传性乳癌 |
黑色素瘤 |
BRAF, NRAS, NF1 |
BRAF-V600E 为靶向治疗重要突变 |
白血病(AML) |
FLT3, NPM1, DNMT3A, IDH1/2 |
多个基因可能共突变 |
🧪 二、常用的癌症突变检测工具和数据库
🛠️ 工具类(基因组分析)
工具名 |
用途/特点 |
Mutect2 (GATK) |
检测肿瘤样本中的体细胞突变(与正常对照) |
Strelka2 |
高灵敏度检测 SNV 和 InDel |
VarScan2 |
检测突变和 CNV,适合低深度数据 |
SomaticSniper |
老牌体细胞突变检测工具 |
FACETS |
拷贝数变异与纯度/杂合度估计 |
🧬 数据库类(已知突变注释)
数据库/平台 |
功能 |
COSMIC |
全球最大癌症突变数据库 |
TCGA (via GDC) |
大规模癌症全基因组数据平台(含表达、突变等) |
cBioPortal |
可视化 TCGA、ICGC 数据;浏览癌症基因突变 |
OncoKB |
癌症突变功能注释库,适合靶向药物关联 |
ClinVar |
提供临床意义注释,如是否为致病突变 |
📘 三、推荐突变分析流程
样本准备
↓
比对 (BWA)
↓
去除重复 (Picard)
↓
突变检测 (Mutect2, Strelka2, VarScan2)
↓
注释 (ANNOVAR / VEP)
↓
功能解释 (OncoKB, COSMIC, cBioPortal)
🧬 四、突变检测与注释:实际操作(从 BAM 到注释 VCF)
✅ 输入需求:
- 肿瘤 BAM 文件(推荐同时有正常对照 BAM)
- 参考基因组(例如
hg38.fasta
)
- 索引文件(
.bai
, .fai
)
- 工具安装:
GATK
, VEP
, 或 ANNOVAR
🛠️ 常见工具推荐
工具 |
特点 |
输入要求 |
Mutect2 (GATK) |
最佳的肿瘤–正常突变检测 |
肿瘤 + 正常 BAM |
Strelka2 |
快速、准确检测 SNV/InDel |
肿瘤 + 正常 BAM |
VarScan2 |
可支持 tumor-only 模式 |
mpileup / VCF |
LoFreq |
高分辨率 SNV 检测 |
肿瘤 BAM(可选) |
🧪 示例:使用 GATK Mutect2 检测体细胞突变
🔹 Tumor–Normal 模式(推荐)
gatk Mutect2 \
-R hg38.fasta \
-I tumor.bam \
-I normal.bam \
-tumor TumorSample \
-normal NormalSample \
--germline-resource af-only-gnomad.vcf.gz \
--panel-of-normals pon.vcf.gz \
-O somatic_raw.vcf
gatk FilterMutectCalls \
-V somatic_raw.vcf \
-R hg38.fasta \
-O somatic_filtered.vcf
🔹 Tumor-Only 模式(无对照)
gatk Mutect2 \
-R hg38.fasta \
-I tumor.bam \
-tumor TumorSample \
--germline-resource af-only-gnomad.vcf.gz \
-O somatic_raw.vcf
🧠 突变注释工具
1. Ensembl VEP
vep -i somatic_filtered.vcf \
-o annotated.vep.vcf \
--vcf \
--cache \
--offline \
--assembly GRCh38 \
--dir_cache /path/to/.vep \
--everything
✅ 适用于通用功能预测、插件丰富(如 COSMIC、gnomAD)
2. ANNOVAR
convert2annovar.pl -format vcf4 somatic_filtered.vcf > input.avinput
table_annovar.pl input.avinput humandb/ \
-buildver hg38 \
-out annotated_annovar \
-remove \
-protocol refGene,clinvar_20240129,cosmic70,gnomad_genome \
-operation g,f,f,f \
-nastring . \
-vcfinput
✅ 适合癌症、临床相关变异注释(COSMIC、ClinVar、gnomAD)
🚦 工具选择建议
使用场景 |
推荐工具 |
全面功能预测 |
VEP |
癌症为重点 |
ANNOVAR |
兼顾两者 |
同时使用更好 |