基因存在≠耐药表型:CARD与PATRIC注释结果差异的原因解析

CARD 与 PATRIC 在耐药基因注释逻辑上的核心差异之一: The CARD not only check if the gene is there, also check if it matches the certain genotype.


🔬 CARD 不仅看“基因是否存在”,更看“是否携带已知耐药突变”

CARD 使用的 RGI(Resistance Gene Identifier)工具内置了 Protein Variant Model (PVM),专门用于检测:

  • 管家基因(如 gyrArpoBrpsLfabI 等)中的 特定点突变(SNP)或短缺失/插入
  • 这些突变已被实验证实会改变药物靶点亲和力,从而直接导致耐药表型
  • RGI 会将您的序列与 CARD 中 curated 的“耐药相关变异位点”进行比对,只有匹配到已知耐药型突变才会报阳性

📌 举例:
氟喹诺酮耐药通常不是由“获得新基因”引起,而是 gyrAparC 上特定氨基酸替换(如 Ser83Leu、Asp87Asn)。CARD 的 PVM 会精准识别这些 SNP;而仅靠“基因存在与否”的工具会漏报或误报。


🆚 与 PATRIC 的对比

维度 CARD (RGI) PATRIC/BV-BRC
检测对象 基因存在性 + 已知耐药突变(SNP/Indel) 主要基于 k-mer 匹配已知 AMR 基因序列
对 SNP 的敏感度 高(内置 PVM,专为突变型耐药设计) 低(k-mer 默认按全长/高相似度基因匹配,不自动解析功能型 SNP)
结果含义 “该基因存在 携带已验证的耐药型变异” “该基因组含有与某 AMR 基因高度相似的序列”

因此,PATRIC 报出 33 个,可能包含:

  • 完整的获得性耐药基因(如 blaTEMtetM
  • 与耐药基因部分同源但无功能的旁系同源基因
  • 管家基因的野生型序列(无耐药 SNP,但 k-mer 仍能匹配上)

而 CARD 仅报 2 个,很可能是因为:

  • 仅 2 个基因通过了 Strict/Perfect 阈值
  • 仅 2 个携带 CARD 数据库中收录的 明确致耐药的 SNP/变异型

⚠️ 需要注意的细节

  1. CARD 的 SNP 检测依赖已知数据库:若您的菌株携带新型/未收录的耐药突变,CARD 会报阴性(假阴性)。
  2. PATRIC 并非完全不检 SNP:BV-BRC 近年也引入了部分变异注释,但覆盖面和验证严谨度仍不及 CARD 的 PVM。
  3. 表型 ≠ 基因型:即使 CARD 报出耐药 SNP,仍需结合表达水平、质粒拷贝数、外排泵协同作用等综合判断实际耐药程度。

💡 实践建议

  • 若您关注 突变型耐药(如结核分枝杆菌、淋球菌、流感嗜血杆菌的靶点突变),必须依赖 CARD 的 PVM 结果
  • 若您关注 获得性耐药基因(如 β-内酰胺酶、氨基糖苷修饰酶),可交叉比对 PATRIC 与 CARD 的 PHM(同源模型)结果,取交集提高可信度。
  • 需要时可使用 rgi main --input_sequence your.fasta --output_file rgi_out --alignment_tool blastp --clean --exclude_nudge 获取严格模式结果,或添加 --include_loose 查看宽松匹配。

如需,您可以提供 CARD 输出中的 model_type(PHM/PVM)或具体基因名,我可帮您判断这 2 个结果是来自“完整耐药基因”还是“特定耐药 SNP”。

Leave a Reply

Your email address will not be published. Required fields are marked *