GuideFinder-Based gRNA Design for CRISPRi Knockdown of a Toxin–Antitoxin Operon in S. epidermidis HD46 (CP052959.1)

两个基因的 locus_tag 分别是:

  • 毒素(toxin)HJI06_09100,坐标 complement(1889026..1889421)
  • 抗毒素(antitoxin)HJI06_09105,坐标 complement(1889421..1889651)

这里有一个非常重要的更正:它们在 complement,也就是 负链(minus strand)。 因此“操纵子上游/启动子在前端”对应的方向是:

  • 负链基因的“上游(5’端)”在 更大的坐标数那一侧
  • 你的 TA 单元从坐标上看是 1889651(更大)→ 1889026(更小) 这个方向转录

你想把 toxin+antitoxin 当一个单元一起 knockdown,那么最有效的策略通常是: 优先打在 antitoxin 的 5’端附近(靠近 1889651 一侧)以及其上游启动子区域,这样最容易把整条共转录本压下去。


1) “paired guides(成对 guides)”用中文再讲清楚

paired guides = 为同一个目标(同一个基因/同一转录单元)挑两条不同位置的 guide,同时表达,让 dCas9 在两个点上“堵住”转录,从而增强抑制的强度或稳定性。

  • 它不是“分别打两个基因”这个意思
  • 对你来说更合适的用法是:

    • 1 条 guide 卡在 启动子/TSS 附近
    • 另 1 条卡在 操纵子前段(这里就是 antitoxin 5’端或紧邻区域)
  • GuideFinder 会按你设置的“最小间距”(常见 100 bp)去输出可用的 guide 对

2) 用 GuideFinder 给 HD46(CP052959.1)这两个 locus_tag 设计 guides:实操步骤

下面按“你有完整基因组(complete genome)”的最常见流程写(你不需要自己手算 NGG 位点,GuideFinder 会做)。

Step A:准备文件

从 NCBI 下载这两个文件到同一目录(建议):

  1. 基因组序列 FASTACP052959.1.fna
  2. 基因组注释 GenBankCP052959.1.gbff(或 .gbk)

FASTA 提供序列;GenBank 提供 gene/CDS 坐标和 locus_tag。GuideFinder 依赖这些信息来定位目标基因并取启动子区域。

Step B:安装依赖

你需要:

  • R / RStudio
  • BLAST+(命令行 blastn):GuideFinder 用它做 off-target(脱靶)筛查
  • 下载 GuideFinder(GitHub: ohlab/Guide-Finder)的 Rmarkdown/R 脚本

Step C:准备目标基因列表

建一个文本文件(例如 targets.txt),内容就两行:

HJI06_09100
HJI06_09105

Step D:在 GuideFinder 里设置关键参数(推荐给 S. epidermidis 的组合)

因为 S. epidermidis GC 偏低,建议用“先严格、再迭代放宽”的策略(GuideFinder 的特色功能):

第一轮(主参数)

  • PAM:NGG(默认 SpCas9)
  • GC minimum:35%(或稍低一点)
  • TSS/启动子附近优先:让它偏向“离 TSS 更近”的 guide
  • off-target:开启(强烈建议不要关)

迭代轮(只针对第一轮找不到 guide 的基因自动放宽)

  • GC minimum:降到 30%
  • TSS 最大距离:放宽
  • 必要时再放宽一些序列过滤(同聚物等),但 off-target 最好别放得太松

Step E:运行并看输出

GuideFinder 通常会给你两类输出表(名字可能因版本略有不同):

  1. Top hits(单条 guide 推荐)
  2. Paired guides(成对 guide 推荐)

你现在的目标是“把 TA 单元一起压下去”,所以你从输出里优先挑:

  • 靠近 1889651 一侧(负链的 5’端/上游)的 guides

    • 重点看 HJI06_09105(antitoxin)输出里最靠前、最接近其 5’端/推定启动子区的 guides
    • HJI06_09100(toxin)也会出 guides,但从“整单元 knockdown”角度,最“入口”的位置通常更强

3) 针对你这个 TA 单元,怎么挑“最可能一把压住两基因”的 guide

因为它们紧挨着且共转录,你最推荐的组合是:

方案 1:单 guide(最简、最常成功)

  • 选 1 条 最接近操纵子启动子/TSS 的 guide
  • 实验上先用它验证 toxin 与 antitoxin 的 mRNA 是否都下降(RT-qPCR 两个都测)

方案 2:paired guides(更稳的增强版)

  • 选两条都位于“操纵子前端”的 guide(一般以 antitoxin 5’端/上游区域为核心)
  • 两条之间满足你设的最小间距(比如 100 bp)
  • 用同一个载体同时表达两条 guide(或串联表达)

4) 一个很关键的小提醒:负链时,“上游”在坐标更大端

你最初邮件里写的是 “(+)”,但 GenBank 注释清楚写了 complement。 所以当你在 GuideFinder 输出里看到坐标时,记住:

  • 越接近 1889651(更大坐标)越接近“转录起点/上游入口”
  • 这类 guide 通常更容易把整个 TA 转录单元一起压下去

把运行 GuideFinder 后输出表里与这两个 locus_tag 对应的前几条候选(包含坐标、链方向、序列、是否 off-target)贴出来,可以快速做二次筛选: 哪一条最适合做“单 guide 一把压住”,哪一对最适合做“paired guides 增强版”。

Leave a Reply

Your email address will not be published. Required fields are marked *