两个基因的 locus_tag 分别是:
- 毒素(toxin):
HJI06_09100,坐标 complement(1889026..1889421) - 抗毒素(antitoxin):
HJI06_09105,坐标 complement(1889421..1889651)
这里有一个非常重要的更正:它们在 complement,也就是 负链(minus strand)。 因此“操纵子上游/启动子在前端”对应的方向是:
- 负链基因的“上游(5’端)”在 更大的坐标数那一侧
- 你的 TA 单元从坐标上看是 1889651(更大)→ 1889026(更小) 这个方向转录
你想把 toxin+antitoxin 当一个单元一起 knockdown,那么最有效的策略通常是: 优先打在 antitoxin 的 5’端附近(靠近 1889651 一侧)以及其上游启动子区域,这样最容易把整条共转录本压下去。
1) “paired guides(成对 guides)”用中文再讲清楚
paired guides = 为同一个目标(同一个基因/同一转录单元)挑两条不同位置的 guide,同时表达,让 dCas9 在两个点上“堵住”转录,从而增强抑制的强度或稳定性。
- 它不是“分别打两个基因”这个意思
-
对你来说更合适的用法是:
- 1 条 guide 卡在 启动子/TSS 附近
- 另 1 条卡在 操纵子前段(这里就是 antitoxin 5’端或紧邻区域)
- GuideFinder 会按你设置的“最小间距”(常见 100 bp)去输出可用的 guide 对
2) 用 GuideFinder 给 HD46(CP052959.1)这两个 locus_tag 设计 guides:实操步骤
下面按“你有完整基因组(complete genome)”的最常见流程写(你不需要自己手算 NGG 位点,GuideFinder 会做)。
Step A:准备文件
从 NCBI 下载这两个文件到同一目录(建议):
- 基因组序列 FASTA:
CP052959.1.fna - 基因组注释 GenBank:
CP052959.1.gbff(或 .gbk)
FASTA 提供序列;GenBank 提供 gene/CDS 坐标和 locus_tag。GuideFinder 依赖这些信息来定位目标基因并取启动子区域。
Step B:安装依赖
你需要:
- R / RStudio
- BLAST+(命令行 blastn):GuideFinder 用它做 off-target(脱靶)筛查
- 下载 GuideFinder(GitHub: ohlab/Guide-Finder)的 Rmarkdown/R 脚本
Step C:准备目标基因列表
建一个文本文件(例如 targets.txt),内容就两行:
HJI06_09100
HJI06_09105
Step D:在 GuideFinder 里设置关键参数(推荐给 S. epidermidis 的组合)
因为 S. epidermidis GC 偏低,建议用“先严格、再迭代放宽”的策略(GuideFinder 的特色功能):
第一轮(主参数)
- PAM:NGG(默认 SpCas9)
- GC minimum:35%(或稍低一点)
- TSS/启动子附近优先:让它偏向“离 TSS 更近”的 guide
- off-target:开启(强烈建议不要关)
迭代轮(只针对第一轮找不到 guide 的基因自动放宽)
- GC minimum:降到 30%
- TSS 最大距离:放宽
- 必要时再放宽一些序列过滤(同聚物等),但 off-target 最好别放得太松
Step E:运行并看输出
GuideFinder 通常会给你两类输出表(名字可能因版本略有不同):
- Top hits(单条 guide 推荐)
- Paired guides(成对 guide 推荐)
你现在的目标是“把 TA 单元一起压下去”,所以你从输出里优先挑:
-
靠近 1889651 一侧(负链的 5’端/上游)的 guides
- 重点看
HJI06_09105(antitoxin)输出里最靠前、最接近其 5’端/推定启动子区的 guides HJI06_09100(toxin)也会出 guides,但从“整单元 knockdown”角度,最“入口”的位置通常更强
- 重点看
3) 针对你这个 TA 单元,怎么挑“最可能一把压住两基因”的 guide
因为它们紧挨着且共转录,你最推荐的组合是:
方案 1:单 guide(最简、最常成功)
- 选 1 条 最接近操纵子启动子/TSS 的 guide
- 实验上先用它验证 toxin 与 antitoxin 的 mRNA 是否都下降(RT-qPCR 两个都测)
方案 2:paired guides(更稳的增强版)
- 选两条都位于“操纵子前端”的 guide(一般以 antitoxin 5’端/上游区域为核心)
- 两条之间满足你设的最小间距(比如 100 bp)
- 用同一个载体同时表达两条 guide(或串联表达)
4) 一个很关键的小提醒:负链时,“上游”在坐标更大端
你最初邮件里写的是 “(+)”,但 GenBank 注释清楚写了 complement。 所以当你在 GuideFinder 输出里看到坐标时,记住:
- 越接近 1889651(更大坐标)越接近“转录起点/上游入口”
- 这类 guide 通常更容易把整个 TA 转录单元一起压下去
把运行 GuideFinder 后输出表里与这两个 locus_tag 对应的前几条候选(包含坐标、链方向、序列、是否 off-target)贴出来,可以快速做二次筛选: 哪一条最适合做“单 guide 一把压住”,哪一对最适合做“paired guides 增强版”。