一、背景假说与验证目标
- 采用单分子光学镊子+荧光,研究LT蛋白在DNA上的装配、熔解与RAD51/RPA70共定位。
- 工作假说:如果“拉伸力”是主要驱动力,则力阶跃应伴随显著光子状态转变,否则支持“多聚化主导”模型,与论文结论一致。
二、数据准备与时间对齐
- 统一时间轴
- 将 force(t), photons(t), HMM状态序列重采样到同一采样率(如100 Hz)
- 校正曝光延迟及采样偏移,保证时间戳一致
- 漂白校正
- 光子信号做指数衰减或局部基线漂移校正
- 剔除长段漂白区或作为协变量标注
- 去噪与标准化
- 适度滤波(如中位数或Savitzky–Golay)
- 光子信号与力均应Z-score化,便于对比
三、HMM结果信号选取
- 并行追踪:
- 校正后的连续光子信号 photons(t)
- HMM输出的状态转移与后验概率(state(t)、P(switch at t))
四、三层相关性分析流程
A. 全局时间序列相关性
- 互相关函数(CCF)
- 计算 force(t) 与 photons(t)/state(t) 的互相关,扫 ±L 秒时滞
- 用块置换/相位随机化检验显著性,获得p值和置信区间
- 事件触发平均(ETA)
- 以每个 change_time_s 为触发点,窗口 [t0−W, t0+W] 内叠加平均光子/状态曲线
- 判断ETA在0附近是否有系统响应、显著性超置信区间
B. 事件级判定“相关/不相关”
- 对每个 change_time_s = t_i:
- 设窗口 Δ(如2秒),判断窗口内是否有:
- HMM状态跃迁且后验>0.9
- 或光子信号显著突变(|Δphotons| > 3×局部噪声SD)
- 标注候选“相关”(Yes),记录证据
- 用随机对照/置换检验(假阳性率,Fisher/置换测试,q<0.05)确定最终Yes/No
- 可选:检查方向一致性(如force上升是否更常引起信号/状态上升),用logistic回归检验
- 设窗口 Δ(如2秒),判断窗口内是否有:
C. 位置(x坐标)相关性(若有位置信息)
- 按位置bin计算每bin相关率、驻留时间、事件占空比
- 热点分析:检验特定位点相关率是否显著高于其他bin或随机
五、统计模型拓展(可选)
- 点过程/危险率模型(Cox/Poisson回归),自变量含force、Δforce、方向、时间、位置等
- 加入分子ID/实验天数作为随机效应,提升稳健性
六、生物学意义解读
1. 若观察到“强相关”:
- 说明外力促进DNA局部解链或状态切换,可能改变蛋白装配/停留稳定性
- 若力学区间与论文设定不同,则为新发现或说明实验几何有差异
2. 若观察到“不相关”:
- 支持“多聚化驱动”主模型:LT多聚化优先结合/侵入ssDNA,之后ATP驱动解旋
- 与论文结论一致:10pN张力下力–光子信号无必然联系
七、change_time_s事件判定操作清单
- 设定窗口Δ(如2秒)和阈值(HMM后验>0.9, |Δphotons|>3σ)
- 对每个t_i,查找HMM跃迁或光子突变,候选Yes/No、证据类型及最大后验
- 对全体事件做置换检验,统计显著性
- 可选:检验方向一致性
八、注意事项与易错点
- 必做光漂白校正
- 多重比较做FDR校正
- 时间序列强自相关优先用互相关+置换检验
- 同步偏移一次性估计修正
- Δ窗口做敏感性分析
九、建议的最终交付物
- 互相关分析图 (force vs photons/HMM-state)
- 事件触发平均(ETA)图,含置信区间
- change_time_s事件级表:is_correlated, evidence, p_value, lag
- 位置热点图(如有)
- 结论文字:是否支持“多聚化主导/与力弱相关”模型
十、论文引用要点(适用于报告撰写)
- 不依赖ATP水解即可熔解,RAD51/RPA70可共定位
- 多聚化而非解旋活性是关键驱动力
- 10pN张力与无张力均可见LT与RAD51共定位,张力不是必要条件
- 多聚化数量与熔解标志强度/速度成正比(三聚体慢、双六聚体快且稳)
附:可运行脚本支持
如需自动化,可将上述判定规则写成Python/R脚本,读入 force.csv、photons.csv、HMM_state.csv,并一键输出相关性图表和事件判定表。