下面是一份“按研究方向推荐常用数据库”的速查清单。按你做什么研究 → 该先去哪几个库来分组,每个库后面给一句“用来干嘛”。In summary, 做基因组先看 ENA/Ensembl/UCSC;做蛋白功能先上 UniProt/InterPro;做通路用 Reactome;做药物与小分子用 ChEMBL/ChEBI;做人类变异用 gnomAD/GWAS Catalog/ClinGen;做微生物命名和 16S 用 LPSN/SILVA;做模型生物就去 FlyBase/WormBase/ZFIN/MGD。
基因组学与序列数据
- European Nucleotide Archive(ENA):原始测序数据、组装、注释的综合归档入口(欧洲体系)。
- DNA Data Bank of Japan(DDBJ):日本序列数据归档(INSDC 成员之一)。
- Ensembl:脊椎动物基因组浏览、比较基因组、变异、调控注释。
- UCSC Genome Browser:人类及多物种基因组可视化浏览与注释轨道。
- GENCODE:人/鼠高质量基因注释集合(常做标准参考)。
微生物/细菌方向(菌株信息、命名、16S 等)
- BacDive:菌株层面的标准化信息(培养条件、表型、来源等)。
- LPSN: List of Prokaryotic names with Standing in Nomenclature:原核命名权威信息(名称是否有效、分类更新)。
- SILVA:16S/18S、23S/28S rRNA 序列与比对数据集(做分类/扩增子常用)。
蛋白质功能注释、家族结构域、互作网络
- UniProt:蛋白序列与功能注释的“总入口”(最常用)。
- InterPro:蛋白家族/结构域/功能位点整合分析(做注释和功能预测)。
- CATH:蛋白结构域进化关系/结构分类。
- STRING:蛋白互作网络(预测+整合证据),做功能关联很方便。
- IMEx: International Molecular Exchange Consortium:高质量、人工整理的分子互作数据整合。
- Protein Data Bank(PDB):蛋白/核酸 3D 结构的全球档案库(结构生物学必备)。
通路、代谢与反应数据库
- Reactome:经典通路知识库(富集分析、机制解释常用)。
- Rhea:生化反应与转运反应标准化知识库(注释/代谢研究)。
- BRENDA:酶功能数据大全(底物、动力学、反应等)。
- EcoCyc:大肠杆菌 K-12 的基因组与代谢通路精细注释库。
化学、小分子、药物靶点(药物研发/化学生物学)
- ChEBI:小分子化学实体词典/本体(标准名、结构、分类)。
- ChEMBL:药物样分子、活性、靶点关联(做药物发现/重定位很常用)。
- IUPHAR/BPS Guide to PHARMACOLOGY:权威药理学知识库(配体-靶点关系、药物信息)。
- LIPID MAPS:脂质组学资源与命名/分类体系。
转录组、表达谱、蛋白表达图谱
- Bgee:跨物种表达模式对比(“这个基因在哪里表达?”)。
- GXD:小鼠基因表达数据库(发育/组织表达等)。
- Human Protein Atlas:人类组织/细胞层面的蛋白表达与定位图谱。
- Europe PMC:生命科学文献入口(全文/摘要、资助信息等,做调研很高效)。
人类遗传变异、GWAS、疾病本体与临床解释
- gnomAD:人群变异频率汇总(过滤“常见变异”必备)。
- GWAS Catalog:GWAS SNP-性状关联的标准化数据库。
- Clinical Genome Resource(ClinGen):基因/变异的临床相关性评估资源(精准医学)。
- CIViC: Clinical Interpretation of Variants in Cancer:肿瘤变异临床意义的社区整理平台。
- Human Disease Ontology Knowledgebase:疾病本体(统一术语、做整合分析很有用)。
- ClinPGX:药物基因组学知识整理(基因变异影响用药反应)。
模型生物与专属物种数据库
- FlyBase:果蝇遗传与分子数据。
- WormBase:秀丽线虫及相关线虫的基因组与生物学数据。
- ZFIN: The Zebrafish Information Network:斑马鱼模型数据。
- MGD: Mouse Genome Database:小鼠基因组与表型/疾病关联数据。
- PomBase:裂殖酵母资源库。
- Saccharomyces Genome Database:出芽酵母数据库。
- Rat Genome Database:大鼠基因组与表型/疾病数据。
- Alliance of Genome Resources:多模型生物资源的整合入口(跨物种对照很方便)。
生物多样性、物种名录与分类学
- Catalogue of Life:全球已知物种的统一名录与分类信息。
- Global Biodiversity Information Facility(GBIF):全球生物多样性观测/标本记录等开放数据平台。
病原体与媒介(寄生虫/媒介昆虫等)
- VEuPathDB:真核病原体及无脊椎媒介相关的大规模组学数据库集合。