按研究方向速查:生命科学常用数据库清单(Global Core Biodata Resources 精选)

下面是一份“按研究方向推荐常用数据库”的速查清单。按你做什么研究 → 该先去哪几个库来分组,每个库后面给一句“用来干嘛”。In summary, 做基因组先看 ENA/Ensembl/UCSC;做蛋白功能先上 UniProt/InterPro;做通路用 Reactome;做药物与小分子用 ChEMBL/ChEBI;做人类变异用 gnomAD/GWAS Catalog/ClinGen;做微生物命名和 16S 用 LPSN/SILVA;做模型生物就去 FlyBase/WormBase/ZFIN/MGD。


基因组学与序列数据

  • European Nucleotide Archive(ENA):原始测序数据、组装、注释的综合归档入口(欧洲体系)。
  • DNA Data Bank of Japan(DDBJ):日本序列数据归档(INSDC 成员之一)。
  • Ensembl:脊椎动物基因组浏览、比较基因组、变异、调控注释。
  • UCSC Genome Browser:人类及多物种基因组可视化浏览与注释轨道。
  • GENCODE:人/鼠高质量基因注释集合(常做标准参考)。

微生物/细菌方向(菌株信息、命名、16S 等)

  • BacDive:菌株层面的标准化信息(培养条件、表型、来源等)。
  • LPSN: List of Prokaryotic names with Standing in Nomenclature:原核命名权威信息(名称是否有效、分类更新)。
  • SILVA:16S/18S、23S/28S rRNA 序列与比对数据集(做分类/扩增子常用)。

蛋白质功能注释、家族结构域、互作网络

  • UniProt:蛋白序列与功能注释的“总入口”(最常用)。
  • InterPro:蛋白家族/结构域/功能位点整合分析(做注释和功能预测)。
  • CATH:蛋白结构域进化关系/结构分类。
  • STRING:蛋白互作网络(预测+整合证据),做功能关联很方便。
  • IMEx: International Molecular Exchange Consortium:高质量、人工整理的分子互作数据整合。
  • Protein Data Bank(PDB):蛋白/核酸 3D 结构的全球档案库(结构生物学必备)。

通路、代谢与反应数据库

  • Reactome:经典通路知识库(富集分析、机制解释常用)。
  • Rhea:生化反应与转运反应标准化知识库(注释/代谢研究)。
  • BRENDA:酶功能数据大全(底物、动力学、反应等)。
  • EcoCyc:大肠杆菌 K-12 的基因组与代谢通路精细注释库。

化学、小分子、药物靶点(药物研发/化学生物学)

  • ChEBI:小分子化学实体词典/本体(标准名、结构、分类)。
  • ChEMBL:药物样分子、活性、靶点关联(做药物发现/重定位很常用)。
  • IUPHAR/BPS Guide to PHARMACOLOGY:权威药理学知识库(配体-靶点关系、药物信息)。
  • LIPID MAPS:脂质组学资源与命名/分类体系。

转录组、表达谱、蛋白表达图谱

  • Bgee:跨物种表达模式对比(“这个基因在哪里表达?”)。
  • GXD:小鼠基因表达数据库(发育/组织表达等)。
  • Human Protein Atlas:人类组织/细胞层面的蛋白表达与定位图谱。
  • Europe PMC:生命科学文献入口(全文/摘要、资助信息等,做调研很高效)。

人类遗传变异、GWAS、疾病本体与临床解释

  • gnomAD:人群变异频率汇总(过滤“常见变异”必备)。
  • GWAS Catalog:GWAS SNP-性状关联的标准化数据库。
  • Clinical Genome Resource(ClinGen):基因/变异的临床相关性评估资源(精准医学)。
  • CIViC: Clinical Interpretation of Variants in Cancer:肿瘤变异临床意义的社区整理平台。
  • Human Disease Ontology Knowledgebase:疾病本体(统一术语、做整合分析很有用)。
  • ClinPGX:药物基因组学知识整理(基因变异影响用药反应)。

模型生物与专属物种数据库

  • FlyBase:果蝇遗传与分子数据。
  • WormBase:秀丽线虫及相关线虫的基因组与生物学数据。
  • ZFIN: The Zebrafish Information Network:斑马鱼模型数据。
  • MGD: Mouse Genome Database:小鼠基因组与表型/疾病关联数据。
  • PomBase:裂殖酵母资源库。
  • Saccharomyces Genome Database:出芽酵母数据库。
  • Rat Genome Database:大鼠基因组与表型/疾病数据。
  • Alliance of Genome Resources:多模型生物资源的整合入口(跨物种对照很方便)。

生物多样性、物种名录与分类学

  • Catalogue of Life:全球已知物种的统一名录与分类信息。
  • Global Biodiversity Information Facility(GBIF):全球生物多样性观测/标本记录等开放数据平台。

病原体与媒介(寄生虫/媒介昆虫等)

  • VEuPathDB:真核病原体及无脊椎媒介相关的大规模组学数据库集合。

Leave a Reply

Your email address will not be published. Required fields are marked *