跳转至

数据库

核酸数据库

三大核酸数据库NCBI的GenBank

EBI

欧洲生物信息学研究所(European Bioinformatics Institute, EBI)是一个国际性的研究机构,提供广泛的生物信息学数据和服务。EBI是欧洲分子生物学实验室(EMBL)的一部分,旨在提供对生物学数据的综合访问,支持全球的生物医学研究。以下是EBI数据库的详细介绍:

1. 主要资源

EBI管理着多个重要的生物信息学数据库和工具,包括:

  • Ensembl:提供对脊椎动物基因组的广泛信息,包括基因注释、DNA序列和基因功能。
  • UniProt:全球最大的蛋白质信息数据库,涵盖蛋白质序列和功能注释。
  • ArrayExpress:存储功能基因组学实验数据,如微阵列和高通量测序数据。
  • Protein Data Bank in Europe (PDBe):存储三维结构数据的全球资源。
  • European Nucleotide Archive (ENA):收录核苷酸序列和相关信息,包括原始测序数据、序列组装和注释。

ENA

European Nucleotide Archive (ENA) 是一个综合性的数据库,提供对核酸序列和相关信息的访问。由欧洲生物信息学研究所(EBI)维护和管理。

KEGG

KEGG(Kyoto Encyclopedia of Genes and Genomes) 是一个全球知名的生物信息学资源,由日本京都大学于1995年创建。KEGG 数据库包含多种生物分子和系统信息,主要用于分析基因组、代谢通路、疾病、药物和化合物的相互关系。其目的是通过全面的系统化数据,帮助研究人员理解生物学系统、细胞和有机体的功能。

KEGG 包含多个子数据库,每个子数据库关注生物学的不同层面。以下是一些主要的 KEGG 数据库:

=== "KEGG Pathway"(代谢通路):

KEGG Pathway(代谢通路)

  • 提供分子间的相互作用网络,包括代谢、遗传信息处理、信号传导和疾病通路。

  • 代谢通路的视觉表示在生物化学反应图中展示了化合物、酶、代谢物等之间的关系。

=== "KEGG Genes"(基因):

包含大量物种的基因组数据,支持特定物种基因的注释和功能预测。 通过 KO(KEGG Orthology)来统一不同物种中同源基因的功能。 KEGG Enzyme(酶):

提供酶的分类及其催化的生化反应信息,包含酶的 EC 编号及功能。 KEGG Disease(疾病):

关联疾病、病理学途径及遗传变化,帮助理解疾病发生的生物学机制。 KEGG Compound(化合物):

包含化学物质及其在代谢和生物反应中的作用信息。 KEGG Drug(药物):

提供药物、其靶点和代谢途径的信息。 KEGG Orthology (KO):

用于将不同物种中的基因按照功能进行分类和注释。KO 系统是 KEGG Pathway 和 KEGG Genes 的桥梁。

KEGG 代谢通路信息

KEGG 代谢通路信息是 KEGG 数据库最重要的组成部分之一。它通过图形化的通路图展示生物体内的化学反应和分子相互作用。

1. 代谢通路的层级结构

KEGG 的代谢通路是分层结构的,由大类(Category)、亚类(Subcategory)、通路(Pathway)和基因(Gene)组成,展示了不同生物学过程中的相互作用。每个层级包含详细的信息:

  • 大类(Category):例如代谢、信号转导、遗传信息处理等。
  • 亚类(Subcategory):如碳水化合物代谢、氨基酸代谢、脂质代谢等。
  • 通路(Pathway):具体的生物过程,如糖酵解(Glycolysis)、脂肪酸代谢、TCA 循环。
  • 基因(Gene):参与该代谢过程的基因,通常包括 KO 编号和 EC 编号。

2. KEGG 物种代谢通路信息