数据库
核酸数据库
三大核酸数据库NCBI的GenBank
EBI
欧洲生物信息学研究所(European Bioinformatics Institute, EBI)是一个国际性的研究机构,提供广泛的生物信息学数据和服务。EBI是欧洲分子生物学实验室(EMBL)的一部分,旨在提供对生物学数据的综合访问,支持全球的生物医学研究。以下是EBI数据库的详细介绍:
1. 主要资源
EBI管理着多个重要的生物信息学数据库和工具,包括:
- Ensembl:提供对脊椎动物基因组的广泛信息,包括基因注释、DNA序列和基因功能。
- UniProt:全球最大的蛋白质信息数据库,涵盖蛋白质序列和功能注释。
- ArrayExpress:存储功能基因组学实验数据,如微阵列和高通量测序数据。
- Protein Data Bank in Europe (PDBe):存储三维结构数据的全球资源。
- European Nucleotide Archive (ENA):收录核苷酸序列和相关信息,包括原始测序数据、序列组装和注释。
ENA
European Nucleotide Archive (ENA) 是一个综合性的数据库,提供对核酸序列和相关信息的访问。由欧洲生物信息学研究所(EBI)维护和管理。
KEGG
KEGG(Kyoto Encyclopedia of Genes and Genomes) 是一个全球知名的生物信息学资源,由日本京都大学于1995年创建。KEGG 数据库包含多种生物分子和系统信息,主要用于分析基因组、代谢通路、疾病、药物和化合物的相互关系。其目的是通过全面的系统化数据,帮助研究人员理解生物学系统、细胞和有机体的功能。
KEGG 包含多个子数据库,每个子数据库关注生物学的不同层面。以下是一些主要的 KEGG 数据库:
=== "KEGG Pathway"(代谢通路):
KEGG Pathway(代谢通路)
-
提供分子间的相互作用网络,包括代谢、遗传信息处理、信号传导和疾病通路。
-
代谢通路的视觉表示在生物化学反应图中展示了化合物、酶、代谢物等之间的关系。
=== "KEGG Genes"(基因):
包含大量物种的基因组数据,支持特定物种基因的注释和功能预测。 通过 KO(KEGG Orthology)来统一不同物种中同源基因的功能。 KEGG Enzyme(酶):
提供酶的分类及其催化的生化反应信息,包含酶的 EC 编号及功能。 KEGG Disease(疾病):
关联疾病、病理学途径及遗传变化,帮助理解疾病发生的生物学机制。 KEGG Compound(化合物):
包含化学物质及其在代谢和生物反应中的作用信息。 KEGG Drug(药物):
提供药物、其靶点和代谢途径的信息。 KEGG Orthology (KO):
用于将不同物种中的基因按照功能进行分类和注释。KO 系统是 KEGG Pathway 和 KEGG Genes 的桥梁。
KEGG 代谢通路信息
KEGG 代谢通路信息是 KEGG 数据库最重要的组成部分之一。它通过图形化的通路图展示生物体内的化学反应和分子相互作用。
1. 代谢通路的层级结构
KEGG 的代谢通路是分层结构的,由大类(Category)、亚类(Subcategory)、通路(Pathway)和基因(Gene)组成,展示了不同生物学过程中的相互作用。每个层级包含详细的信息:
- 大类(Category):例如代谢、信号转导、遗传信息处理等。
- 亚类(Subcategory):如碳水化合物代谢、氨基酸代谢、脂质代谢等。
- 通路(Pathway):具体的生物过程,如糖酵解(Glycolysis)、脂肪酸代谢、TCA 循环。
- 基因(Gene):参与该代谢过程的基因,通常包括 KO 编号和 EC 编号。