一、PDB数据库
简介
蛋白质结构数据库(Protein Data Bank,PDB)自1971年创建以来,已成为国际上最著名且最完整的蛋白质三维结构数据库。PDB数据库收录了通过X射线晶体学、核磁共振(NMR)光谱学、冷冻电镜等实验方法确定的蛋白质、核酸等生物大分子的结构信息及相关数据。在药物设计领域,PDB中的结构数据常被用于分子对接等研究,为预测小分子化合物(药物分子)与生物大分子的结合模式以及生物大分子间的相互作用研究提供受体分子的晶体结构。此外,这些晶体结构还可用于开展生物分子相关的分子动力学模拟研究。
使用指南
1、输入网址–https://www.rcsb.org/

2、检索–晶体ID或蛋白名称,以3wze(VEGFR2,血管内皮细胞生长因子受体2)为例

一般选择发布时间比较新的(或者比较经典的上市药物与蛋白的复合物)、X射线衍射方法得到的晶体结构,且选择分辨率(解析精度)在2.0Å以内(数值越小解析精度越高)。通常选择含有上市药物分子(或活性小分子)的晶体复合物。


3、下载–常用PDB格式
二、UniProt数据库
UniProt数据库是信息最丰富、资源最广的蛋白质数据库。它由整合Swiss-Prot、 TrEMBL 和 PIR-PSD 三大数据库的数据而成,它的数据主要来自于基因组测序项目完成后续获得的蛋白质序列。数据库包含了大量来自文献的蛋白质的生物功能的信息。其中UniProtKB(UniProt Knowledgebase)是UniProt数据库的核心部分之一,旨在为生物研究提供全面、高质量且免费的蛋白质序列和功能信息UniProt数据库数据库能够给出靶点更加详细的信息。
使用指南
1、输入网址–https://www.uniprot.org/或者从PDB数据库直接从Go to UniProtK进入

2、检索–输入UniProt ID或基因名,同样以P35968为例

UniProt数据库可以给出更加丰富详细的靶蛋白信息。

点击Structure 可查看到不同的晶体编号和解析方式,复制晶体编号即可到PDB数据库下载。
三、靶蛋白结合口袋(结合位点)的确定
PDB数据库提供的研究文献通常会给出受体结合位点(结合口袋)的信息。如下为文献部分内容解读:

图1 VEGFR2复合物。 (a) VEGFR2-乐伐替尼复合物。(b)从VEGFR2-索拉非尼络复合物。(c) VEGFR2-乐伐替尼复合物与口袋残基。(d) VEGFR2-索拉非尼复物与口袋残基。(e) VEGFR2-乐伐替尼复合物结合模式。(f) VEGFR2-索拉非尼复物结合模式。
血管内皮生长因子(VEGF)在生理和病理血管生成中扮演着关键角色,对肿瘤的生长和转移具有重要影响。目前,已有多种小分子VEGFR2酪氨酸激酶抑制剂(TKIs)被批准用于治疗多种癌症,包括肾细胞癌、肝细胞癌和结直肠癌。根据小分子与VEGFR2复合物的构象,这些抑制剂被分为I型和II型。I型抑制剂靶向VEGFR2的活性形式,其特征是活化环状区域入口的开放构象,称为“DFG-in”;而II型抑制剂则靶向非活性的“DFG-out”构象,具有较慢的结合动力学,从而延长药物在靶点上的作用时间。
在PDB条目3WZE中,VEGFR2与索拉非尼(一种II型抑制剂)复合物的整体结构展现了真核蛋白激酶家族的双叶结构特征。索拉非尼位于N端和C末端结构域之间形成的间隙中,与ATP结合位点(蛋白激酶的常见位点)和邻近的非保守变构区相互作用。需要注意的是,DFG(催化三联体)基序呈现出DFG-out构象(无活性形式),如图1d所示,图1f中也列出了结合口袋的关键氨基酸残基。与索拉非尼不同,乐伐替尼(3WZD)以一种更加开放且不同于传统抑制剂的方式与受体结合(图1c、1e)。图1e-f给出了两种抑制剂的结合模式,文章详细比较了这两种抑制剂结合模式的差异,也揭示了乐伐替尼结合模式的特异性。基于文献报道的结合口袋信息,可以选择相应的晶体结构,进一步开展分子对接、虚拟筛选以及分子动力学模拟等研究工作。
https://doi.org/10.1021/ml500394m