13

BBC:人类首张蛋白质组草图绘制完成

一个德国的团队和一个美国印度联合团队将他们的蛋白组图谱发表在了《自然》杂志上,他们的结果在公共网站上也可搜索到。

14

 

图1 蛋白(绿色)由中间的RNA(粉色)分子翻译所得,RNA则由我们的基因复制所得

他们首次试图建立起关乎每一个人的蛋白质数据库。这些结果基于我们对基因组的了解—我们知道何种基因在何种组织中生产蛋白质。

研究共报道了17,000至18,000种蛋白质。其中一些来自曾经认为是非编码的DNA片段。

在我们的每一个细胞中所包裹的超长DNA上,我们的基因只是其中的一部分,它包含用于生产蛋白质的指令和代码。

“虽然我们对基因组已经有了不错的了解,却还不知道这将近20,000个能用来编码的蛋白质基因中有多少能真正用以生产蛋白质。” 带领德国团队的慕尼黑工业大学Bernhard Kuester教授说。

 

意想不到的结果

 

为了找出答案,研究人员从人体组织的许多不同的样品以及一些细胞系中提取所有蛋白质。接着将这些纯化后的混合物中的蛋白切碎成小片段,利用质谱技术揭示组成每一个小片段的氨基酸序列。

凭借强大的计算资源及足够的耐心,我们可以将这一批蛋白质片段与人类基因组进行比较,从而制作图谱,以显示哪些组织中的哪些基因被“表达”而产生蛋白。

15

图2 为了将组成人体的所有蛋白进行编排,研究人员使用了一系列的样品,包括成体组织,胎儿组织和许多细胞系

“如果你喜欢这种说法,这是(人类蛋白质组的)第一份清单,” Kuester教授告诉BBC新闻记者,“就像十几年前人类基因组的初稿那样。”

并且正如人类基因组计划的结果一样,这些数据中包含了一些惊喜。

两组团队均发现了数百种意想不到的蛋白质,它们是由古基因(称为“伪基因”)片段或者那些根本不认为是基因的DNA片段产生。

除了这些蛋白质的新成员之外,还有一些明显的“缺席者”。“我们有充分的理由相信,数百个已知的,且已经被解析的基因,它们也许是多余的。” Kuester教授说。

美印团队,由美国巴尔的摩约翰霍普金斯大学教授AkhileshPandey领导。他们的研究找到了一些证据,证明从基因组中我们只能预测全部蛋白质的84%。

16

图3 超越遗传学

 

Pandey教授告诉BBC,研究蛋白质本身与研究编码它们的基因同样重要。

说到研究特定基因的研究者如何利用这个新数据库,他举了一个例子:“他们可以观察蛋白质的表达并且知道这个蛋白质的作用。比如说,如果一个蛋白质在胎儿肠道而非成人肠道中表达,那么他们或许应该考虑这个蛋白质可能参与了发育过程。”

组织依次分解的方法也可以帮助科学家们弄清药物的作用及副作用。通过比较不同癌细胞系的蛋白质组,Kuester教授和他的团队已经确定了一些蛋白质簇,这些蛋白质可以增强或减弱对癌症药物的敏感性。

Kevin Mills博士曾使用蛋白质组学研究了UCL儿童健康研究所的罕见病例,他认为在蛋白水平上观察“超基因组学”并观察它们如何变化非常重要。

“遗传学不能告诉我们一切,” Mills博士说道,他并没有参与上述两项研究。“这的确是非常重要的。我们并不是静止的——我们是不断变化的,我们的蛋白质组也在持续地变化着。”

他们在会议上看到过彼此的工作,但Pandey教授和Kuester教授告诉BBC新闻,他们并不知道会同时发表结果。上周,他们发现他们的工作将同时在《自然》的封面上闪亮登场时,彼此通了一个电话。

“我们从未把这当成是争夺冠军的竞赛,” Kuester教授说,“我的理解是,当时机成熟的时候,自然会有某个人去做。或许是某两个人!”

Pandey教授将如今的联合发表结果与人类基因组的初稿做了一个比较,那是2001年2月由两个不同的团队公布的。

17

图4 Pandey教授(中)和他的团队花了两年的时间生成并分析了这些数据

“虽然两个团队得到了类似的基因数目,但他们的基因列表是很不同的,”他说。“我们的结果在一致性上要好很多,不过把两份数据放在一起绝对是有益的。

12

Science: 中国蛋白质组计划投入4000万美元

中国科技部宣布启动一项4000万美元的科学研究项目,目标是绘制出健康和疾病状态下,包括心脏和肝脏在内的人类10个主要器官及组织的蛋白质组,以期构建出人体蛋白质百科全书。国际顶级科学期刊《科学》(Science)对这一消息持高度关注,并以“China pours money into proteins”为题进行了相关报道。

 

这一项目的监督主管、北京蛋白质组研究中心主任秦钧(Qin Jun)表示,探索人类蛋白质组是与绘制人类基因组图谱相当的又一庞大科技工程。基因组提供的是“生命的密码”,而蛋白质则负责执行生命的指令。“蛋白质是细胞的功能执行者,相比基因组它与疾病和人类功能更直接相关”,秦钧说。

 

尽管对于全球人类基因组计划中国的科研人员只贡献了1%的数据,秦钧希望中国能够在开展中的人类蛋白质组计划中发挥更重要的作用。人类蛋白质组计划是一项全球性的研究项目,在不久前即5月28日的《自然》(Nature)杂志上参与这一项目的国际研究小组公布了第一张人类蛋白质组草图。秦钧称,中国的目标是最终为这一国际合作项目贡献“至少30%的数据”。

 

北京基因组研究中心首席科学家贺福初(He Fuchu)表示:“中国已为大型数据和生物信息学时代来临做好了充分的准备。”贺福初领导的这一大型蛋白质组项目将历时3-5年,全国40个实验室的大约200名研究人员参与其中。

 

当前两大主要的研究机构正在北京建造之中。命名凤凰工程(PHOENIX)的国家蛋白质科学基础设施北京基地将拥有25台质谱仪,具有每天完成对10个蛋白质组进行测序的能力,其计划与2015年中尽早投入使用。明年国家生物医学大型数据中心也有望开放使用。

 

11

iTRAQ常见问题

1. iTRAQ技术原理是什么?

多个(每组最多8个)来源不同的蛋白样品经过不同标签标记后,可以合并后同时进行质谱分析。在每个肽段二级质谱图上,相应每个样品的报告离子强度用以表征该蛋白在不同样品中相对含量的高低,而肽段碎片离子可用于蛋白的鉴定分析。是鉴定与定量同时进行的一种定量技术。

2. 关于“样品重复”,技术重复和上机重复有什么区别?

“样品重复”,也可以称为生物重复。生物重复是指样品来自同一处理组的不同样品,是整个实验的完全重复,如平行培养的细胞或细胞株。技术重复是指对同一生物样品进行重复实验,可降低实验中的测量误差或背景噪音。上机重复是指是指同一样品进行重复上机检测。如下图:

sjcf-300x80 (1)

具体可参考文献:Chee Sian Gan, PohKuan Chong, et alTechnical, Experimental, and Biological Variations in Isobaric Tags for Relatives and Absolute Quantitation (iTRAQ). Journal of Proteome Research. 2007; 6(2): 821-827.

 

3. 不同老师的样本做iTRAQ定量可否放在一组上机?

不能。因为即使是同一个物种的样品,经过不同实验室处理后,里面蛋白含量和数目会有较大差别,混在一起后会影响两组不同来源的样品的蛋白鉴定数目。而对于来自不同物种的样品,信息分析的数据库选择会不同,无法进行比较。

4. 为什么有些差异表达基因在蛋白层面没有相应的差异蛋白?

从生物学角度看,由于miRNA调控、蛋白降解、蛋白分泌、转录和翻译效率不一致等原因,导致蛋白水平和转录水平未必呈现一样的趋势,这是正常现象。如果这些差异基因恰恰是老师感兴趣的,我们建议针对这些目标蛋白用MRM方法做一下“目标蛋白分析”,如果老师已有相关的研究基础,也可以用抗体的方法验证。因为当我们的研究视角落到一定范围内的时候,高通量的结果也需要进一步的仔细验证。

脓毒症biomarkers研究

Identification of novel biomarkers for sepsis prognosis via urinary proteomic analysis using iTRAQ labeling and 2-D-LC-MS/MS

PLoS One. 2013;8(1):e54237. doi: 10.1371/journal.pone.0054237. Epub 2013 Jan 23

研究内容:

脓毒症可导致危重病人死亡,蛋白质组学的发展有助于了解重大疾病发展机理。本次研究通过iTRAQ技术研究30例脓毒症患者的尿液,寻找脓毒症早期预后的潜在biomarkers。

研究路线:

样本:取对照组(SI)、存活组(SP)和非存活组(de)病例各15例,分别采集尿液,pooled后提取蛋白。

技术:iTRAQ

研究结果:

  • 以30例不同阶段的脓毒症患者,以及15例对照组患者的尿液为样本,通过iTRAQ技术,共鉴定到232个蛋白。
  • 根据文中给出的“候选蛋白biomarker鉴定分析过程”,筛选出7个与早期预后相关的蛋白,5个呈现上调趋势(SELENBP-1, HSPG-2, A-1-BG, HPR, LCN),2个呈现下调趋势(LAMP-1, DPP-4)。
  • 在biomarker验证阶段,通过western blotting方法,以54例脓毒症患者尿液为样本,对3种蛋白进行验证(SELENBP-1, LAMP-1, HSPG-2)。证明蛋白LAMP-1可作为脓毒症早期预后评估的biomarker。