项目总结
本项目采用 DIA 定量蛋白质组学技术开展课题研究,在 21 个样本中共鉴定到
蛋白质 9147 个,其中定量蛋白质 9147 个。按照表达倍数变化 1.5 倍以上(上
调大于 1.5 倍或者下调小于 0.67 倍)且 P value< 0.05 的标准进行显著性差异
表达蛋白质的筛选。以 A.vs.B 比较组为例,其中有 609 个蛋白质的表达水平
发生显著性变化,473 个蛋白质显著性上调,136 个蛋白质显著性下调(其它比
较对差异筛选数据详见:蛋白差异分析结果)。基于上述数据,对所有鉴定到的
蛋白质进行了系统的生物信息学分析(蛋白功能注释),并对所有差异表达蛋白进
行了功能富集及蛋白互作网络分析。具体的工作流程和分析内容如下: 一、分析概述
数据非依赖性的扫描模式(Data-independent acquisition, DIA)是近几年来发
展的一种新的质谱数据采集方式[1]。可以依据质荷比(m/z)将质谱整个扫描范
围分为若干个窗口,然后对每个窗口中的所有母离子进行碎裂、检测,采集所有
母离子的碎片离子信息进行蛋白定性和定量。目前流行的蛋白质组学研究手段,
如 iTRAQ/TMT 、 Label-free 、 SILAC 采 用 的 都 是 数 据 依 赖 性 的 扫 描 模 式
(Data-dependent acquisition, DDA),一级质谱进行全扫描采集母离子信号生成一
级谱图,二级质谱依次选择一级谱图中信号强度排序为 top10/20/40 的峰进行碎
裂并采集对应的子离子信息。 相对于 DDA,DIA 优势体现在:
(1) 采集一级质谱 full scan 的全部母离子及对应的二级质谱子离子信息,具有更高的数
据覆盖度;
(2) 二级质谱分“窗口”进行数据采集,减少数据采集的随机性,具有更高的检测重现性
和稳定性,适用于大批量样品的蛋白质组学分析;
(3) 依靠多个循环的多个子离子对蛋白质进行定量,定量精密度、准确性、线性范围大
大提高;
(4) 使用内标校正肽段(iRT KIT)对不同样品的保留时间进行校正,可对不同批次的样
品进行蛋白定量分析。
DIA 还具有以下特点:
(1) 实验过程繁琐,对技术要求高,在 DIA 扫描前需要先用 DDA 构建一个真实的谱图
库 DDA library;
(2) 二级谱图复杂,对解谱要求高。二、工作流程
1. 实验流程
从组织样品到最终数据获得的过程中,蛋白的提取、定量、检测、酶切与除
盐
[2]、馏分分离和质谱检测
[3]每一个环节都会对数据质量和数量产生影响,而数
据质量又会直接影响后续信息分析的结果。为了从源头上保证测序数据的准确性、
可靠性,诺禾致源对每一个实验步骤都严格把控,从根本上确保了高质量数据的
产出,流程图如下(具体实验步骤见附录)。2. 信息分析流程
一方面,对 DDA 扫描方式得到的下机谱图*.d 文件,通过 Spectronaut 软件
pulsar 模块进行搜库解谱,将谱图信息转化为蛋白质信息,同时进行 DDA 数据
质控,将数据导入 Spectronaut 构建出一个真实的谱图库 DDA library。另一方
面,通过 Spectronaut 将 DIA 扫描方式得到的下机谱图*.d 文件比对到 DDA
library 进行蛋白鉴定。
将鉴定到的蛋白进行常见功能数据库注释,包括 COG 数据库、GO 数据库和
KEGG 数据库;接下来进行蛋白质的定量分析,包括鉴定到的蛋白质总体差异分
析和差异蛋白的筛选及表达模式聚类分析;最后针对筛选出来的差异蛋白进行
GO、KEGG 功能富集分析和互作网络分析等一系列的差异蛋白功能分析。若有其
他组学数据,比如转录组数据,可以进行转录组关联分析。
数据支持