文章标题:Rapid, deep and precise profiling of the plasma proteome with multi-nanoparticle protein corona
发表期刊:Nature Communications
影响因子:17.694
(资料图片仅供参考)
作者单位:哈佛医学院;Seer,美国(百趣生物蛋白冠™蛋白质组学技术研发单位)
组学分享-研究背景
组学分享,血浆蛋白质组的复杂性限制了大规模、无偏的蛋白质组学研究。该研究报道了一种可拓展、高效的蛋白质鉴定和定量平台——蛋白冠技术,利用纳米颗粒(nanoparticles, NPs)独特的表面物化特性,可与蛋白组进行独特的相互作用形成蛋白冠,从而实现血浆蛋白质组的深度检测。在一项关于非小细胞肺癌的分类实验中,通过5个NPs联用,在141个血浆样本中检测出2000多种蛋白质。本文所描述的技术即通过蛋白质和NPs之间独特的相互作用,结合精简的工作流程,使得高深度、广覆盖的定量蛋白质组学研究成为现实。
图1. 蛋白冠技术工作流程研究结果
1.NPs开发与表征
在蛋白冠的基础研究中,开发了超顺磁性氧化铁纳米颗粒(SPIONs, NP),可以用于蛋白冠的自动化检测。粒子的超顺磁性核心促进蛋白冠与血浆的快速磁分离(<30秒),大大减少了LC-MS/MS提取NP蛋白冠所需的时间。组学分享,此外,不同的表面修饰,也有助于SPIONs产生不同的冠状物模式,以更广泛地研究蛋白质组。
根据先前公布的方法初步合成了3个具有不同表面化学成分的NPs(SP-003,SP-007和SP-011)(图2)。组学分享,利用扫描电子显微镜(SEM),动态光散射(DLS),透射电子显微镜(TEM),高分辨率TEM(HRTEM)和x射线光电子能谱(XPS)等技术对三种NPs的尺寸、形态和表面特性方面进行表征描述(图2)。组学分享,DLS测量结果与扫描电镜吻合,三种SPIONs为球形和半球形,平均尺寸均在200-300nm范围内;ζ电位(ζ)分析表面电荷量,显示pH值为7.4时,ζ值分别为-36.9,+25.8和-0.4mV,代表负、正和中性表面(图2);使用HRTEM评估涂层厚度,
对于SP-003,在氧化铁芯周围形成了厚度>10nm的非晶态壳层(图2d),对于SP-007和SP-011,形成了相对较薄(<10nm)的非晶形态外壳(2i,n);此外,通过XPS进行表面分析,证实了NPs成功包裹了各自的官能团。结构表征证实了三种SPIONs构成了一个多样化的NPs测试集,之后对蛋白质的检测覆盖率、精度和响应线性度进行进一步评估。
图2. 三种SPIONs的结构表征
2.蛋白质组学分析三种NPs的初始效果
使用DDA LC-MS/MS分析3种NPs panel,单个纳米颗粒检出蛋白数>500,共检出蛋白数>700(图3a)。SP-003,SP-007和SP-011三种NPs的中位CVs分别为19.6%、30.3%和17.0%(图3b)。
为了探索NPs在大范围浓度范围内检测血浆蛋白的能力,组学分享,作者将上述三种NPs测量的蛋白质特征强度与已发表的数据进行了比较(图3c),斜率的减小表明蛋白质信号强度的动态范围随丰度的变化而减小,即NPs可以通过亲和力结合有效地归一化蛋白质丰度,从而有效地降低蛋白冠中丰度的动态范围,有利于低丰度蛋白的检出。
为了确定平台在生物标志物发现和验证研究中的实际响应度,作者通过添加其他2种蛋白血管生成素和钙卫蛋白(S100a8/9),包括3个附加的多肽和3个附加的NPs,对响应线性度进行了更深入的探索。组学分享,通过线性回归对NPs检测到的数据与ELISA结果进行了建模,证实了线性响应,并表明了NP平台能够高精度地测量宽动态范围内肽段/蛋白质水平的相对变化。
之后为了探究背景干扰对蛋白冠组成的影响,文章对不同脂质水平和溶血程度下形成的蛋白冠进行了检测。检测结果显示脂质水平的高低不会影响蛋白质检出数量、组成或强度分布。此外还观察到不同条件下蛋白质数量的稳健性,正常血浆中检测到的重叠蛋白不受溶血引起的巨大背景变化的影响。
图3. 三个原始NPs的蛋白质组学表征
3.十种NPs的优化组合
文章基于3种NPs的组合对蛋白质的检测覆盖率、精度和响应线性度进行了评估,之后为进一步拓展蛋白冠的检测深度,对43个候选SPIONs进行筛选,最终产生一个由10个NPs组成的优化panel,CVs分布范围为16.4%至30.8%(图4b)。将定量结果与已发布的蛋白质组学数据集进行比较,检测精度与检测深度均要高于已发布的蛋白质组学数据集。组学分享,与血浆蛋白数据库的比较结果显示,10NPs-panel的蛋白组成几乎覆盖了数据库的整个动态范围。在目前已知的蛋白标志物研究中,多集中分布在高丰度范围内,新型蛋白质生物标记物的出现率非常低(每年少于2种),10NPs-panel在90个生物标记物中,能够在每个NPs和纯血浆中鉴定出33至43个FDA标志物(图4c),蛋白冠™蛋白质组学对于低丰度生物标志物的发现具有重要意义。
为了确定参考血浆蛋白质组中存在的功能类别,由Uniport ID向注释数据库(GOCC, GOBP, KEGG, Uniprot Keywords, Pfam)进行映射,并比较了10个NPs panel的富集结果。结果显示出在分泌、先天免疫和囊泡等多种功能注释上的显著富集(图4d),以及不同NPs之间在功能富集上的差异性(图4e)。总的结果表明,NP冠状物不仅可以根据单个蛋白质的水平进行分类,还可以根据蛋白质的功能基团进行分类。此外,NP富集不同功能类别蛋白质(即细胞外,细胞膜或细胞质)的能力说明了NP冠状物在复杂蛋白质组中采样的宽动态范围。
图4. 与纯血浆相比,优化了10个NPs孔板
4.大规模应用:非小细胞肺癌研究
为了说明蛋白冠技术在大队列研究中的应用,文章对NSCLC(非小细胞肺癌)受试者以及与年龄和性别相匹配的健康肺部合并症对照受试者进行了快速而深入的血浆蛋白质组分析(图5)。从最初的10个NPs中选择5个组成panel,以最大限度地优化蛋白质组覆盖率,进一步减少总的实验时间。在整个研究过程中使用QC样品评估精度。结果表明Proteograph可以在短时间内快速评估大量样本,同时进一步提升精度和广度。
为了研究早期NSCLC检测的可能性,对80名健康受试者和61名早期NSCLC受试者组成的样本集进行了分类建模,141位受试者在5种NPs中平均检测到1664种蛋白质(图5a),依靠无监督的聚类分析,由NPs检测结果表现出不同的蛋白质丰度模式簇(图5b)。
组学分享,作者进一步将研究重点放在NPs中检测到的而去高丰度蛋白血浆未检测到的蛋白上,对它们发挥的作用展开了深入研究,使用随机森林模型,量化了健康人群与早期NSCLC患者的分类表现,分析数据平均AUC为0.91(图5c),受试者的随机分类排列平均AUC仅达到0.51,这证实了分类器结果中不存在过度拟合的情况。检查前20个分类器特征(NP和蛋白质组的组合),按特征重要性排序,通过Open Targets(OT)注释判断,突出显示已知和未知的蛋白质在NSCLC中发挥作用(图5d)。在最重要的特征中,鉴定到了微管蛋白,它是化疗药物(包括紫杉醇及其衍生物)的靶点。此项研究为临床队列中使用多个NPs识别蛋白质生物标志物提供了参考依据。
图5. 使用五个NPs对早期NSCLC与健康受试者进行分类
组学分享-结论
本文介绍了高通量和自动化的蛋白质分离技术平台(Proteograph),该平台从46种具有不同理化性质的NPs中筛选得到一组NPs整合到体外测定中,用于蛋白冠形成和LC-MS/MS分析,以实现无偏蛋白的收集/检测。使用混样(pool)血浆作为模型复杂的生物样品,验证了以下假设:较大的NP panel可识别更多的蛋白质,尤其是低丰度蛋白质。
组学分享,在一组10个NPs的panel中发现了不同的蛋白质和与各自蛋白冠相关的蛋白质途径,表明添加更多不同的NPs可以实现更广泛和更深入的蛋白质组分析,因此类似于基因测序中不同的覆盖水平,可以通过改变NPs的数量和类型来定制平台,以在不同的水平上对蛋白质组进行分析。此前研究中使用相同的NP panel检测到53种FDA批准的蛋白质生物标志物,但这些生物标记大多在高丰度范围内被检测到,鉴于NPs可以检测到大量的低丰度蛋白,预测未来的研究将使用组合NPs来鉴定许多新颖的生物标记。