English

JGG: 脂质组学和代谢组学整合深入了解细胞机制和疾病进展

2019年12月,中国科学院遗传与发育生物学研究所、中科脂典的相关研究人员在《Journal of Genetics and Genomics》上发表了题为“整合脂质组学和代谢组学用以深入了解细胞机制和疾病进展”的长篇综述,总结了基于组学的关于脂质和代谢物在某些威胁公众健康的重大疾病发病机制中的作用的发现,并讨论了脂质组学和代谢组学相结合的优势,以深入了解疾病发病的分子机制。


摘要:基于质谱(MS)的组学技术目前被广泛应用于分析多个基质中的小分子,从而获得细胞代谢表型的综合描述。细胞、组织和有机体的代谢体由多种分子组成,包括脂类、氨基酸、糖、有机酸等。代谢组学主要集中在后三个方面,而脂组学由于机体脂质组的复杂性而成为一个独立的组学。脂质和小代谢物在疾病发病机制中的潜在作用已在各种人类疾病中被广泛研究,但系统层面的认识仍有很大欠缺,部分原因可能是目前分析技术在代谢物覆盖范围和定量准确性方面存在不足。在科学家们不断努力开发高覆盖率的组学方法的同时,代谢组学和脂质组学的整合正成为一种新兴的机制研究方法。代谢组和脂质组的整合提供了一个完整的代谢图谱,使全面的网络分析能够识别疾病病理中的关键代谢驱动因素,有助于研究脂质和其他代谢产物在疾病进展中的相互联系。

1. 引言

代谢组学是一门相对年轻的组学分支,在提供最接近细胞内所发生事件的描述方面具有巨大潜力。解释代谢组学数据的一个主要挑战是,所描述的分子可能代表代谢反应和细胞过程的不同阶段的产物,这些产物可能在不同的生物体甚至同一生物体的不同细胞中具有不同的功能。由于代谢物在结构多样性和广泛的物理性质(如极性、稳定性、溶解度等)方面具有化学特异性,代谢组学相对于其他组学在分析上提出了额外的挑战。目前仍在进行技术开发,以便在单一分析方法中实现更高的代谢物覆盖率。

脂质组学是一门新兴的学科,它将脂质生物学、技术和医学联系在一起,致力于建立细胞/组织脂质体的全方位图谱。由于脂类结构和功能的多样性,加上其内源丰度高,最初被归入更广泛的“代谢组学”范畴,目前脂质组学已成为一个独立的领域(图1)。根据LIPIDMAPS的分类,脂质又分为八大类,包括脂肪酰、甘油脂、甘油磷脂、甾醇脂、丙烯醇脂、鞘脂、糖脂和聚酮。其中,前六个代表哺乳动物的主要脂质类。各种各样的策略已经被开发用于脂质的综合分析,包括鸟枪法和基于色谱-质谱联用的脂质组学。

图1. 代谢组学和脂质组学是根据目标分析物划分的两个不同的组学领域。

从本质上讲,代谢组学主要关注极性代谢物(水溶性),例如糖、氨基酸、有机酸和核苷酸。脂质组学致力于全面识别和量化各种脂质分子物种,因为它们具有疏水性,需要从小分子代谢物中单独处理和分析脂质(即需要不同的溶剂体系)。目前已有超过40000种脂质被记录在案,与代谢组学的覆盖范围方面只有很少的重叠。重叠通常存在于更亲水的脂质中,如溶血磷脂、酰基肉碱和游离脂肪酸。然而值得注意的是,在传统代谢组学中,这些重叠脂质的提取和分析通常受到限制,并且不如在脂质组学中那样有效。

质谱分析是代谢组学和脂质组学分析中应用最广泛的技术,部分原因是它比核磁共振(NMR)具有更高的灵敏度。如图2所示,除了提取策略外,脂质组学的工作流程通常与代谢组学的工作流程相似。使用含有甲醇、乙腈和/或水的溶剂混合物可以获得满意的小分子代谢物提取,而脂质的提取则非常复杂,需要不同的有机溶剂系统来针对不同的脂质类别。在大多数情况下,脂质组或代谢组分提取物可直接用于液相色谱-质谱(LC-MS)分析,而微量化合物或处理复杂化学基质时,可能需要衍生化、固相萃取和富集。通常情况下,脂质组学或代谢组学分析可大致分为非靶向和靶向两种方法,它们在数据采集方法和后续数据处理方面有所不同,各有优缺点。数据依赖采集(DDA)/信息依赖采集(IDA)和数据独立采集(DIA)是提供快速、全面定性和定量数据的新兴技术(图2)。根据样品性质以及感兴趣的代谢物,可以应用各种电离技术模式。用不同策略获取的大量数据将通过指定的数据处理软件进行处理,将分析数据转换为具有生物学意义的代谢图(图2)。最后,通过统计和生物信息学分析,获得变化的代谢物和途径,以及有助于我们理解数据和基础生物学的可视化。脂质组学和代谢组学方法的技术细节已在其他领域广泛综述。

图2. 代谢组学和脂质组学的典型工作流程。

脂质组和代谢组的定量分析将为生物过程和功能提供机制上的线索,从而提高我们对疾病发展和进展的认识。特别是,代谢组学和脂质组学的整合是理解复杂代谢性疾病发病机制的关键,因为脂质和非脂质(即氨基酸和碳水化合物)代谢在调控整个细胞能量稳态方面具有高度的互联性。

在这篇综述中,研究人员将概述现有的关于脂质和小分子代谢物各自作用的知识,以及它们在所选择的代谢疾病的基本细胞过程和进展中的协同功能。我们将进一步讨论整合脂质组学和代谢组学的优势,以深入了解脂质和其他代谢产物在疾病进展中的关系和相互联系。

2. 脂质及其在疾病进展中的作用

脂质组学已被广泛用于研究各种机体模型和人类疾病的脂质代谢,这已在其他地方进行了综述,因此将不会是本节的重点。本文将讨论个别脂质分子或脂类在某些疾病(包括代谢综合征、痴呆、心血管疾病和各种癌症)中的作用,以阐明脂质组学有助于精准定量和精确鉴定脂质的重要性。

2.1
 脂肪酰

脂肪酸是各种生物活性脂分子和膜脂的能量来源和前体。高水平的血浆游离脂肪酸(FAAs)可能是白色脂肪细胞膨胀、低能量消耗和/或β-氧化紊乱的标志。在肿瘤方面,三酰甘油酯水解释放的游离脂肪酸被转移的卵巢癌细胞吸收并用作能量来源。

作为各种生物活性脂类的前体,不同的游离脂肪酸种类参与了多种疾病的发生和发展。例如,游离花生四烯酸在MYC活性高的肺肿瘤中增加。MYC过表达通过脂氧合酶(LOX)和环氧合酶(COX)途径提高花生四烯酸类二十烷酸的水平。抑制COX/5-LOX途径可减少细胞增殖,从而减轻肿瘤负担,并强调花生四烯酸及其衍生二十烷酸在癌细胞增殖中的作用。棕榈酸已被证明可触发内质网应激,促进肾近端小管细胞系的凋亡和坏死细胞死亡。膜磷脂中多不饱和脂肪酸的裂解释放出多不饱和脂肪酸,导致二十碳烯酸生物合成显著上调,从而降低了秀丽隐杆线虫幼虫的寿命。

脂肪酰基组成的改变会严重改变膜的流动性、厚度、包装以及膜蛋白的动力学和功能。例如,增加饱和磷脂(PLs)水平会导致癌细胞的信号转导发生改变,从而保护癌细胞免受氧化损伤,并抑制其对化疗药物的吸收。从阿尔茨海默病(AD)患者的大脑中分离出的脂筏显示出n-3多不饱和脂肪酸(特别是二十二碳六烯酸,DHA)、单烯类(主要是油酸)水平降低,过氧化物指数降低。此外,AD额叶皮质和内嗅皮质中的脂肪酰组成差异被证明能产生更高程度的膜序和粘度,这一点通过它们对人工探针的更大抗性得到证实。通过观察β-分泌酶在AD受试者的这些改变的膜微区中的特异性聚集,进一步加强了这些膜脂肪酰基改变与AD发病的生物学相关性,因此,在膜微区的脂肪酰组成变化和淀粉样前体蛋白(APP)的淀粉样形成过程之间提供了直接的联系。同样,在恒河猴神经膜的正常衰老过程中,观察到含有DHAs的磷脂减少伴随着极长链鞘磷脂(VLC-SMs)的增加,提示随着正常衰老过程,这些膜可能引起富含DHA的微结构域与筏(SM/胆固醇)微结构域的时间依赖性交换。这些发现进一步强调了脂质组学在研究膜脂肪酰成分对神经退行性疾病细胞过程和信号转导的影响中的应用。

2.2
 甘油磷脂

甘油磷脂是参与细胞信号转导的细胞膜的主要成分。根据其极性头部的性质,磷脂家族进一步分类为磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸(PA)、心磷脂(CL)等(图3)。

图3. 磷脂生物合成的概要,主要的磷脂种类及其相关疾病。

PC和PE是哺乳动物细胞中含量最丰富的磷脂类物质,在多种疾病的发展过程中表现出明显的变化。在许多癌症中观察到PC水平升高,这可能表明内源性PC水平与癌细胞增殖率升高之间存在正相关。脂质组学分析显示20:4-PC在细胞周期内波动,通过干扰蛋白丝氨酸/苏氨酸激酶Akt膜结合而减缓细胞周期进展,从而参与了肿瘤细胞周期调控。与PC相似,PE在肿瘤中也表现出一致的升高。肺癌中磷脂酰乙醇胺结合蛋白4 (PEBP4)过表达可调节肿瘤的发生、侵袭和转移潜能。研究人员认为,PEs的增加可能在一定程度上作为PEBP的激动剂介导信号转导。此外,对肌浆网(SR)的脂质分析表明,PC/PE比值的扰动与肌浆网钙ATP酶(SERCA)活性降低有关,从而导致钙稳态异常,加重心力衰竭。这些发现强调了磷脂诱导的细胞信号改变在癌症发生和发展中的相关性。

PI及其磷酸化形式的磷脂酰肌醇多聚磷酸盐(PIPs)在细胞信号转导和膜转运中起重要作用。当受到刺激时,PI3-激酶产生的PI(3,4,5)P3随后可将Akt和Ptdin依赖性激酶(PDKs)的普列克底物蛋白同源性(PH)域募集到质膜上,并进行共定位。细胞膜共定位通过PDK促进Akt磷酸化,开启Akt介导的细胞生长和存活途径。PTEN可将磷酸基从P3(3,4,5)中分离出来,通过调节AKT依赖途径来促进肿瘤的发展。PI及其磷酸化代谢产物,即PI(4,5)P2和PI(3,4,5)P3分别参与了细胞顶端和基底外侧膜极性的划分。在亨廷顿病(HD)中,突变的亨廷顿蛋白与膜磷脂的相互作用可能导致PI稳态的紊乱,进而改变室管膜细胞的正常形态,尤其是睫状体的形成和功能。脂质组学分析显示PI(16:0-18:1)是提示乳腺肿瘤恶性程度的潜在生物标志物。CL几乎完全分布于线粒体膜中,参与膜完整性和线粒体功能的维持。Barth综合征患者的CL重塑有一个主要缺陷。CL的加速降解和亚油酸的减少导致细胞功能异常。

在另一项研究中,脂质组学分析显示,CL分子种类分布异常,脑瘤线粒体CL水平降低,导致不可逆的呼吸损伤,可能阻碍替代能源对葡萄糖的利用。以前的工作也揭示了CL谱的剧烈变化与AD早期突触线粒体功能障碍有关。上述结果表明,各脂类在生物功能上具有特异性(即具有精确的头基和脂肪酰基)。因此,脂质组学定量研究对揭示疾病发病机制中涉及的精确脂质靶点至关重要。

缩醛磷脂是甘油磷脂的一个亚类,在甘油主链的sn-1位置含有乙烯基醚脂肪醇取代基。由于烯醇醚的氧化不产生传播PUFAs氧化的反应物质,缩醛磷脂PE(pPE)在细胞膜中充当有效抗氧化剂。在AD中pPE的缺乏支持氧化应激假说,氧化应激可能是AD发病和发展的一个关键危险因素。由于在过氧化物酶体中合成pPE和血浆磷脂PC(pPC),AD中pPE和pPC含量的降低归因于过氧化物酶体功能障碍。

溶血磷脂在其结构中仅包含一个FA部分;例如溶血磷脂酰胆碱(lyso-PC)、溶血磷脂酸(lyso-PA)和溶血磷脂酰肌醇(lyso-PI)。Lyso PC作为一种炎症介质,调节内皮细胞的增殖和凋亡,从而影响动脉粥样硬化的发展。脂蛋白相关磷脂酶A2(Lp-PLA2)是缺血性脑卒中的一个众所周知的危险因素,参与了各种lyso-PLs的形成。病理上过度刺激PLA2可导致多发性硬化(MuS)患者脑脊液(CSF)中高水平的循环lyso-PCs。Lyso PA对心肌细胞凋亡和成纤维细胞增殖均有影响,在冠心病的发生发展中起重要作用。

2.3
 鞘脂

鞘脂主要包括神经酰胺、鞘磷脂(SM)和鞘糖脂,并根据细胞环境表现出广泛的生物学功能。血浆和组织中鞘脂水平的改变显示糖尿病患者心血管并发症的风险增加。此外,脑鞘脂分布在衰老过程中也有酰基链长度特异性改变。一般来说,神经酰胺水平在稳定的冠心病、AD、高血压、肥胖、糖尿病、胰岛素抵抗(IR)中升高。富含神经酰胺的低密度脂蛋白(LDLs)可导致IR,并促进IL-6介导的巨噬细胞炎症反应。神经酰胺增加线粒体膜通透性,促进凋亡因子的释放,从而触发caspase级联反应,构成细胞凋亡的内在途径。有趣的是,发现不同的神经酰胺种类(脂肪酰碳原子数从14到26)导致不同的生物功能。据报道,C16:0神经酰胺具有促凋亡和加重肥胖相关IR的作用,而C24:0等长链神经酰胺具有促进细胞增殖的抗凋亡作用,其作用与短链神经酰胺有很大的拮抗作用。在大鼠早期肝脏IR的研究中观察到了相似的结果。

SMs与促进大脑中的细胞增殖有关。髓鞘层中高水平的SMs以前被发现存在于HD患者的心室下区(SVZ),这被认为是为了增强对邻近退化尾状核刺激的接收,从而促进细胞增殖和神经发生,以补偿神经元细胞的死亡。神经节苷脂是一类由一种或多种唾液酸与糖链相连的脂质。GM3是这个复杂的脂质家族中最简单的成员,被认为是大脑中内生性丰富的神经节苷脂a-和b-系列生物合成的重要前体。血浆GM3水平升高也与IR、2型糖尿病(T2DM)和帕金森病(PD)有关。在PD中观察到通过内吞途径内化的GM3的溶酶体降解减少。GM3还被发现可以使用人工脂质体在体外加速α-突触核蛋白的聚集,而剩余的磷脂则减缓了聚集。此外,脂质组学分析先前报道SM和GM3的疾病依赖性改变都是脂肪酰特异性的。

2.4
 中性脂质 

中性脂质是一类缺乏带电基团的疏水分子,主要包括三酰甘油(TAG)、二酰甘油(DAG)、胆固醇及其酯类。

TAG被认为与心血管疾病、缺血性中风和血脂异常等多种疾病有关。在血脂异常的妇女中,含有富含棕榈酸的标记物的极低密度脂蛋白(VLDL)颗粒促进肌肉细胞分泌促炎介质。

DAGs与胰岛素抵抗、AD和高血压有关。细胞内DAG水平的升高使多种蛋白激酶C亚型进入质膜,从而激活并抑制IRS1的磷酸化,从而抑制胰岛素信号通路,最终抑制葡萄糖摄取。AD患者血浆和额叶皮质DAG 34:2和DAG 36:2水平均显著升高,并与简易精神状态检查(MMSE)评分相关。DAGs升高的原因是磷脂酶介导的PEs降解增强,据报道AD中磷脂酶降解水平降低。作为一种潜在的高血压标志物,DAG与较高的收缩压和舒张压显著相关,这可能源于其对TRPC6通道介导血管收缩的作用。

胆固醇是动物细胞中含量最丰富的脂类之一,它不仅是细胞膜的基本组成部分,而且是类固醇激素、胆汁酸和维生素D生物合成的前体。胆固醇与细胞内转运、细胞信号传导等多种细胞功能有关。胆固醇在动脉粥样硬化的发生和发展过程中起着关键作用,因为已知游离胆固醇和胆固醇酯水平的升高会导致不稳定的斑块。此外,胆固醇在促进牙菌斑进展和继发性牙菌斑特征的炎症方面也发挥着关键作用。胆固醇作为脂质筏的主要成分,通过富含胆固醇的膜微区调节阿尔茨海默病中APP的淀粉样变过程,并调节癌细胞的存活和死亡。

3. 小分子代谢物及其在疾病进展中的意义

代谢组学是指对细胞过程的化学指纹图谱进行系统研究,主要是对氨基酸、碳水化合物、有机物等小极性分子(代谢组)进行定量和/或定性分析。由于代谢组是细胞过程的最终产物,其综合分析(代谢组学)提供了机体最相关的功能读数或生理状态。

氨基酸紊乱可由氨基酸的合成或降解受损引起。代谢组学研究表明,支链氨基酸(BCAA)及其相关代谢物与IR的关系比脂类更密切。BCAA可以作为预测糖尿病事件和干预/治疗结果的生物标志物。BCAA水平升高与T2DM表现相关,可能反映了IR状态。BCAA水平升高可能与BCAA分解代谢受支链-酮酸脱氢酶复合物(BCKD)调节有关。通过脂肪信号介导的BCKD复合物的数量和活性的降低可以抑制BCAA的分解代谢和清除。与BCAA水平升高形成对比的是,在预测研究和显性糖尿病中,甘氨酸水平均降低。推测甘氨酸的减少是由于氧化应激引起的糖异生增加、谷胱甘肽消耗增加和谷胱甘肽合成减少。与2型糖尿病的观察结果相似,不同的氨基酸在中风发病的不同途径中发挥作用。据报道半胱氨酸与缺血性脑损伤有关。在中风早期恶化的患者中,半胱氨酸浓度升高。其有害作用可能是由其下游产物硫化氢介导的。氧化谷胱甘肽导致氧化应激,并可能通过增加活性氧化物导致缺血性中风。谷氨酸的过量释放促进钙流入神经元,从而引起神经毒性、神经元细胞死亡和脑损伤。色氨酸代谢在中风发作时被发现改变。它通过主要途径——犬尿氨酸代谢途径氧化,参与炎症反应、氧化应激、内皮功能障碍、颈动脉斑块扩大和脑缺血。

在肥胖、糖尿病、肿瘤和缺血中,碳水化合物代谢显著改变。各种碳水化合物(包括葡萄糖、果糖、乳酸和葡萄糖酸)含量的增加表明肥胖患者碳水化合物分解代谢受到干扰。由于肥胖和糖尿病密切相关,在糖尿病中也观察到类似的碳水化合物变化。一些代谢组学研究也显示,,包括葡萄糖、甘露糖、果糖和己糖在内的糖,甚至在2型糖尿病临床症状出现前3-7年就增加了。葡萄糖摄取的增加及其在糖酵解中的利用导致乳酸生成的增加是肿瘤发生的第一个适应性事件。在缺血期间,也观察到乳酸分泌的增加,这可能意味着大脑对恢复能量平衡和防止神经元凋亡的保护作用。

三羧酸(TCA)循环是通过氧化来自所有需氧生物的碳水化合物、脂类和氨基酸生成的乙酰辅酶A的能量释放形式的三磷酸腺苷(ATP)的关键手段。现有的肥胖和T2DM发病机制认为,β-氧化增加骨骼肌代谢超负荷的速率可能会导致TCA循环支持不完全的β-氧化导致的中间产物,从而导致IR。采用无偏和有针对性的代谢组学方法,我们发现在AD患者中,参与线粒体穿梭的关键代谢物,如柠檬酸和苹果酸的水平明显改变,这可能是AD脑线粒体功能障碍的基础。

4. 代谢组学与脂质组学的整合
4.1

综合组学提供了对细胞过程和病理生理学的更深入理解

代谢组学和脂质组学的综合研究有助于提供公正和全面的经验数据集,特别有助于系统地揭示复杂细胞过程背后的分子机制。脂质组学主要研究水不溶性分子,代谢组学主要研究水溶性极性化合物。已有研究表明,脂质和极性代谢物均参与疾病的病理生理过程,且具有高度的关联性。由于脂质和水溶性极性代谢物通常在共同的生物通路中相互关联,因此脂质组学和代谢组学的协同应用可以重新确认通路的扰动,并在代谢通路的精确步骤中识别导致细胞过程和/或疾病的生物异常的关键酶。代谢组学和脂质组学的结合能够覆盖大部分的小分子,从而提供疾病中细胞损伤的整体特征,从而以公正的方式发现通路改变。

在动脉粥样硬化形成过程中发现肠管通向心脏轴是一系列典型的代谢组学和脂质组学研究相结合的典型例子,这有助于阐明在心血管疾病(CVD)中最终发生的精确通路改变。代谢组学分析首次发现,血浆中与磷脂酰胆碱代谢有关的三种代谢物,即胆碱、甜菜碱和三甲胺- N -氧化物(TMAO)的水平是临床人群中CVD的有效预后指标。使用小鼠模型的机制研究显示,饮食补充胆碱可增强多种促动脉粥样硬化巨噬细胞清除受体的活性,而这些受体在无菌小鼠中丢失。在另一项阐明人类血浆TMAO决定因素的研究中,根据TMAO和胆碱的中位浓度对人群中磷脂酰胆碱、胆碱和TMAO的水平进行了脂质组学和代谢组学的同时监测。在逐步回归模型中,发现血浆磷脂酰胆碱是TMAO的负决定因素,而三甲胺和胆碱是正决定因素。这些发现累积验证了磷脂酰胆碱、胆碱、三甲胺(TMA)和TMAO在CVD进展方面的生物学联系,并加强了从磷脂酰胆碱的饮食摄取中释放的胆碱首先被宿主酶代谢形成气态TMA的机制性建议,随后又形成气态TMA被肠道微生物捕获并转化为TMAO。向血流中释放TMAO可促进巨噬细胞对胆固醇的吸收,并减少胆汁酸的产生,胆汁酸是胆固醇排泄的关键途径(图4)。这些细胞过程导致胆固醇积聚增加,促进富含胆固醇的巨噬细胞的形成,最终导致动脉粥样硬化斑块。除了揭示疾病病理学之外,代谢组学和脂质组学的结合无疑也为缓解心血管疾病提出了几种新的治疗方案,如饮食干预或使用益生菌调节内源性TMAO生成。


图4. 一系列代谢组学和脂质组学研究的结合促进了大肠-心脏轴在动脉粥样硬化中的发现。

综合组学方法也被用于监测动物模型和人类1型糖尿病(T1DM)患者的早期疾病进展。出生时血清琥珀酸盐、PC和TAG水平被认为是T1DM晚期发展的预后指标。在一项比较非肥胖型糖尿病(NOD)和NOD-E(表达主要组织相容性复合物I I小鼠的I-E异二聚体的转基因NOD小鼠)的动物研究中,研究人员证明,NOD小鼠T1DM的发育伴随着脂质、嘌呤和氨基酸(色氨酸)代谢的变化。综合代谢组学和脂质组学也可以提供疾病病因的小分子特征。特别是,在有动脉粥样硬化风险的个体中,脂代谢产物和氨基酸代谢产物之间存在高度的类内相关性,但在碳水化合物代谢中不存在这种相关性。

脂质组和代谢组的全局描述可能对确定更普遍的细胞和生物过程(如膜完整性维持和细胞生长)至关重要,突出了它们在疾病进展中的重要作用(图5)。多发性硬化(MuS)是一种与中枢神经系统相关的慢性炎症性疾病。脑脊液分析采用脂质组学结合代谢组学方法。结果显示,在MuS中,Lyso-PC、Lyso-PI和PI均发生了改变,并与该病的临床变量有关。MuS的谷氨酸水平也升高。有趣的是,脑脊液谷氨酸和赖氨酸磷酸酯的同时升高是通过一个连接途径引起的。谷氨酸释放、钙内流和细胞内PLA2的激活是促使膜解体的关键,这是急性和慢性神经系统疾病中神经元变性的一个特征。

甲状腺癌是内分泌系统中最常见的癌症,其发病率在过去十年中急剧上升。临床上最重要的改变代谢物包括脂类和小分子的混合物,包括葡萄糖、半乳糖、乳酸、肌醇、柠檬酸盐、胆固醇等。在血清和血浆样本中,脂类,特别是胆固醇和鞘磷脂,是正常组和癌组之间最明显的化合物。所有这些代谢物都参与满足细胞生长和分裂所需的高能量需求和构建模块(蛋白质、脂质和核苷酸)的生物合成。总的来说,糖、脂和核苷酸代谢是甲状腺癌发病的最重要途径。

血脂和其他代谢物的变化模式也可能在疾病进展中有所不同。例如,在临床前生物标记物定义的AD分期中,鞘磷脂和含乙醚的磷脂酰胆碱发生了变化,而酰基胆碱、BCAAs-缬氨酸和α-氨基己二酸仅在症状分期后期发生变化。这个例子展示了如何将代谢组学和脂质组学结合起来进行代谢网络分析,从而进一步改进疾病进展的初始诊断和监测,而不是一次只看一个“组学”的信息(图5)。

代谢物的全局监测使无偏网络分析方法有可能筛选出疾病病理生理学中的关键代谢驱动因素(图5)。AD的初步小规模代谢组学或脂质组学研究强调了代谢紊乱,包括PC、神经酰胺-SM途径、pPE、胺和线粒体缺陷。代谢网络分析显示去甲肾上腺素和嘌呤的变化与脑脊液tau蛋白水平升高有关,而色氨酸和蛋氨酸与Aβ水平相关。脑容量变化与认知代谢物(包括酰基胆碱酯酶、缬氨酸和α-氨基己二酸)呈负相关,提示AD后期能量底物利用发生了变化。长链酰基胆碱酯酶、奇数链酰基胆碱酯酶和氨基酸与认知评分之间的关联进一步强化了在神经退行性变中将能量利用从脂肪酸转变为氨基酸的概念。此外,从PCs和SMs分离出的短链酰基胆碱酯酶与胺的共聚表明,短链酰基胆碱酯酶与AD患者常见的氨基酸代谢途径有关,而不是脂质代谢途径。这一新发现源自于脂质组学与代谢组学的协同方法,揭示了与能量底物利用相关的途径中与疾病相关的转变。

图5. 代谢组学与脂质组学相结合的优势。

除了阐明疾病病理学之外,一个综合的组学方法也有助于描述与引人关注的代谢表型相关的特定遗传调控下的精确代谢途径改变。例如,代谢组学和脂质组学的联合研究表明,在过度表达CYP7A1的转基因小鼠中对高脂饮食诱导的肥胖和糖尿病的抗性,归因于胆汁生成和脂质循环水平之间的相互联系。特别是,发现CYP7A1的过度表达导致牛磺酸-β-鼠胆酸水平升高,从而抑制肠法尼样X受体信号,增加肠胆汁酸总量。扩张的肠道胆汁酸池减少了肠道微生物对胆汁的去结合作用,从而降低了次级胆汁的水平,如脱氧胆酸,被证明激活介导SM向神经酰胺转化的酸性鞘磷脂酶。与代谢组学揭示的途径改变一致,脂质组学显示CYP7A1转基因小鼠体内神经酰胺的水平降低,这在本质上可能赋予其在高脂饮食对炎症和胰岛素抵抗的保护作用。

同时应用脂质组学和代谢组学还可以对药物的作用机制进行公正的评价,这对于评估药物的安全性和使用是至关重要的。例如,组学分析显示,清开灵是一种被广泛应用于治疗发烧的中药,它通过平行的途径进行脂质和氨基酸的代谢。脂质组学研究发现清开灵能增加花生四烯酸的释放,从而促进前列腺素E2的生物合成,从而降低体温。另一方面,代谢组学研究显示清开灵可增加血浆中酪氨酸水平,据报道,酪氨酸可通过血脑屏障,成为调节体温的神经递质生物合成的前体。由此可见,单一药物往往具有多个作用臂,引起生物脂质组和代谢组的变化,而脂质和小代谢物在生物有机体的功能网络中高度互联。鉴于此,研究人员将在下面的章节(表1)中讨论一些已知的脂质与包括葡萄糖和氨基酸在内的关键小代谢物之间的通路连接。

表1. 各种疾病中脂质与其它代谢物的相互联系。


4.2
 分析结合代谢组学和脂质组学的努力 

已经尝试用单一提取程序或双相提取方法分析代谢组学和脂质组学,这将允许从同一样品中分析不同种类的生物分子。一些新的分析技术有助于在单一分析过程中同时分析代谢组和脂质组,其中包括单一提取法、双相提取的叠层进样法和二维液相色谱-质谱法。通过这些方法,在一次分析运行中获得了合理的覆盖率和提取效率。尽管如此,化学极性的差异加上结构鉴定需要单独的代谢物库,这意味着至少在短期内,代谢组学和脂质组学在分析策略方面仍将保持很大的独立性。在分析数据采集的下游生物基础上,整合和统一代谢组学和脂质组学数据仍然是代谢组学和脂质组学集成的首选方法。


4.3
 组学数据整合策略

整合代谢组学和脂质组学数据弥补了代谢网络中信息的缺失,支持同一假设的多个正交证据来源减少了错误发现的机会。因此,数据整合在揭示两个组学之间的复杂关系和提供一个全面的代谢状态方面具有巨大的潜力。总体而言,整合组学数据分析旨在回答三个问题:(1)不同组学数据集的哪些特征最能解释有趣变量;(2)组学数据集之间如何相互关联;(3)通过整合组学数据集可以得出哪些功能解释。每个问题都需要不同的方法来解决,但通常的策略是降维(图6)。降维是高维数据分析的一个重要步骤,尤其是在组学数据分析中,因为组学数据具有极高的高维性、高度相关性和噪声。毫不奇怪,由于具有大量的特征和相当大的复杂性,降维在任何综合组学数据分析中都是至关重要的。用于组学数据综合分析的降维技术可用于一个组学数据集(单独或连接的脂质组学和代谢组学数据集),如主成分分析(PCA)、多因素分析(MFA)和非负矩阵因子分解(NMF)。对于组学数据集对,可以采用典型相关分析(CCA)和k表偏最小二乘法(multi-blockPLS)等方法,而广义CCA通常用于多个组学数据集。这些统计方法中有许多是基于投影的方法,如PCA、CCA和PLS,这些方法通过一些未被观测到的潜在变量或成分来归纳样本,这些潜在变量或成分是原始变量的线性组合,使得样本可以在一个小维度空间中进行分类和可视化。在线性组合中,一个分量中原始变量的权值由一个加载向量表示,通常大部分的权值都是非零的,这表明仍然考虑所有原始变量。为了获得更高的效率和可解释性,以及控制过度拟合,通常使用正则化技术共同选择变量,例如稀疏主成分分析(sPCA)、正则典型相关(rCCA)、稀疏偏最小二乘(sPLS)等,其他地方也有一个全面的总结。另外值得注意的是,另一个R包mixOmics提供了多个omics数据集的多变量分析,重点放在数据探索、降维和可视化上。

随机森林(randomforest, RF)等机器学习方法也被应用于集成多个组学数据集(图6)。随机森林是决策树的集合,每个决策树都在一个随机变量子集上的原始数据的随机引导样本上进行训练。RF选择从森林中所有树中获得最多“投票”的分类。RF在大数据集上高效运行,具有内置的连续和分类变量的输入方法,可以有效地处理组学数据中的缺失数据,以及相关的临床和表型数据。另外,RF可以通过原始数据的分类结果与变量值置换后的分类结果的差异来估计变量的重要性,这有助于候选生物标记的选择。此外,变量选择可以通过迭代消除变量重要性最低的变量,并在测试数据上评估模型性能来实现。

对组学数据和相关的临床和表型数据进行分析,往往会得到丰富的信息,包括代谢物/脂类的差异、褶皱变化以及相关、偏相关、比值比等关联强度。为了使研究人员在系统水平上更好地理解分子机制,还必须考虑代谢物和脂类之间的生化关系及其结构上的相似性。基于网络的数据集成方法擅长这方面的极大的灵活性和可伸缩性(图6)。通常情况下,网络中节点代表代谢物和边代表关系,属性等代谢物的P值,褶皱的变化,化学类可以被映射到节点的颜色,大小,形状,和属性的关系可以被映射到边缘宽度、线路类型、颜色等。R语言igraph包提供了用户友好的方法来构建和操作一般的网络图,以及用于网络分析的算法,包括中心和模块识别。其他的R包,如WGCNA, MEGENA和MetaMapp,为更专业的网络提供了不同侧重点的方法,如网络结构分析和生化及通路信息的整合。这样的分析可能在分析复杂的代谢关系时特别有用,这些关系显示出高度的互联性,例如脂质网络,以揭示不同生理状态下代谢物相互关系的变化。例如,MEGENA发现,与发病前4年的对照组相比,发病糖尿病患者的多不饱和pPEs和TAGs之间的相关性发生了改变,揭示了可能导致糖尿病发病时明显血脂异常的候选通路。

图6. 显示组学数据集成策略的通用模式。


5. 结束语和观点

代谢组学和脂质组学已经成为解决各种基本生物学问题以及描述人类疾病分子病理生理学的主要工具。特异性代谢产物/脂质具有独特而显著的功能特性,在调节细胞增殖、代谢、细胞器功能、细胞内吞、自噬、应激反应、凋亡、信号转导、衰老等方面发挥着独特的作用。虽然路径分析迫切需要更全面的信息,但科学家们正在不断努力开发高覆盖率的组学方法,例如广泛分析各种鞘脂的综合平台、高覆盖率的全局脂质组学方法和高覆盖率的靶向代谢组学方法。在未来,色谱和质谱技术的进步将进一步有助于扩大代谢物和脂质的覆盖范围。尽管代谢组学和脂质组学都对促进我们对疾病进展的细胞机制的理解作出了重大贡献,但很明显,单一组学方法未能考虑到两种方法所涵盖的分析物的细胞代谢中的高水平互连性。

虽然分析上的可行性已经将脂质组学从更广泛的代谢组学领域中划出界限,但将代谢组学和脂质组学结合起来处理临床和生物学问题显然是完整的代谢全貌所必需的,这是回答细胞生物学和疾病病理学中各种基本问题的先决条件。协同组学方法有几个优点,例如提供一整套分子变化和全局特征,突出脂质和其他代谢物之间的共同细胞机制,使全面的网络分析能够识别疾病病理学中的关键代谢驱动因素,促进脂质和其他代谢产物在疾病进展中相互联系的研究。尽管在代谢组学和脂质组学的各个领域内有相当大的技术进步,但仍然存在局限性和挑战。除了由化学性质的巨大差异所施加的分析挑战之外,联合代谢组学/脂质组学方法还在数据分析、处理和解释方面增加更大的复杂性。除了不断深入研究代谢组学和脂质组学各自的领域之外,在生物学基础上进行数据解释的收敛方法可能最终解决为细胞生物学和疾病病理学提供迄今为止仍然难以捉摸的关键线索的问题。


收藏