Computer-aided Diagnostic Methods for Medial Degeneration in Non-inflammatory Aorta Based on Multi-stained Pathological Images
-
摘要:目的 探讨建立非炎性主动脉中膜变性(medial degeneration, MD)患者多种染色病理图像计算机辅助诊断模型的可行性。方法 回顾性收集2018年7—12月首都医科大学附属北京安贞医院诊治胸主动脉瘤及夹层患者非炎性病变的主动脉手术标本病理切片。将其以400倍率扫描为全视野数字图像(whole slide image, WSI)后由2名病理科医师对病变进行标注。按6:1的比例将标注后的WSI图像随机分为训练集和测试集。采用训练集数据对SE-EmbraceNet进行训练,构建多种染色病理图像MD多分类[包括层内型黏液样细胞外基质聚集(intralamellar mucoid extracellular matrix accumulation,MEMA-I)、穿透型黏液样细胞外基质聚集(translamellar mucoid extracellular matrix accumulation,MEMA-T)、弹力纤维断裂和/或缺失(elastic fiber fragmentation and/or loss,EFFL)和平滑肌细胞核缺失(smooth muscle cell nuclei loss,SMCNL)]模型,并采用准确率、灵敏度、精确率、F1值对模型的分类效果进行评价。结果 共入选符合纳入和排除标准的胸主动脉瘤及夹层患者非炎性主动脉病变手术标本病理切片530张。总提取5265组图像,每组均包含同一病变部位HE染色、特殊染色(弹力纤维/VanGieson、Masson、阿辛蓝/过碘酸雪夫)及平滑肌肌动蛋白5种染色病理图像。其中,训练集图像4513组,包括SMCNL 987组、EFFL 2013组、MEMA-I 1337组及MEMA-T 176组;测试集图像752组,包括SMCNL 166组、EFFL 335组、MEMA-I 222组及MEMA-T 29组。模型在测试集中显示出良好的MD分类性能,整体准确率为96.54%(726/752)。其中,对EFFL的识别能力最强,准确率、灵敏度、精确率和F1值均≥98.51%,其次为SMCNL,各评价指标均≥97.59%,亦具有较好的分类能力。结论 本研究构建的基于多种染色病理图像MD分类模型具有较高的分类准确性和较好的泛化能力,有望应用于非炎性主动脉病变的辅助诊断。Abstract:Objective To explore the feasibility of establishing a computer-aided diagnostic model of multi-stained pathological images in patients with non-inflammatory aortic medial degeneration(MD).Methods In this study, pathological sections of aortic surgical specimens for non-inflammatory lesions from patients with thoracic aortic aneurysms and dissections were retrospectively collected at the Beijing Anzhen Hospital, Capital Medical University from July to December 2018. The lesions were scanned under ×400 magnification as whole slide images(WSI) and then annotated by two pathologists. The annotated WSI images were randomly split into training and test sets in a 6:1 ratio. SE-EmbraceNet was used to train the data to construct a multi-classification model for MD of multi-stained pathology images, including intralamellar mucoid extracellular matrix accumulation (MEMA-I), translamellar mucoid extracellular matrix accumulation (MEMA-T), elastic fiber fragmentation and/or loss(EFFL) and smooth muscle cell nuclei loss (SMCNL). The classification effect of the model was evaluated based on the test set data, and the results were expressed in terms of accuracy, sensitivity, precision, and the F1 value.Results Totally 530 pathological slides of non-inflammatory aortic lesion surgical specimens from patients with aortic aneurysm and dissection were included. Extracted 5265 sets of images, each containing 5 stained pathological images of the same lesion site: HE staining, special staining (elastic fiber/VanGieson, Masson, Alcian blue/periodic acid Schiff) and smooth muscle actin staining. There were 4513 sets of training images, including 987 SMCNL, 2013 EFFL, 1337 MEMA-I, and 176 MEMA-T; and 752 test images including 166 SMCNL, 335 EFFL, 222 MEMA-I, and 29 MEMA-T. The overall performance of the model in the test set showed good results, with an accuracy of 96.54%(726/752). The model had the best classification performance for EFFL, with accuracy, sensitivity, precision, and F1 value all ≥98.51%. The model also had a great classification ability for SMCNL, with all evaluated indexes≥97.59%.Conclusion The multi-stained pathology image-based MD classification model constructed in this study has high classification accuracy and good generalization ability, which has the potential to be applied to assist in the diagnosis of the non-inflammatory aortic lesion.
-
利用测序技术分析肿瘤遗传变异、特异性代谢活动及进化过程,对肿瘤发生及进展机制的研究有重要意义,且为肿瘤临床治疗提供理论基础。相对于整体测序,单细胞测序技术更有利于阐释肿瘤异质性,且能从有限的样品中获得更多的信息。成人最常见的脑恶性肿瘤是脑转移瘤,而原发脑恶性肿瘤以胶质母细胞瘤(glioblastoma, GBM)最为常见,存在较强的异质性。在分子病理指导精准医疗的背景下,脑恶性肿瘤患者或因无法接受颅脑手术而失去分子病理检测和更有效的靶向治疗的机会。同时,由于颅脑手术创伤较大,多数患者无法在病情进展时重复手术治疗,利用外周血、脑脊液等微创活检的方式进行病程监测并指导个体化治疗是脑肿瘤治疗的方向。因此,鉴于单细胞测序技术的优势,其在脑恶性肿瘤临床诊疗中的应用备受期待。本文将综述单细胞测序技术流程及应用该技术进行肿瘤研究的进展,并结合脑恶性肿瘤的特征对单细胞测序技术在其诊疗中的应用进行展望。
1. 单细胞测序技术发展概述
癌细胞具有基因组不稳定性,在肿瘤起始和进展过程中可积累大量遗传突变,如单核苷酸突变、染色体变异等。利用测序技术测定癌细胞突变类型、功能,有助于探究癌症发生发展机制,并有针对性地研制治疗方案。依据DNA复制的分子生物学原理,Sanger等利用双脱氧核苷酸链终止法进行DNA片段测序,开启了基因组测序的新时代。但Sanger测序法操作繁琐、耗时长、成本高,大规模应用受限。随着荧光染色和毛细管微阵列电泳技术应用于基因组测序,第二代测序技术(next- generation sequencing,NGS)基于“边合成边测序”的原则,实现大规模、高通量测序,显著降低了测序成本。NGS法也具有一定局限性,包括测序片段较短,不能反映基因组长片段的变异,如拷贝数变异(copy number alteration,CNA)和染色体结构变异。第三代测序利用单分子实时测序及基于二代测序的合成长读长测序技术,DNA片段读长可至数十Kb,同时可进行完整的mRNA测序, 有利于对特殊基因的外显子剪切进行精确分析[1]。
既往肿瘤多组学研究通常采用NGS和/或Sanger测序技术进行肿瘤组织整体测序,获得一块肿瘤组织中成千上万个细胞的总体特征,在鉴别并筛选肿瘤相关突变基因、信号通路方面取得大量成果,促进了肿瘤临床诊断和治疗的发展。但肿瘤组织存在异质性,且不同亚型的肿瘤细胞之间的相互作用可影响疾病进程。与肿瘤组织整体测序相比,单细胞测序技术在评估肿瘤内异质性及解决特殊临床问题方面具有优势。第一,单细胞测序技术可用于分析肿瘤内异质性。第二,对于一些浸润生长的肿瘤,单细胞测序技术的应用可更高效地分析肿瘤信息。例如胰腺癌活检组织中肿瘤细胞仅占30%,其余为大量基质细胞。此时,肿瘤细胞中基因组变异可因频率过低而不能检出,尤其是CNA等变异可因测序深度不足而被忽略。第三,对于肿瘤组织样本,临床常因取样少等原因样本受限,如细针活检样本、外周血循环肿瘤细胞(circulating tumor cells,CTCs)等,不足以构建测序文库,单细胞测序或可为临床决策提供有价值的信息[2]。
2. 肿瘤单细胞测序技术概述
相对于整体测序,单细胞测序数据的获取依赖于某些技术的发展,包括单个细胞的分离及分选、单细胞全基因组测序和全外显子测序、单细胞转录组扩增及测序、单细胞表观遗传测序,以满足测序底物要求、测序成本降低和足够的测序细胞数量、控制并评估测序结果的偏倚及误差。
2.1 肿瘤单细胞分离及分选
分离及分选用于测序的单个细胞是肿瘤单细胞测序技术的重要步骤,主要包括实体肿瘤细胞、肿瘤干细胞(cancer stem cells,CSCs)、CTCs和骨髓播散肿瘤细胞(disseminated tumor cells,DTCs)[3]。其中,实体瘤可通过机械切割及胶原酶消化分散为单个细胞,而DTCs来源于骨髓穿刺。同时,该技术还可应用于肿瘤微环境中其他类型细胞的分离及分选,如免疫细胞。
CTCs是存在于患者循环系统中的肿瘤细胞,在血液中数量非常少,每毫升血液仅有数十或数百个CTCs[4],目前分离主要依据其物理或生物学特性。与循环系统中的血细胞相比,CTCs体积更大、密度小且所带电荷与表面蛋白相关,据此可利用梯度离心、微流体惯性聚焦(microfluidic inertial focusing, MIF)、微滤过器(microfabricated filters, MF)法和双向电泳法等进行分离[5]。CTCs的生物学分离方法包括免疫磁珠分离(immunomagnetic separation, IS)、经微流体免疫分离(microfluidics-enabled immunoseparation, MI)、固相酶联免疫斑点技术(epithelial immunospot, EPISPOT)法和入侵实验(invasion assay, IA)等[5]。其中最常见的是IS法,该技术利用携带捕获剂(通常为特异性抗体)的免疫磁珠富集具有特异性膜蛋白的CTCs。基于该技术建立的CellSearch检测系统已获得美国食品药品监督管理局(Food and Drug Administration,FDA)的批准[6]。考虑到测序成本及肿瘤异质性,在将样品分散成单个细胞后,有时需进一步分选用于测序的单细胞,特别是从实体肿瘤中取得的样本。样本细胞筛选通常根据CTCs的特殊分子标志或细胞表型进行,包括流式细胞术(flow cytometry,FACS)、微流体(microfluidics)系统、显微操作(micromanipulation)法和激光捕获显微切割(laser capture microdissection,LCM)[5]。
2.2 单细胞全基因组测序和全外显子测序
从单个细胞中提取的遗传物质不足以进行全基因组测序及分析,因此,通常使用多重置换扩增(multiple displacement amplilication,MDA)、PCR或二者相结合的方法进行基因扩增,如多重退火和成环循环扩增(multiple annealing and looping based amplification cycles, MALBAC)。PCR技术最先用于单细胞基因组扩增,包括选择散布在基因组中的保守序列或随机寡核苷酸序列作为扩增引物。由于基因组中不同位点与引物结合能力不同,在基因组扩增的过程中,存在大量的序列信息丢失。目前选择处于细胞周期中的四倍体细胞、简并寡核苷酸引物PCR(degenerate oligonucleotide primed-PCR,DOP-PCR)进行扩增[7],同时,选择自我复制的细胞进行测序可能导致结果存在偏倚。MDA技术利用ϕ29 DNA聚合酶和耐核酸外切酶的随机引物进行全基因组扩增,该过程无需重复温度循环,且错配率低于常规PCR[8]。MALBAC技术首先利用特殊的随机引物(包括27个氨基酸固定序列和8个氨基酸的可变序列)进行MDA,再对扩增产物进行PCR扩增[9]。有研究表明,MDA的基因组覆盖率高于DOP-PCR及MALBAC,利用该方法测序对单核苷酸位点变异(single nucleotide variants,SNV)的检出率更高;但DOP-PCR和MALBAC对基因组覆盖的均一性更强,有利于检出长度超过1 Mb的CNA[10]。
单细胞全外显子测序(single-cell whole exome sequencing,scWES)需进行外显子捕获和富集,主要用于编码基因的SNV分析。相对于scWES,单细胞全基因组测序(single-cell whole genome sequencing, scWGC)更利于CNA分析并获得非编码区信息,但由于存在基因组覆盖率的限制,SNV的检出效率较低。在乳腺癌中应用单细胞核基因组测序(nucleus genome sequencing, nuc-Seq)技术对G2/M期多倍体细胞核进行扩增和测序分析,可达到单碱基对分辨率[11]。
2.3 单细胞转录组扩增及测序
单细胞RNA测序(single-cell RNA sequencing, scRNA-Seq)包括cDNA构建、cDNA扩增和测序,其结果可显示细胞特异性表达谱和外显子转录的剪切及修饰过程,有助于分析细胞间的异质性。不同基因的转录水平差异较大,多数mRNA拷贝数较低,因此需通过扩增达到转录组测序所需的富集程度。Smart-Seq/Smart-Seq2、Phi29转录组扩增(phi29-transcrip-tome amplification,PTA)和基于半随机引物PCR的转录组扩增(semi-random primed PCR-based transcriptome amplification, STA)是常见的扩增手段。由于存在扩增偏差,通常将上述技术与特殊分子识别(unique molecular identifiers,UMIs)技术联用。UMIs可进行内参控制并定量检测基因表达。近期,在Smart-Seq2基础上使用Tn5转座酶进行cDNA富集可获得完整的转录起始位点信息,其在B淋巴细胞转录组测序中表现出较好的准确性和可重复性[12]。此外,类似于高通量二代测序技术,Drop-Seq可实现单细胞mRNA的高通量测序,该技术将单个细胞分离至纳升大小的PCR体系中,同一个细胞来源的扩增产物具有相同的序列标记,可显著提高测序效率[13]。
2.4 单细胞表观遗传测序
2.4.1 单细胞甲基化测序
基于传统的重亚硫酸盐甲基化测序过程,单细胞全基因组重亚硫酸盐测序技术的测序效果已在小鼠基因组中得到验证[14],该技术首先对单细胞DNA进行多次重亚硫酸盐转换处理,然后在DNA片段加上标记序列并进行扩增、测序。相比于传统方法,可有效减少重亚硫酸盐处理导致的DNA降解和信息损失。另一种常见的技术是简化重亚硫酸盐测序(reduced representation bisulfite sequencing, RRBS),该技术使用核酸内切酶消化DNA并富集特定的片段进行分析,在检测CpG岛方面更有优势[15]。受限于单细胞DNA含量,相较于整体样品甲基化测序,单细胞DNA甲基化测序技术的CpGs位点覆盖率较低。
2.4.2 单细胞染色体结构测序
肿瘤细胞的遗传物质不稳定,染色体结构可发生变化。基于染色质转座酶结合实验,scATAC-Seq技术利用Tn5转座酶对染色质开放区域进行测序[16],可用于细胞间异质性分析,但该方法仅针对染色质开放结构进行测序。此外,基于染色体构象捕获的全基因组高通量Hi-C可用于检测染色体的三维构象,如染色质环和拓扑结构域[17]。目前,单细胞染色体结构测序普遍具有单次测序数据较少、基因组不能全覆盖的局限性,但上述两种主要的技术目前还无可替代。单细胞核小体结构和甲基化测序技术通过GpC甲基转移酶处理,可同时获得染色质开放区域、DNA甲基化和核小体相位的序列信息,还可筛选转录因子结合位点和脱氧核糖核酸酶高敏感性位点(DNase hypersensitive sites,DHSs)等有重要意义的序列[18]。
2.4.3 单细胞非编码RNA测序
机体细胞中存在大量对细胞功能有重要调节作用的非编码RNA。全RNA测序可获得mRNA及包括长链非编码RNA(long noncoding RNAs,lncRNAs)在内的非多聚腺苷酸RNA[non-poly(A) RNA]序列信息。对于lncRNAs,可根据其序列长度、外显子数量、序列进化保守性等特点从全RNA测序结果中筛选有用信息[19]。但使用寡脱氧胸苷酸(oligo-dT)进行全RNA测序对non-poly(A) RNA的覆盖率仍有待提高。随机置换扩增测序技术(random displacement amplification sequencing,RamDA-Seq)可应用于单细胞RNA全长测序。该技术将逆转录随机置换扩增技术和部分随机引物相结合,对non-poly(A) RNA有较高的灵敏度[20]。同时,另一项研究简化了单细胞RNA测序技术的长度筛选过程,结合信息学分析可获得如microRNA、tRNA片段和小核RNA(small nucleolar RNAs,snoRNAs)等短序列测序结果,且在人类胚胎干细胞中得到验证[21]。
2.4.4 单细胞多组学共测序
单细胞基因组、转录组及表观遗传组学等多组学同时测定,可获得多维度信息,在细胞间异质性、代谢特异性分析等方面有重要意义。目前,已有多个平台可以通过细胞质与细胞核分离、基因组和转录组分离的方法,同时进行单细胞全基因组、转录组和甲基化组测序[22]。
3. 单细胞测序技术在肿瘤中的研究进展
3.1 循环肿瘤细胞
肿瘤患者外周血中存在CTCs和CTCs簇。有关肿瘤转移的研究表明,肿瘤细胞可发生上皮间质转化(epithelial-to-mesenchymal transition, EMT)并侵入血管,在循环系统中存活的部分肿瘤细胞即为CTCs,其与肿瘤转移有关[23]。此外,医源性因素也可导致CTCs。从前列腺癌患者外周血中通过微液滴系统富集CTCs并进行单细胞RNA测序,结果显示患者自身和不同患者之间的CTCs转录组具有异质性,且发现耐药性相关的雄激素受体存在基因突变和剪切变异,该过程受上调的非经典Wnt信号通路调控[24]。相比于单个CTC细胞,CTCs簇具有更强的转移能力。一项研究对结肠癌、乳腺癌、胃癌和前列腺癌原发肿瘤CTCs进行分析,结果表明后者特殊基因的CNA变异显著提高,如Myc和第10号染色体缺失的磷酸酶张力蛋白同源物基因(gene of phosphate and tension homology deleted on chromsome ten, PTEN),提示潜在的转移机制。且同一来源的CTCs之间显示出相对保守的CNA模式,同种肿瘤不同来源的CTCs之间以及原发肿瘤和CTCs之间SNV谱系存在较大差异,且SNV的发生具有更强的随机性[25]。由于存在扩增偏差和基因组测序覆盖程度的限制,CTCs的SNV研究发展需单细胞全基因组测序技术的进一步优化。
3.2 肿瘤进化及异质性
单细胞水平的研究可用于分析肿瘤内和肿瘤间的异质性,有助于肿瘤诊断、治疗,特别是对治疗过程中出现放化疗抵抗的机制研究有重要意义。利用nuc-Seq技术研究乳腺癌克隆进化可知,单倍体重排发生在肿瘤早期,在肿瘤细胞克隆扩增时染色体相对稳定;点突变则持续发生且与克隆异质性相关。同时,相比于雌激素受体阳性细胞,三阴性乳腺癌肿瘤细胞突变率更高[11]。利用肺腺癌患者肿瘤细胞进行异种移植,并对药物处理前后的异种移植肿瘤细胞进行单细胞mRNA测序, 可根据转录组将细胞分为不同的药物敏感性亚型[26]。依赖于多组学技术的发展,scTrio-Seq应用于人肝细胞肝癌基因组、甲基化组和转录组共测序,并根据SNV、DNA甲基化水平和转录组谱将被测细胞分为2个亚型,不同亚型具有不同的免疫识别潜能[27]。在单细胞基因组学和转录组学研究的基础上,表观遗传学测序结果可对基因组转录和翻译过程提供更多信息。
3.3 分子标志物筛选
既往黑色素瘤、胰腺肿瘤等相关研究提示,特征基因突变和基因重排谱是目前肿瘤诊断和预后评估的标志物之一[28-29]。针对肾透明细胞癌的单细胞外显子测序结果与既往利用整体测序技术得到的突变谱不同,且在被测序的25个细胞中未发现显著的克隆亚型[30]。另一项针对膀胱癌的研究中,对分离的膀胱癌干细胞、膀胱癌非干细胞、膀胱上皮细胞等类型的细胞进行单细胞DNA-Seq,结果显示膀胱癌干细胞存在克隆同源性,并发现了新的与肿瘤起始和细胞增殖相关的突变基因[31]。由于受到肿瘤异质性和测序成本的限制,被测序细胞的选择至关重要,因此,不仅需要发展高通量单细胞测序技术,还应建立用于单细胞检测的细胞分选标准。目前,已有研究利用单细胞RNA测序结果,构建能预测胶质瘤患者生存预后的转录组特征谱[32]。
3.4 肿瘤转移
实体肿瘤可发生远处转移和微转移。肿瘤细胞微转移DTCs通常出现在骨髓中,部分对治疗有抗性,可进展为肿瘤骨转移、内脏转移。利用单细胞测序技术可检出DTCs并定位其原发灶。从乳腺癌患者骨髓样品中分离得到单个细胞并进行全基因组测序,将序列信息中的CNA模式和原发肿瘤、淋巴结转移灶进行比对,可确定DTCs的原发肿瘤来源[33]。另一方面,对肿瘤原发灶和转移灶进行单细胞测序有助于发现肿瘤转移和定植相关的分子标志物及生态位特点。对头颈鳞癌原发灶及淋巴结转移灶进行单细胞全外显子组和转录组测序,结果显示原发灶细胞表达谱具有空间特异性,位于前缘的细胞部分上皮间质转化(partial epithelial-to-mesenchymal transition,p-EMT)水平较高,可作为肿瘤转移的预测标志[34]。
3.5 肿瘤微环境及免疫微环境
利用高通量单细胞测序技术可同时获得肿瘤微环境中的多种信息,有助于肿瘤生态位的研究。一项关于转移性黑色素瘤微环境的研究对患者肿瘤组织中的癌细胞、免疫细胞、间质细胞和内皮细胞进行单细胞RNA测序,结果显示肿瘤微环境中细胞间相互作用的特殊模式。针对肿瘤浸润T淋巴细胞的测序分析显示了该肿瘤组织中T淋巴细胞活化和克隆机制,为靶向治疗和免疫治疗提供了新思路[35]。肿瘤浸润T淋巴细胞在免疫治疗中有重要作用,从肝细胞癌患者血液、癌组织及癌旁组织中分离T淋巴细胞并进行单细胞RNA测序,可根据其分子及功能特性分型,结果显示CD8+T细胞和调节T细胞的特异性富集,测序结果亦提示了与之相关的靶基因[36]。此外,黑色素瘤中免疫细胞的测序结果显示,单核细胞和树突状细胞中干扰素γ诱导的免疫稳态调节分子的表达谱明显变化,导致抗肿瘤免疫反应被抑制,且与肿瘤免疫逃逸相关[37]。而对于脑转移瘤动物模型的单细胞RNA测序结果则提示脑肿瘤免疫微环境中小胶质细胞、骨髓来源巨噬细胞在肿瘤脑转移、脑转移瘤治疗抵抗中起重要作用[38]。
4. 脑恶性肿瘤诊治发展概述
胶质瘤约占原发脑肿瘤的27%,其中,胶质母细胞瘤是最常见的中枢神经系统原发恶性肿瘤。目前,胶质瘤的诊断主要依据影像学和组织病理学,治疗方案主要为手术结合放化疗。异柠檬酸脱氢酶(isocitrate dehydrogenase, IDH1)突变、O6-甲基鸟嘌呤-DNA甲基转移酶(O6-methylguanine-DNA methyltransferase, MGMT)甲基化、TERT启动子突变、1p19q缺失等基因组变异特点的发现是胶质瘤诊治进程中的里程碑,可指导肿瘤治疗,且与患者预后相关。世界卫生组织(World Health Organization, WHO)于2016年发布的中枢神经系统肿瘤分类指南首次将这些分子分型与组织病理整合[39]。此外,肿瘤相关抗原表皮生长因子受体(epidermal growth factorre-ceptor, EGFR)及GBM肿瘤特异性抗原EGFRvⅢ突变与胶质瘤的预后相关[40],是靶向治疗、免疫治疗(如抗原肽疫苗、过继免疫治疗等)的重要靶点。在胶质瘤的诊疗过程中,除影像学及临床进展评估外,利用血液、脑脊液中细胞学、DNA检测或可为临床进展、肿瘤复发提供辅助信息[41]。目前,胶质瘤治疗方案的优化仍需深入进行基础研究和临床试验。
脑转移瘤是最常见的中枢神经系统恶性肿瘤,发病率约为原发恶性肿瘤的3~10倍,患者预后较差。对于首诊脑转移瘤患者,手术切除及放疗是主要的治疗方法。对于原发肿瘤化疗敏感的患者,也可尝试应用传统化疗方案治疗[42]。部分患者,如EGFR突变或间变性淋巴瘤激酶重排的非小细胞肺癌、人类表皮生长因子受体2阳性的乳腺癌、BRAF突变的黑色素瘤患者,发生脑转移后可能从靶向治疗中获益。近期一项关于酪氨酸激酶抑制剂埃克替尼治疗EGFR突变的非小细胞肺癌多发脑转移的Ⅲ期临床试验(BRAIN, NCT01724801)结果显示,患者无进展生存期显著延长[43],此研究依赖于对原发肿瘤和脑转移瘤的组学研究。一项对86例对脑转移瘤及其配对原发肿瘤的单细胞测序研究表明,肿瘤发生脑转移后分子标志物发生变化,因此不能完全依赖外周肿瘤的标志物进行治疗决策,该研究亦分析了脑转移瘤在目前临床药物相关作用通路上的变异情况[44],为脑转移瘤的诊治提供了新的思路。目前关于脑转移瘤的单细胞测序研究非常有限,仍有待进一步探讨。
5. 单细胞测序技术在脑肿瘤中的研究现状
5.1 特殊分子标志及信号通路
转录因子ZEB1在EMT、DNA损伤修复、免疫抑制等多种过程中发挥重要作用,但既往关于胶质瘤中ZEB1的功能研究结果存在争议。利用单细胞测序技术测定胶质瘤组织中不同类型细胞的ZEB1分子表达,结果提示其在肿瘤细胞、反应性胶质细胞和免疫细胞之间呈不同表达模式,且与EGFR倍增、IDH1突变有关[45]。利用单细胞全基因组测序技术检测GBM中EGFR的变异谱,可发现细胞之间EGFR的CNA不同,且存在相关其他类型突变,可能是肿瘤细胞增殖、克隆变异及产生治疗抗性的机制之一[46]。此外,利用单细胞测序技术根据转录组测序结果将肿瘤组织中的细胞进行分类,为进一步分析基因和肿瘤行为的关系奠定了基础。对复发GBM患者原发肿瘤及配对复发肿瘤进行单细胞RNA测序,结果提示RAS信号通路与GBM复发相关,且该结果在一项纳入3000例胶质瘤患者肿瘤组织RNA测序结果的荟萃分析中得到证实[47]。
5.2 胶质瘤的肿瘤异质性
大量实验证实表观遗传学修饰在肿瘤形成过程中发挥重要作用。一项研究对5例原发GBM和2个GBM肿瘤干细胞系的lncRNAs表达谱进行单细胞RNA测序,结果提示肿瘤间广泛存在lncRNAs的差异表达,但存在31个lncRNAs组成的表达谱可作为肿瘤干细胞特性的分子标志物[48];此外,可根据lncRNAs表达谱将GBM细胞分为4种亚型,此分型方式与按照蛋白编码基因分型之间的一致性约为77%。对原发GBM细胞进行单细胞转录组测序,其结果显示癌基因信号、细胞增殖、补体-免疫应答及缺氧反应等代谢过程具有较强的异质性,可据此对GBM进行重新分类[49]。针对肿瘤内或肿瘤间异质性的研究可辅助治疗及预后评估。
5.3 胶质瘤的肿瘤进化
对IDH1/2突变的少突胶质瘤细胞进行单细胞RNA测序,结果显示其存在具有神经干细胞表达谱的细胞亚群,其中部分细胞高表达增殖相关基因,与全基因组CNA、点突变谱相一致,这部分细胞被认为是起始肿瘤增殖[50]。相比于整体测序,单细胞测序技术在展示肿瘤内细胞间异质性方面有较大优势,通过该技术可以更精确地分析肿瘤进化过程,并筛选有重要意义的突变形式。利用单细胞测序技术探究EGFR或PDGF突变的GBM,可以分析促血管生成因子在肿瘤发生、增殖过程中的作用,且发现PDGF受体编码基因中特定位点的缺失与前神经元性GBM增殖密切相关,提示其可能作为有意义的治疗靶点[51]。
5.4 胶质瘤的循环肿瘤细胞
目前,关于胶质瘤患者循环系统中是否存在CTCs尚存有争议,少量研究报道可在GBM患者外周血中分离得到CTCs。另一项研究针对肿瘤细胞端粒酶设计病毒载体的荧光蛋白以筛选肿瘤CTCs,利用单细胞测序技术可对该体系进行验证,实验结果提示胶质瘤患者外周血中存在CTCs,且高级别胶质瘤患者外周血中CTCs富集程度更强[52],或可将CTCs富集程度作为一种预后相关的细胞标志。
5.5 胶质瘤肿瘤微环境和免疫应答
胶质瘤存在浸润生长的特点。针对GBM患者肿瘤中心细胞、边缘浸润的肿瘤细胞及不同位置免疫细胞的单细胞测序结果表明,其基因组和转录组具有异质性,位于肿瘤中心和边缘浸润的免疫细胞之间基因表达也具有特异性。此外,不同患者之间的浸润肿瘤细胞具有相对保守的基因突变及表达模式,这些基因可能与肿瘤浸润、侵袭及GBM复发相关[53]。对IDH突变的胶质瘤细胞进行单细胞转录组测序,并结合癌症基因组图谱(the cancer genome atlas, TCGA)数据库RNA谱相关数据进行分析,该研究结果显示胶质瘤免疫微环境中小胶质细胞和巨噬细胞存在富集现象[54]。此外,肿瘤免疫微环境的进展可辅助治疗相关研究。利用单细胞RNA测序技术发现胶质瘤中存在外周血来源的巨噬细胞,高表达具有免疫抑制功能的细胞因子,且在不同级别胶质瘤中的富集程度不同[55],其可能与不同级别肿瘤恶性程度相关。
6. 未来脑恶性肿瘤诊疗应用展望
6.1 早期诊断及动态监测
目前已有部分研究报道了胶质瘤患者外周血中可分离、获得CTCs,依据胶质瘤进展、复发等过程中肿瘤组织、肿瘤干细胞及CTCs的分子标志物研究,可通过外周血中CTCs相关基因突变、表达及表观遗传学修饰提示疾病进程、治疗效果预估并监测是否复发。作为影像学检查的辅助工具,其时效性、预测的灵敏度及特异度仍有待进一步研究。CTCs富集在微创方面具有一定优势,CTCs单细胞测序或可替代组织活检,用于患者初步病理诊断并指导治疗。近期一项研究从GBM患者外周血中分离并鉴别CTCs,可作为胶质瘤复发的微创检测指标之一[56]。
此外,肺癌、乳腺癌、结直肠癌等可发生脑转移,一般预后不佳。脑转移瘤的早期检出可为治疗提供更多的选择。单细胞测序技术可对转移相关的CTCs及DTCs进行多组学测序。关于肺癌的研究发现,单细胞全基因组测序可检出CTCs中存在的特殊CNA模式,具有指示肿瘤转移的潜能[57]。此外,还可通过单细胞转录组、表观遗传组测序技术靶向CTCs或DTCs原发灶。CTCs可从患者的外周血中分离,创伤较小,且与原发肿瘤联系紧密。因此,可通过CTCs对肿瘤原发灶及转移进展的动态变化进行监测。由于CTCs在血液中富集程度较低,因此,需更高效的CTCs捕获和富集技术。为了更好地诊断和监测肿瘤,不仅需要更多关于肿瘤形成、增殖过程的多组学数据,还需对肿瘤原发灶、CTCs及肿瘤转移灶之间在分子、细胞水平上的关联和变异进行更深入的研究。
6.2 个体化治疗
单细胞测序的优势是发现肿瘤内和肿瘤间的异质性。基因组序列变异和特殊表观遗传修饰将导致细胞表达谱变化,这可能使部分细胞在治疗过程中产生耐药性,导致肿瘤细胞未被完全杀灭。利用单细胞测序技术可获得更全面的肿瘤分子特征,包括药物作用靶点、放化疗抗性标志物等,通过靶向特殊分子设计并完善治疗方案。结合针对CTCs的单细胞测序技术可实时监测肿瘤细胞异质性的变化,在治疗过程中针对其分子特征调节治疗方案。
单细胞测序技术还可对肿瘤微环境及免疫微环境进行分析,可能为临床免疫治疗提供新靶点和思路。
6.3 肿瘤分型和预后评估
相对于肿瘤组织整体测序,单细胞基因组、转录组和表观遗传组测序可获得更多特殊分子信息,结合相关分子的功能实验和临床数据,可筛选与治疗、预后相关的新型分子标志物,或针对现有标志物进行更精确的亚型分类。其次,多组学信息的整合可补充现阶段的肿瘤分子分型。此外,免疫微环境中免疫细胞的类型、数目,以及CTCs富集程度也可作为胶质瘤预后的标志物。对不同级别胶质瘤临床样本中肿瘤相关巨噬细胞(tumor-associated macrophages,TAM)进行单细胞测序分析表明,对于低级别胶质瘤,免疫微环境中高表达外周血细胞相关基因的TAM富集程度与患者预后相关[55]。
作者贡献:汪昊、孙中杰负责模型构建、测试及论文撰写;董方、陈东负责切片审阅及论文设计、修订;梁志勇、万涛负责论文审校;连国亮、龚珊珊负责资料收集与数据整理;季君予、秦曾昌负责技术支持。利益冲突:所有作者均声明不存在利益冲突 -
表 1 模型在测试集中的评价结果(%)
病变类型 准确率 灵敏度 精确率 F1值 SMCNL 99.07 97.59 98.18 97.88 EFFL 98.67 98.51 98.51 98.51 MEMA-I 96.94 95.05 94.62 94.83 MEMA-T 98.40 79.31 79.31 79.31 SMCNL、EFFL、MEMA-I、MEMA-T:同图 3 -
[1] Ostberg NP, Zafar MA, Ziganshin BA, et al. The Genetics of Thoracic Aortic Aneurysms and Dissection: A Clinical Perspective[J]. Biomolecules, 2020, 10: 182. DOI: 10.3390/biom10020182
[2] Halushka MK, Angelini A, Bartoloni G, et al. Consensus statement on surgical pathology of the aorta from the Society for Cardiovascular Pathology and the Association for European Cardiovascular Pathology: Ⅱ. Noninflammatory degenerative diseases-nomenclature and diagnostic criteria[J]. Cardiovasc Pathol, 2016, 25: 247-257. DOI: 10.1016/j.carpath.2016.03.002
[3] 汪昊, 陈东, 万涛, 等. 深度学习神经网络在非炎性主动脉中膜变性病理图像分类中的应用[J]. 中华病理学杂志, 2021, 50: 620-625. DOI: 10.3760/cma.j.cn112151-20201205-00902 Wang H, Chen D, Wan T, et al. Application of deep learning neural network in pathological image classification of non-inflammatory aortic membrane degeneration[J]. Zhonghua Binglixue Zazhi, 2021, 50: 620-625. DOI: 10.3760/cma.j.cn112151-20201205-00902
[4] 孙中杰, 万涛, 陈东, 等. 深度学习在主动脉中膜变性病理图像分类中的应用[J]. 计算机应用, 2021, 41: 280-285. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY202101045.htm Sun ZJ, Wan T, Chen D, et al. Application of deep learning in histopathological image classification of aortic medial degeneration[J]. Jisuanji Yingyong, 2021, 41: 280-285. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY202101045.htm
[5] Li C, Li XT, Rahaman MM, et al. A comprehensive review of computer-aided whole-slide image analysis: from datasets to feature extraction, segmentation, classification and detection approaches[J]. Artif Intell Rev, 2022. https://doi.org/10.1007/s10462-021-10121-0.
[6] Tosta TA, de Faria PR, Neves LA, et al. Color normaliza-tion of faded H&E-stained histological images using spectral matching[J]. Comput Biol Med, 2019, 111: 103344. DOI: 10.1016/j.compbiomed.2019.103344
[7] 万涛, 秦曾昌, 孙中杰, 等. 基于深度学习的多种染色病理图像分类方法及系统: CN112348059A[P]. 2021-02-09. [8] Hu J, Shen L, Albanie S, et al. Squeeze-and-Excitation Networks[J]. IEEE Trans Pattern Anal Mach Intell, 2020, 42: 2011-2023. DOI: 10.1109/TPAMI.2019.2913372
[9] Srivastava N, Hinton G, Krizhevsky A, et al. Dropout: A Simple Way to Prevent Neural Networks from Overfitting[J]. J Mach Learn Res, 2014, 15: 1929-1958.
[10] 张光磊, 范广达, 冯又丹, 等. 一种基于深度学习的胰腺癌病理图像分类方法及系统: CN113538435A[P]. 2021-10-22. [11] van Rijthoven M, Balkenhol M, Siliŋa K, et al. HookNet: Multi-resolution convolutional neural networks for semantic segmentation in histopathology whole-slide images[J]. Med Image Anal, 2021, 68: 101890. DOI: 10.1016/j.media.2020.101890
[12] Wang X, Fang Y, Yang S, et al. A hybrid network for automatic hepatocellular carcinoma segmentation in H&E-stained whole slide images[J]. Med Image Anal, 2021, 68: 101914. DOI: 10.1016/j.media.2020.101914
[13] Lin H, Chen H, Wang X, et al. Dual-path network with synergistic grouping loss and evidence driven risk stratifica-tion for whole slide cervical image analysis[J]. Med Image Anal, 2021, 69: 101955.
[14] Xue Y, Ye J, Zhou Q, et al. Selective synthetic augmenta-tion with HistoGAN for improved histopathology image classification[J]. Med Image Anal, 2021, 67: 101816.
[15] Mohammadi S, Mohammadi M, Dehlaghi V, et al. Automa-tic Segmentation, Detection, and Diagnosis of Abdominal Aortic Aneurysm (AAA) Using Convolutional Neural Networks and Hough Circles Algorithm[J]. Cardiovasc Eng Technol, 2019, 10: 490-499.