Image Compression and Storage Algorithm of Histopathology Based on Matrix Calculation
-
摘要:目的 评价基于矩阵计算的组织病理学图像压缩储存算法的临床应用价值,并寻求最佳图像压缩比。方法 利用主成分分析法(principal component analysis,PCA)和奇异值分解法(singular value decomposition,SVD)两种经典矩阵算法,对低、中、高分化的宫颈癌组织免疫组化染色图像及HE染色图像进行压缩重建,并采用峰值信噪比和结构相似度针对图像重建质量进行评价。结果 PCA重建图像压缩比为10.18(保留53个主成分)时,低、中、高分化宫颈癌组织免疫组化染色图像峰值信噪比均值分别为43.84±0.43、43.27±0.25、43.71±0.49,压缩图像结构相似度分别为0.964±0.004、0.963±0.006、0.965±0.005;HE染色图像峰值信噪比均值分别为43.41±0.78、42.95±1.03、43.52±0.69,压缩图像结构相似度分别为0.953±0.010、0.949±0.015、0.960±0.007。SVD重建图像压缩比为10.00(保留128个奇异值)时,低、中、高分化宫颈癌组织免疫组化染色图像峰值信噪比均值分别为39.89±1.69、38.20±2.19、40.90±0.50,压缩图像结构相似度分别为0.949±0.006、0.938±0.011、0.955±0.004;HE染色图像峰值信噪比均值分别为40.31±0.98、39.46±1.59、40.77±1.67,压缩图像结构相似度分别为0.965±0.006、0.943±0.010、0.969±0.005。结论 采用PCA和SVD可实现对组织病理学图像进行压缩储存并获得较好的图像质量,为解决医院图像存储难题提供了解决方案。Abstract:Objective To evaluate the clinical application value of the compression and storage algorithm of histopathological images based on matrix computing, and to seek the best image compression ratio.Methods Two classical matrix algorithms, principal component analysis (PCA) and singular value decomposition (SVD), were used to compress and reconstruct the immunohistochemical images and HE staining images of low, medium and high differentiated cervical cancer tissues. The peak signal-to-noise ratio(PSNR) and structural similarity (SSIM) were used to analyze and evaluate the quality of image reconstruction.Results When the compression ratio of PCA reconstruction image was 10.18 (53 principal components were retained), the mean PSNR of immunohistochemical images of low, medium and high differentiated cervical cancer tissues were 43.84±0.43, 43.27±0.25 and 43.71±0.49, respectively, and the SSIM were 0.964±0.004, 0.963±0.006 and 0.965±0.005, respectively. Meanwhile, the mean PSNR of HE staining images of low, medium and high differentiated cervical cancer tissues were 43.41±0.78, 42.95±1.03 and 43.52±0.69, respectively, and the SSIM were 0.953±0.010, 0.949±0.015 and 0.960±0.007, respectively. When the compression ratio of SVD reconstruction image was 10.00(128 singular values were retained), the mean PSNR of immunohistochemical images of low, medium and high differentiated cervical cancer tissues were 39.89±1.69, 38.20±2.19 and 40.90±0.50, respectively, and the SSIM were 0.949±0.006, 0.938±0.011 and 0.955±0.004, respectively. Meanwhile, the mean PSNR of HE staining images of low, medium and high differentiated cervical cancer tissues were 40.31±0.98, 39.46±1.59 and 40.77±1.67, respectively, and the SSIM were 0.965±0.006, 0.943±0.010 and 0.969±0.005, respectively.Conclusions PCA and SVD can compress and store histopathological images and obtain better image quality, which provides a solution to the problem of hospital image storage.
-
肺大细胞神经内分泌癌(large cell neuroendocrine carcinoma,LCNEC)最早见于1989年的病例报道[1],后由Travis等[2]于1991年首次行病例总结,随着认识的不断深入,目前将其列为不同于典型类癌、不典型类癌以及小细胞神经内分泌癌的一类新型肺部神经内分泌癌[3]。目前认为,LCNEC为一种罕见的、侵袭性强、预后相对较差的肺部神经内分泌癌[4-5]。由于该病认识时间尚短,且为罕见疾病,目前还缺乏诊治经验及指南。本文回顾性分析北京协和医院近15年经手术病理证实的35例LCNEC病例资料,旨在总结以手术为主的综合治疗疗效,并分析潜在的预后因素。
资料和方法
资料
收集2000年1月至2014年1月在北京协和医院诊治、术前评估为可切除病灶并经手术病理证实为LCNEC的患者资料。对所有患者临床症状、影像学检查、手术与综合治疗方式及结局进行分析。
治疗方法
对患者采取以手术为主的综合治疗。手术方法根据肿瘤的部位、大小、位置等具体情况不同而采用开胸或胸腔镜下肺叶切除+肺门纵隔淋巴结清扫。肿瘤分期参考肺癌TNM分期[6-7]。
统计学处理
应用SPSS 19.0软件进行数据分析,符合正态分布的计量资料采用均数±标准差表示,非正态分布资料采用中位数表示。应用Kaplan-Meier生存曲线及Log-rank单因素检验分析生存时间及预后相关因素。生存期计算为自手术日期到患者死亡或末次随诊日期的时间。选择年龄(中位年龄为界)、性别、病变部位、TNM分期(Ⅰ、Ⅱ期为一组,Ⅲ、Ⅳ期为一组)以及是否接受辅助治疗等变量因素,应用Log-rank检验进行单因素分析其对生存期是否存在影响,并将单因素分析中P<0.5的变量带入Cox回归模型行多因素分析。以P<0.05为差异有统计学意义。
结果
一般情况
2000年1月至2014年1月经北京协和医院术后病理证实为LCNEC的患者共35例,其中男性29例,女性6例(男:女=4.8: 1),中位年龄63岁,就诊时中位病程2个月。35例患者中28例(80%)有吸烟史,其中男性吸烟率高达96.6%(28/29),而6例女性患者均不吸烟(表 1)。
表 1 35例肺大细胞神经内分泌癌患者临床资料项目 数值 年龄(M,岁) 63(47~77) 性别(男/女,例) 29/6 病程(M,月) 2(1~14) 吸烟(是/否,例) 28/7 症状[例(%)] 咳嗽、咳痰 21(60.0) 胸背痛 3(8.6) 发热 2(5.7) 无症状查体发现 9(25.7) 病变类型(周围型/中心型,例) 21/14 手术方式[例(%)] 肺叶切除+淋巴结清扫 24(68.6) 复合肺叶切除+淋巴结清扫 5(14.2) 袖式肺叶切除+淋巴结清扫 3(8.6) 亚肺叶切除+淋巴结清扫 3(8.6) 肿瘤最大径(M,cm) 4(1.2~12.0) TNM分期[例(%)] Ⅰ 12(34.3) Ⅱ 7(20.0) Ⅲ 13(37.1) Ⅳ* 3(8.6) 辅助治疗[例(%)] 无 12(28.6) 化疗 20(62.8) 化疗+放疗 3(8.6) 复合肺叶切除:肺叶+肺叶或肺叶+段切除;亚肺叶切除:肺楔形切除或解剖性肺段切除;*3例Ⅳ期患者为肿瘤胸膜腔播散 临床表现及检查
患者主要临床表现有咳嗽、咳痰、胸背痛、胸闷、发热等,无症状查体发现者9例(25.7%)。CT检查考虑周围型病变21例(图 1),中心型病变14例(表 1)。中心型病变中11例行支气管镜检查均可见新生物,活检病理:小细胞肺癌(small cell lung cancer,SCLC)1例,非小细胞肺癌(non-small cell lung cancer,NSCLC)1例,低分化癌3例,中分化鳞癌1例,低分化腺癌1例,腺鳞癌1例,可见癌细胞1例,坏死2例。周围型病变3例行支气管镜检查未见异常,1例经CT引导下穿刺病理考虑分化差的癌。
术前辅助治疗
4例患者行术前辅助治疗:1例为术前活检病理考虑SCLC,术前2程化疗(卡铂+VP16方案),病变缩小后行手术治疗;1例术前活检病理可见癌细胞未分型,患者因临床评估Ⅲ期,术前化疗4程(长春瑞滨+顺铂)并联合放疗,病变缩小后手术;1例术前活检病理考虑NSCLC,术前2程化疗(紫杉醇+顺铂),病变变化不明显后手术;还有1例术前活检病理为低分化腺癌,术前化疗2程(替加氟+卡铂),病变变化不明显后手术。
手术方式及术后情况
患者手术方式为:肺叶切除及淋巴结清扫24例,复合肺叶切除及淋巴结清扫5例,袖式肺叶切除及淋巴结清扫3例,亚肺叶切除(肺楔形切除或肺段切除)及淋巴结清扫3例(其中楔形切除2例,解剖性肺段切除1例)(表 1)。胸腔镜手术4例,开胸手术31例。围术期死亡1例(2.8%),因呼吸功能衰竭于术后37 d死亡;围术期并发症2例(5.7%),均为术后脑梗死,经治疗后好转。
手术病理结果
肿瘤的中位最大径为4.0 cm(1.2~12.0 cm)。手术中送冰冻病理检查8例,6例报告肺癌未分型,1例低分化神经内分泌癌,1例可能为神经内分泌癌。最终35例均由石蜡病理及免疫组织化学确认为LCNEC。TNM分期为Ⅰ期12例(Ⅰa期5例,Ⅰb期7例),Ⅱ期7例(Ⅱa期2例,Ⅱb期5例),Ⅲ期13例(Ⅲa期10例,Ⅲb期3例),Ⅳ期3例(表 1)。
术后治疗及随访
35例患者中1例于围术期死亡,34例术后中位随访时间16.5个月(5~135个月)。12例患者术后未进行辅助治疗,其中除1例于围术期死亡外,6例死于术后肿瘤进展,1例肿瘤复发带瘤生存,4例无瘤生存。23例患者行辅助治疗,辅助治疗中化疗均是以铂类为基础的化疗方案,其中5例无瘤生存,18例死于肿瘤进展。肿瘤进展多为转移性复发,复发部位主要为骨、脑、淋巴结(锁骨上及纵隔为主)。采用Kaplan-Meier法计算生存期,中位生存期仅17个月(95% CI:11.4~22.6),1年、3年、5年生存率分别为60.0%、29.0%、24.8%(图 2)。
预后因素分析结果
应用Log-Rank单因素分析方法对性别、年龄、病变部位、肿瘤分期及是否行辅助治疗这些可能对生存期产生影响的因素进行分析,结果提示病变部位(周围型比中心型,P=0.030)及肿瘤分期(Ⅰ、Ⅱ期比Ⅲ、Ⅳ期,P=0.000)可能是影响预后的因素;而性别(男比女,P=0.875)、年龄(>中位年龄比≤中位年龄,P=0.588)、是否行辅助治疗(P=0.363)未发现对生存期有明显影响。进一步将P<0.5的变量,包括病变部位、肿瘤分期及是否行辅助治疗带入Cox多因素模型分析,发现仅肿瘤分期对预后存在显著影响(P=0.000)(表 2)。
表 2 肺大细胞神经内分泌癌患者预后因素的Cox多因素分析结果因素 P值 HR值(95 CI) 病变部位(周围型与中央型) 0.242 0.602(0.257~1.410) 是否行辅助治疗 0.569 1.324(0.504~3.476) 肿瘤分期* 0.000 2.608(1.572~4.327) HR:相对危险度;*肿瘤分期按照连续变量带入Cox多因素分析模型,P=0.000提示差异存在统计学意义,HR为2.608提示分期每提高一期其死亡风险较前一期增加约1.6倍 讨论
2004年,新的WHO病理分型将肺部神经内分泌癌分为分化好的神经内分泌癌即典型类癌与不典型类癌,以及分化差的神经内分泌癌即小细胞神经内分泌癌以及大细胞神经内分泌癌[3]。随着组织学诊断技术尤其是免疫组织化学神经内分泌标志物的发展,越来越多的肺部神经内分泌肿瘤得到诊断并分型,也是近年来肺部神经内分泌肿瘤发病率不断增高的原因之一[8-9]。目前已经认识到典型类癌与不典型类癌预后相对较好,SCLC通常预后极差,而对于LCNEC则认识不足[10]。多数文献报道LCNEC较同期别NSCLC侵袭性更强、预后更差,5年生存率15%~60%[4, 11-13],已有学者将其列为与SCLC一样预后极差的肺部恶性肿瘤。
本组患者男性占82.8%,吸烟率高达80%,中位年龄63岁,与文献报道的男性患者80%~90%的比例,吸烟率大于85%,中位年龄62~68岁相近[14-18]。另外,与类癌、不典型类癌以及SCLC不同,LCNEC病变部位以周围型病变为主,本组占60%,与文献报道的2/3符合。由于LCNEC临床症状相对少见且缺乏特异性,因此影像学检查尤其胸部CT是发现病变的重要检查手段[12-13]。文献报道LCNEC周围型病变的CT表现为分叶状结节或肿块,边界尚清,与扩张性生长的周围型SCLC、低分化腺癌、鳞癌等类似[19-20]。图 1示本组1例周围型病变CT图像,表现为分叶生长的实性结节,可见毛刺及明显的胸膜牵拉征。
术前诊断LCNEC存在较大困难,有文献报道肿瘤标志物中癌胚抗原及胃泌素释放前肽有一定提示意义,但敏感性及特异性都不高[14];另外,即使应用免疫组织化学分子标记,术前活检获取小标本对LCNEC的诊断率也极低[4, 11, 21]。本组中12例活检无一确诊,术中冰冻病理也很难判断。由于免疫组织化学标记、细胞形态学、核分裂象等是神经内分泌肿瘤定性及分型的重要指标,因此LCNEC的诊断基本上均需在术后病理切片仔细判读的基础上才能明确。而在较小的穿刺标本上,神经内分泌肿瘤形态判别及免疫组织化学判读均存在很大困难[11, 22]。正因如此,对于怀疑LCNEC的患者手术指征应适当放宽,甚至在怀疑存在转移的情况下,有时也需考虑应用手术方式来获取足量的病变组织以明确诊断,术后才能更有针对性地进行辅助治疗。
对于可切除的LCNEC,文献报道其预后差异较大,5年生存率为15%~60%,即使为Ⅰ期患者,5年生存率差异也很大(18%~88%),可能原因是LCNEC为罕见病,多数文献都是小规模病例报告,而且以往对LCNEC认识有限、免疫组织化学手段缺乏,存在诊断不准确的可能性[4, 11]。本组患者中位生存期17个月(95% CI:11.4~22.6),5年生存率仅24.8%,其中Ⅰ期患者5年生存率为71.3%,Ⅰ、Ⅱ期患者5年生存率可达49.9%,提示对于早期LCNEC患者,手术为主的综合治疗可以达到较好的治疗效果。既往对LCNEC预后相关因素的研究显示,年龄、性别、进展期、手术方式等都不是相关的预后因素[16-17]。本研究尝试对性别、年龄、病变部位、肿瘤分期、是否行辅助治疗等因素进行分析,最终经多因素分析显示肿瘤分期是该病独立的预后因素,Cox回归模型HR=2.6,提示分期每提高一期其死亡风险较前一期增加1.6倍。另外还有研究对核分裂象、Ki-67指数、免疫组织化学指标等因素作预后分析[4, 23-24],但尚未得出明确结论。
目前有很多研究都提出LCNEC与SCLC临床特征十分相近,如均以男性患者为主、多数患者吸烟、组织病理学表现较为近似、恶性程度均很高且预后均很差等。Asamura等[14]于2006年报道一项大宗肺神经内分泌癌回顾性研究,共纳入141例患者,LCNEC与SCLC 5年生存率十分接近,分别为40%及36%;而另有多个研究也报道,LCNEC的5年生存率与SCLC相近甚至更差[25-28]。因此,有研究者认为SCLC的化疗方案可能也适用于LCNEC。已有较多研究表明采用SCLC的化疗方案即顺铂联合依托泊苷对于LCNEC的治疗效果优于采用NSCLC的化疗方案,顺铂联合依托泊苷已越来越多地用于治疗LCNEC,且鉴于LCNEC较高的恶性程度以及较高的复发率,建议早期患者也采用术后辅助治疗[11, 29-30]。由于以往对LCNEC的认识均来自单中心、小样本回顾性研究,缺乏相应的指南,本组患者中行化疗者其方案并不统一,多数是以铂类药物为基础联合另一药物治疗,包括依托泊苷、长春瑞滨、多西他赛等,因此本研究中辅助治疗对预后影响的判定可能存在偏倚,需要将来积累更多数据以得出准确结论。
综上,LCNEC为一种罕见的侵袭性强、预后差的恶性肿瘤,活检小标本诊断存在困难,诊断依赖术后病理。分期是影响预后的独立危险因素,对于早期病变尤其是Ⅰ、Ⅱ期病变采用手术为主的综合治疗可获得较好的治疗效果。辅助化疗方案可借鉴SCLC的方案即顺铂联合依托泊苷。由于疾病的罕见性,目前还缺乏基于临床试验的诊治指南,需要积累更多病例及多中心研究以进一步探讨。
作者贡献:何睿琳负责结果分析、论文初稿撰写;刘子妤、杨欣怡负责临床试验;李晨、李晓燕构思论文框架、审核并修订论文。利益冲突:所有作者均声明不存在利益冲突 -
[1] Xu CX, Qi XG, Liu LF, et al. Research on performance of complex networks based on principal component analysis[J]. JCUPT, 2019, 26: 40-48.
[2] Jaradat Y, Masoud M, Jannoud I, et al. A Tutorial on Singular Value Decomposition with Applications on Image Compression and Dimensionality Reduction[C]. 2021 International Conference on Information Technology (ICIT), 2021: 769-772.
[3] Omar HM, Morsli M, Yaichi S, et al. Image Compression using Principal Component Analysis[C]. 2020 2nd International Conference on Mathematics and Information Technology (ICMIT), 2020: 226-231.
[4] Lim ST, Yap DFW, Manap NA, et al. Medical image compression using block-based PCA algorithm[C]. 2014 International Conference on Computer, Communications, and Control Technology (I4CT), 2014: 171-175.
[5] Yeganegi F, Hassanzade V, Ahadi SM. Comparative Performance Evaluation of SVD-Based Image Compression[C]. Electrical Engineering (ICEE), 2018: 464-469.
[6] Guo P, Li D, Li X, et al. Deep OCT image compression with convolutional neural networks[J]. Biomed Opt Express, 2020, 11: 3543-3554. DOI: 10.1364/BOE.392882
[7] Liu F, Hernandez-Cabronero M, Sanchez V, et al. The Current Role of Image Compression Standards in Medical Imaging[J]. Information (Basel), 2017, 8: 131.
[8] Noreña T, Romero E. Compresión de imágenes médicas, et al. Medical image compression: a review[J]. Biomedica, 2013, 33: 137-151.
[9] Chen Y, Janowczyk A, Madabhushi A, et al. Quantitative Assessment of the Effects of Compression on Deep Learning in Digital Pathology Image Analysis[J]. JCO Clin Cancer Inform, 2020, 4: 221-233.
[10] Zhang X, Yu X. Color Image Reconstruction Based on Singular Value Decomposition of Quaternion Matrices[C]. 2018 2nd IEEE Advanced Information Management, Communicates, Electronic and Automation Control Conference (IMCEC), 2018: 2645-2647.
[11] Alkandari A, Aljaber SJ. Principle Component Analysis algorithm (PCA) for image recognition[C]. 2015 Second International Conference on Computing Technology and Information Management (ICCTIM), 2015: 76-80.
[12] Li SJ. Image compression based on SVD algorithm[C]. 2021 International Conference on Computer Information Science and Artificial Intelligence (CISAI), 2021: 306-309.
[13] Pearson K. On lines and planes of closest fit to systems of points in space[J]. Philosophical Magazine, 1901, 2: 559-572.
[14] 陈一虎. 基于SVD图像压缩技术研究[J]. 价值工程, 2011, 30: 169-170. https://www.cnki.com.cn/Article/CJFDTOTAL-JZGC201113120.htm