-
摘要:目的 基于深度学习算法构建宫颈原位腺癌(cervical adenocarcinoma in situ, CAIS)病理图像诊断模型。方法 回顾性收集2019年1月至2021年12月中国医科大学附属盛京医院病理科保存的CAIS患者病变组织、慢性宫颈炎患者正常宫颈管腺体病理切片。图像采集后,均按4∶3∶3的比例随机分为训练集、验证集和测试集。使用训练集、验证集数据对VGG16、VGG19、Inception V3、Xception、ResNet50和DenseNet201共6种网络模型进行迁移学习训练和参数调试,构建可识别CAIS病理图像的卷积神经网络二分类模型,并将模型进行组合,构建集成学习模型。基于测试集数据,采用运算时间、准确率、精确率、召回率、F1值、受试者操作特征曲线下面积(area under the curve,AUC)对模型识别CAIS病理图像的性能进行评价。结果 共入选符合纳入和排除标准的CAIS患者病理切片104张、慢性宫颈炎患者正常宫颈管腺体病理切片90张。共收集CAIS、正常宫颈管腺体病理图像各500张,其中训练集、验证集、测试集图像分别400张、300张、300张。6种模型中,ResNet50模型的准确率(87.33%)、精确率(90.00%)、F1值(86.90%)及AUC(0.87)均最高,召回率(84.00%)居第2位,运算时间较短(2062.04 s),整体性能最佳,VGG19模型次之,Inception V3与Xception模型的性能最差。6种集成学习模型中,ResNet50与DenseNet201集成模型的整体性能最优,其准确率、精确率、召回率、F1值、AUC分别为89.67%、84.67%、94.07%、89.12%、0.90,VGG19与ResNet50集成模型次之。结论 通过深度学习算法构建CAIS病理图像识别模型具有可行性,其中ResNet50模型的整体性能较高。集成学习可提高单一模型对病理图像的识别效果。Abstract:Objective To construct a pathological image diagnostic model of cervical adenocarcinoma in situ(CAIS) based on deep learning algorithm.Methods Pathological tissue sections of CAIS and normal cervical canal and gland sections of chronic cervicitis stored in the Pathology Department of Shengjing Hospital, China Medical University from January 2019 to December 2021 were retrospectively collected. After image collection, they were randomly divided into training set, validation set and test set with a ratio of 4∶3∶3. The data of training set and validation set were used to conduct transfer learning training and parameter debugging for 6 network models, including VGG16, VGG19, Inception V3, Xception, ResNet50 and DenseNet201, and the convolutional neural network binary classification model that could recognize pathological images of CAIS was constructed. The models were combined to build the ensemble learning model. Based on the test set data, the performance of pathological image recognition of single model and ensemble learning model was evaluated. The results were expressed by operation time, accuracy, precision, recall, F1 score and area under the curve(AUC) of receiver operating characteristic.Results A total of 104 pathological sections of CAIS and 90 pathological sections of normal cervical duct and gland with chronic cervicitis were selected. A total of 500 pathological images of CAIS and normal cervical duct glands were collected, including 400 images of training set, 300 images of validation set and 300 images of test set, respectively. Among the 6 models, ResNet50 model, with the highest accuracy(87.33%), precision(90.00%), F1 score(86.90%) and AUC(0.87), second highest recall(84.00%) and shorter operation time(2062.04 s), demonstrated the best overall performance; VGG19 model was the second; and Inception V3 and Xception model had the worst performance.Among the 6 kinds of ensemble learning models, ResNet50 and DenseNet201 showed the best overall performance, and their accuracy, precision, recall, F1 score and AUC were 89.67%, 84.67%, 94.07%, 89.12% and 0.90, respectively. VGG19 and ResNet50 ensemble model followed.Conclusions It is feasible to construct CAIS pathological image recognition models by deep learning algorithm, among which ResNet50 models has higher overall performance. Ensemble learning can improve the recognition effect on pathological images by single model.
-
结直肠癌是指发生于结肠和直肠部位的恶性肿瘤。根据2020年全球癌症报告数据,中国结直肠癌新发病例555 477例、死亡病例286 162例;该病的发病率和死亡率分别位居中国主要癌症的第3位和第5位[1],具有较重的疾病负担。基于人群的研究表明,筛查联合早诊早治的干预策略是降低结直肠癌发病率和死亡率,提升患者生存率的有效手段[2-3]。国际及国内指南推荐45岁或50岁以上一般人群接受结直肠癌筛查,常见的筛查方法包括结肠镜、免疫法粪便潜血检测(fecal immunochemical test,FIT)、多靶点粪便FIT-DNA等[4-6]。结肠镜是结直肠癌筛查的金标准,内镜医师通过可视化探头完成结直肠检视,如有可疑病变,可取组织活检进行病理确诊[7]。由于结肠镜检查需肠道准备且具有侵入性,大规模人群筛查的依从性不高;此外,结肠镜检查需要专业的内镜医师,在大规模人群筛查中面临经验丰富的内镜医师短缺这一关键问题。FIT是目前应用最为广泛的结直肠癌非侵入性筛查手段,相较于传统化学法粪便潜血检测,该方法具有灵敏度高、特异性强的优点。其主要技术原理为通过检测粪便中的特异性人血红蛋白进而提示粪便潜血,受检者无需饮食和药物限制[8]。FIT阳性者需接受诊断性结肠镜检查以进一步明确诊断。此外,既往研究基于结直肠癌危险因素已成功构建了结直肠癌风险预测模型,以辅助结直肠癌高危人群识别及结直肠癌分级筛查[9],但其有效性仍需验证。
中国人口基数大且医疗资源分布不均衡,探索适合中国本土的结直肠癌人群筛查策略势在必行。随机对照试验(randomized controlled trial,RCT)可为不同筛查策略在人群中的应用效果评价及效益分析提供高级别循证医学证据,但目前中国人群结直肠癌筛查相关RCT研究仍十分缺乏。本研究基于我国首个结直肠癌筛查RCT研究,分析了结肠镜、FIT及基于风险评估的分级筛查3种方案在中国人群中应用的可行性和有效性,以期为未来制订大规模结直肠癌人群筛查策略提供理论参考。
1. 对象与方法
1.1 研究对象与分组
1.1.1 研究对象
本研究为一项全国多中心人群结直肠癌筛查RCT研究[TARGET-C研究,中国临床试验平台(http://www.chictr.org.cn)注册号:ChiCTR1800015506]。详细的研究方案见文献[10]。TARGET-C研究于2018年5月启动,共在6个研究中心(浙江省台州市、浙江省兰溪市、安徽省合肥市、江苏省徐州市、湖南省长沙市、云南省昆明市)实施。研究人员按照统一的纳入与排除标准在社区/村招募受试者。纳入标准:(1)为研究地区户籍常住人口或在该地区居住≥3年;(2) 入组时年龄50~74岁;(3)对研究内容知情并签署知情同意书。排除标准:(1)有结直肠癌病史;(2)既往有结肠切除手术史;(3)入组前已诊断为癌症或正在接受任何癌症相关治疗;(4)近5年内接受过结肠镜检查、纤维乙状结肠镜、CT仿真结肠镜等检查;(5)近1年内接受FIT或FIT-DNA检查者;(6)有症状的下消化道疾病或症状提示需进行诊断性结肠镜确诊者;(7)伴随不适合行结直肠癌筛查的严重疾病者。
1.1.2 研究分组
TARGET-C研究计划对结肠镜组开展单次筛查,FIT组和分级筛查组开展共4轮次年度筛查,针对入组受试者开展长期随访。本研究拟将符合研究条件的受试者,按照1∶2∶2的比例随机分配至3个干预组:(1)结肠镜组:受试者在基线筛查时接受单次结肠镜检查;(2) FIT组:受试者在基线筛查时接受FIT检测,FIT阳性者接受结肠镜检查。在随后每年1次的年度随访中,对符合要求的受试者继续进行FIT检测;(3)分级筛查组:受试者在基线筛查时接受结直肠癌风险评估,评估为高风险者接受结肠镜检查,评估为低风险者接受FIT检测(FIT阳性者接受结肠镜检查)。在随后每年1次的年度随访中,对符合要求的受试者继续提供与基线筛查方案一致的筛查。本项目实施期间所有的筛查检测项目均免费。
本研究已通过国家癌症中心中国医学科学院肿瘤医院伦理委员会审查(审批号:18-013/1615),所有受试者均已签署知情同意书。
1.2 研究方法
1.2.1 随机化及盲法
利用统计分析R 3.5.1软件在预先确定的随机数种子下生成随机分配方案,并将其导入项目信息管理平台(参与制定随机化分配方案的研究人员不参与现场受试者招募工作)。各研究中心工作人员在完成受试者招募后,将受试者信息录入项目信息管理平台并进行资格审查。审核通过后,项目信息管理平台将系统分配的分组信息反馈至现场工作人员和受试者。本研究采用单盲设计,即受试者、负责受试者招募和管理的工作人员知晓研究分组信息并安排相应的筛查干预手段,为受试者提供临床检查的医生不知晓受试者分组情况。
1.2.2 结肠镜检查
现场工作人员电话联系所有需要接受结肠镜检查的受试者并为其预约检查。所有结肠镜检查均在项目组指定的医疗机构按照规范化操作流程开展。采用标准化表格收集结肠镜(包括病理学诊断)检查结果,并由工作人员核对后录入项目信息管理平台。
1.2.3 FIT
采用自测型定量化试剂盒(杭州诺辉健康科技有限公司)进行FIT[11]。工作人员主动联系受检者并发放FIT试剂盒,对其详细讲解FIT操作流程后由受试者按照操作说明书自主完成检测。检测结果(阳性、阴性、无效)由受试者主动上报至项目组开发的智能手机App或由工作人员主动追踪随访获得。FIT无效者需再次检测。对于FIT阳性者,本项目将提供免费的结肠镜检查。对于FIT组和分级筛查组(低风险者)受试者,如FIT阳性且完成了结肠镜检查,则将不被纳入下一轮次筛查,其他受试者(FIT阴性、FIT阳性但未完成结肠镜检查者)则按照研究方案要求接受后续的FIT筛查。
1.2.4 风险分级筛查方案
采用亚太结直肠癌风险评分(Asia-Pacific color-ectal screening,APCS)系统进行结直肠癌风险评估[12]。该评分系统基于年龄、性别、一级亲属结直肠癌家族史、吸烟史和体质量指数赋予不同的权重,然后相加得到最终评分。根据既往研究结果[12],本研究定义APCS总分≥4为结直肠癌高风险,否则为结直肠癌低风险。高风险人群需接受结肠镜检查;低风险者需接受FIT,如FIT阳性,则接受进一步结肠镜检查。结肠镜和FIT检查流程与上述描述一致。本研究分别在基线和第2次随访筛查时对受试者进行风险评估,根据评估结果及结肠镜检查状态推荐其进行相应筛查。
1.2.5 信息收集
所有受试者在招募时由工作人员进行流行病学问卷调查,收集个人基本信息、生活方式、肠道疾病检查史、癌症家族史等信息。所有临床检查信息(结肠镜、病理检查等)均通过标准化问卷收集,数据经核对后由工作人员录入项目信息管理平台。
1.2.6 研究结局及定义
患者的最终诊断结果以结肠镜检查和病理报告为准。本研究主要结局指标为进展期肿瘤,包括结直肠癌和进展期腺瘤;次要结局指标为任意结直肠肿瘤,包括结直肠癌、进展期腺瘤和非进展期腺瘤。其中进展期腺瘤定义为具有以下任意一种特征的腺瘤:(1)直径≥1 cm;(2)绒毛状腺瘤或管状绒毛状腺瘤;(3)高级别上皮内瘤变;(4)锯齿状腺瘤直径≥1 cm或伴异型增生。未具有进展期腺瘤特征的结直肠腺瘤定义为非进展期腺瘤。根据结直肠肿瘤解剖学部位,本研究将位于结肠脾曲、降结肠、乙状结肠的肿瘤定义为远端结肠肿瘤,将位于横结肠、结肠肝曲、升结肠和回盲部的肿瘤定义为近端结肠肿瘤。
1.3 数据质量控制
为保证不同研究中心病理诊断结果的一致性,本研究所有结直肠癌、进展期腺瘤和非进展期腺瘤病理切片均由同一名病理科医师进行结果复核。对于诊断不一致的病例,由项目专家组讨论确定最终诊断。所有数据均经过逻辑校验和复核。
1.4 样本量估算
本研究以主要结局指标(进展期肿瘤检出率)为参数进行样本量估算,并假设分级筛查组进展期肿瘤检出率不低于结肠镜组且高于FIT组。基于此假设和既往研究数据,预期结肠镜组、FIT组和分级筛查组进展期肿瘤检出率分别约为6.5%、1.8%和5.0%[13-15],人群参与率分别为50%~70%、60%~90%和60%~90%,总体失访率为10%。在检验水准α为0.05,把握度1-β为80%,进展期肿瘤检出率非劣效性/优效性阈值为0.5%的情况下,按1∶2∶2研究设计,结肠镜组、FIT组和分级筛查组所需最低样本量分别为3417名、6834名和6834名。
1.5 统计学处理
采用R 4.1.3软件建立数据库并进行统计学分析。年龄、性别、教育背景等计数资料以频数(百分数)表示,组间比较采用卡方检验。采用亚组分析法计算不同年龄/性别人群中3种筛查方案的人群参与率(实际按照筛查方案完成筛查的受试者数目/各方案组招募需进行筛查的受试者总数)、结肠镜检查顺应率(FIT阳性且接受结肠镜检查的受试者数目/FIT阳性受试者总数)。采用意向性分析比较3种筛查方案的进展期肿瘤检出率(检出目标病变的受试者数目/各方案组招募受试者总数)、结肠镜检查负荷(每检出1例进展期肿瘤或任意结直肠肿瘤所需要的结肠镜检查次数)。采用多因素Logistic回归模型比较不同筛查方案进展期肿瘤检出率差异,结果以比值比(odd ratio, OR)及其95%置信区间(confidence interval, CI)表示。本文采用的统计学检验均为双侧检验,以P<0.05为差异具有统计学意义。
2. 结果
2.1 一般资料
本项目自2018年5月开始首例受试者招募和入组,2019年5月完成了基线筛查(T0),并于2019年6月至2020年5月完成了第1次随访筛查(T1),2020年6月至2021年5月完成了第2次随访筛查(T2)。共招募19 582名符合纳入标准的受试者。其中结肠镜组、FIT组、分级筛查组分别3937名、7858名和7787名。经进一步资格审查后,分别有54名、65名和90名被排除。最终纳入本研究的受试者共19 373名,其中结肠镜组3883名、FIT组7793名、分级筛查组7697名(图 1)。3组基线资料见表 1。
表 1 19 373名受试者基线资料比较[n(%)]指标 结肠镜组(n=3883) FIT组(n=7793) 分级筛查组(n=7697) P值 性别0.172 0.172 男性 1617(41.6) 3310(42.5) 3155(41.0) 女性 2266(58.4) 4483(57.5) 4542(59.0) 年龄(岁) 0.545 50~54 906(23.3) 1825(23.4) 1836(23.9) 55~59 830(21.4) 1603(20.6) 1574(20.4) 60~64 992(25.5) 1924(24.7) 1886(24.5) 65~69 807(20.8) 1729(22.2) 1658(21.5) 70~74 348(9.0) 712(9.1) 743(9.7) 教育背景* 0.614 初中及以下 2701(73.4) 5605(72.2) 5595(72.9) 高中 696(18.9) 1542(19.9) 1495(19.5) 大学及以上 281(7.6) 621(8.0) 582(7.6) 体质量指数(kg/m2)* 0.614 <23 1395(37.9) 2872(37.0) 2860(37.3) ≥23 2283(62.1) 4896(63.0) 4812(62.7) 吸烟* 0.646 非吸烟 2978(81.0) 6269(80.7) 6154(80.2) 戒烟 572(15.6) 1217(15.7) 1212(15.8) 吸烟 128(3.5) 282(3.6) 306(4.0) 饮酒* 0.168 从不 2659(72.3) 5722(73.7) 5649(73.6) 偶尔 491(13.3) 1047(13.5) 983(12.8) 规律 528(14.4) 999(12.9) 1040(13.6) 一级亲属结直肠癌家族史* <0.001 是 160(4.4) 335(4.3) 473(6.2) 否 3427(93.2) 7277(93.7) 7038(91.7) 不清楚 91(2.5) 156(2.0) 161(2.1) FIT:同图 1;*结肠镜组、FIT组和分级筛查组中分别有205名、25名、25名受试者信息缺失 2.2 3种筛查方案的人群参与率
基线筛查中,结肠镜组共1644名按照方案完成了结肠镜检查,人群参与率为42.3%(1644/3883)。FIT组共7327名按照方案完成了FIT检查,人群参与率为94.0%(7327/7793)。分级筛查组25名未完成风险评估,余7672名中1453名被评估为高风险者需接受结肠镜检查,其中712名完成了该检查,结肠镜筛查人群参与率为49.0%(712/1453);6219名评估为低风险者需接受FIT,其中5845名按照方案完成了该检查,人群参与率为94.0%(5845/6219),经计算分级筛查组基线筛查总体人群参与率为85.2%(6557/7697)。FIT组和分级筛查组进行了2次随访筛查。在第1次随访筛查中,FIT组和分级筛查组人群参与率分别为86.8%(6048/6968)和77.3%(4913/6352)。在第2次随访筛查中,FIT组和分级筛查组人群参与率分别为91.3%(6113/6693)和75.4%(4623/6131)。总体而言,经过3次筛查,结肠镜组、FIT组和分级筛查组整体人群参与率(遵从研究方案至少完成一轮次筛查的受试者/筛查组总人数)分别为42.3%(1644/3883)、99.3%(7740/7793)和89.2%(6865/7697)(P<0.05)。见图 2。
图 2 3组筛查方案的人群参与率FIT:同图 12.3 FIT组和分级筛查组FIT阳性率及结肠镜检查顺应性
如表 2,基线筛查、第1次随访筛查和第2次随访筛查中,FIT组受检者FIT阳性率分别为13.7%、5.6%和5.5%;FIT阳性人群3次筛查的结肠镜检查顺应率分别为76.3%、75.7%和71.7%。分级筛查组中,低风险人群3次筛查的FIT阳性率分别为10.2%、3.8%和2.7%,其中FIT阳性者结肠镜检查顺应率分别为76.9%、74.6%和60.1%;3次筛查的高风险人群比率分别为18.9%(1453/7697)、11.6%(737/6352)和14.9%(915/6131),高风险人群结肠镜检查顺应率分别为49.0%(712/1453)、6.4%(47/737)和10.5%(96/915)。
表 2 3次筛查中FIT组与分级筛查组FIT阳性率以及结肠镜检查顺应率比较筛查方案 基线筛查 第1次随访筛查 第2次随访筛查 FIT阳性率
[%,(N阳性/N受检)]结肠镜检查顺应率
[%,(N接受/N阳性)]FIT阳性率
[%,(N阳性/N受检)]结肠镜检查顺应率
[%,(N接受/N阳性)]FIT阳性率
[%,(N阳性/N受检)]结肠镜检查顺应率
[%,(N接受/N阳性)]FIT组 13.7(1071/7793) 76.3(817/1071) 5.6(341/6048) 75.7(258/341) 5.5(339/6113) 71.7(243/339) 分级筛查组(低风险人群) 10.2(782/7697) 76.9(601/782) 3.8(244/6352) 74.6(182/244) 2.7(163/6131) 60.1(98/163) FIT: 同图 1 2.4 3种筛查方案进展期肿瘤检出率
意向性分析结果显示,单次结肠镜检查对进展期肿瘤的检出率为2.76%;FIT组基线筛查、第1次及第2次随访筛查对进展期肿瘤的累积检出率分别为1.15%、1.67%和2.17%;分级筛查组基线筛查、第1次及第2次随访筛查对进展期肿瘤的累积检出率分别为1.65%、1.91%和2.35%。经过3次筛查,结肠镜组进展期腺瘤检出率高于FIT组(OR结肠镜组比FIT组=1.30,95% CI:1.01~1.65,P=0.037),结肠镜组与分级筛查组进展期肿瘤检出率无统计学差异(OR结肠镜组比分级筛查组=1.19, 95% CI:0.93~1.51,P=0.156);分级筛查组与FIT组进展期肿瘤检出率亦无统计学差异(OR分级筛查组比FIT组=1.09,95% CI:0.88~ 1.34,P=0.440)。3种筛查方案中,远端结肠/直肠的进展期肿瘤检出率均高于近端结肠(P<0.05),见表 3。
表 3 结肠镜组、FIT组和分级筛查组3次筛查中进展期肿瘤检出率比较筛查阶段 进展期肿瘤(%,95% CI) 结肠镜组比FIT组 结肠镜组 FIT组 分级筛查组 OR(95% CI)† P值 基线筛查 总体 2.76(2.29~3.32) 1.15(0.94~1.42) 1.65(1.39~1.96) 2.45(1.84~3.26) <0.001 近端结肠* 1.36(1.05~1.78) 0.53(0.39~0.71) 0.62(0.47~0.83) 2.62(1.74~3.97) <0.001 远端结肠和直肠# 1.73(1.36~2.19) 0.80(0.62~1.02) 1.17(0.95~1.43) 2.19(1.54~3.12) <0.001 基线筛查+第1次随访筛查 总体 2.76(2.29~3.32) 1.67(1.41~1.98) 1.91(1.63~2.24) 1.68(1.29~2.18) <0.001 近端结肠* 1.36(1.05~1.78) 0.72(0.55~0.93) 0.73(0.56~0.94) 1.91(1.30~2.79) 0.001 远端结肠和直肠# 1.73(1.36~2.19) 1.15(0.94~1.42) 1.35(1.12~1.63) 1.50(1.08~2.06) 0.014 基线筛查+第1次随访筛查+第2次随访筛查 总体 2.76(2.29~3.32) 2.17(1.87~2.52) 2.35(2.04~2.71) 1.30(1.01~1.65) 0.037 近端结肠* 1.36(1.05~1.78) 0.96(0.77~1.20) 0.90(0.71~1.13) 1.46(1.03~2.05) 0.031 远端结肠和直肠# 1.73(1.36~2.19) 1.48(1.23~1.77) 1.65(1.39~1.96) 1.19(0.88~1.61) 0.244 筛查阶段 结肠镜组比分级筛查组 分级筛查组比FIT组 OR(95% CI)† P值 OR(95% CI)† P值 基线筛查 总体 1.69(1.29~2.20) <0.001 1.45(1.11~1.92) 0.008 近端结肠* 2.21(1.49~3.28) <0.001 1.19(0.79~1.82) 0.409 远端结肠和直肠# 1.46(1.06~2.02) 0.021 1.49(1.08~2.08) 0.017 基线筛查+第1次随访筛查 总体 1.45(1.12~1.87) 0.004 1.15(0.91~1.47) 0.245 近端结肠* 1.89(1.29~2.76) 0.001 1.01(0.70~1.47) 0.941 远端结肠和直肠# 1.26(0.92~1.72) 0.148 1.18(0.88~1.57) 0.266 基线筛查+第1次随访筛查+第2次随访筛查 总体 1.19(0.93~1.51) 0.156 1.09(0.88~1.34) 0.440 近端结肠* 1.56(1.10~2.20) 0.012 0.94(0.68~1.29) 0.681 远端结肠和直肠# 1.06(0.79~1.42) 0.680 1.12(0.87~1.44) 0.384 FIT:同图 1;*包括病变检出部位仅为近端结肠或近端与远端结肠/直肠同时存在的病例;#包括病变检出部位仅为远端结肠/直肠或近端与远端结肠/直肠同时存在的病例;†Logistics回归分析校正年龄、性别和研究中心后,各筛查方案对进展期肿瘤检出风险的OR值和95% CI 2.5 结肠镜检查负荷
意向性分析显示,结肠镜组检出进展期肿瘤、任意结直肠肿瘤的结肠镜检查负荷分别为15.4次、4.1次。FIT组在基线筛查、第1次及第2次随访筛查阶段检出进展期肿瘤的结肠镜检查负荷分别为9.1次、8.3次和7.8次;检出任意结直肠肿瘤的结肠镜检查负荷分别为3.2次、3.1次和3.0次。分级筛查方案组在基线筛查、第1次及第2次随访筛查阶段检出进展期肿瘤的结肠镜检查负荷分别为10.3次、10.5次和10.2次;检出任意结直肠肿瘤的结肠镜检查负荷分别为3.5次、3.4次和3.5次。3种筛查方案组在女性人群中检出病变的结肠镜检查负荷均高于男性(P均<0.05),见表 4。
表 4 结肠镜组、FIT组和分级筛查组3次筛查中结肠镜检查负荷比较筛查阶段 进展期肿瘤(n, 95% CI) 任意结直肠肿瘤(n, 95% CI) 结肠镜组 FIT组 分级筛查组 结肠镜组 FIT组 分级筛查组 基线筛查 总体 15.4(12.8~18.5) 9.1(7.5~11.1) 10.3(8.8~12.2) 4.1(3.8~4.5) 3.2(2.9~3.5) 3.5(3.2~3.8) 男性 10.7(8.5~13.5) 6.5(5.2~8.3) 8.0(6.7~9.5) 3.0(2.7~3.4) 2.5(2.2~2.8) 2.8(2.6~3.1) 女性 22.9(17.0~30.9) 14.7(10.4~21.1) 22.4(14.9~34.0) 5.6(4.9~6.4) 4.5(3.8~5.4) 5.9(4.9~7.3) 基线筛查+第1次随访筛查 总体 15.4(12.8~18.5) 8.3(7.1~9.7) 10.5(9.0~12.2) 4.1(3.8~4.5) 3.1(2.9~3.4) 3.4(3.2~3.7) 男性 10.7(8.5~13.5) 6.2(5.1~7.5) 8.2(6.9~9.8) 3.0(2.7~3.4) 2.5(2.3~2.8) 2.9(2.6~3.1) 女性 22.9(17.0~30.9) 12.5(9.4~16.7) 18.6(13.4~26.1) 5.6(4.9~6.4) 4.2(3.6~4.9) 5.1(4.3~6.0) 基线筛查+第1次随访筛查+第2次随访筛查 总体 15.4(12.8~18.5) 7.8(6.8~9.0) 10.2(8.9~11.8) 4.1(3.8~4.5) 3.0(2.8~3.3) 3.5(3.2~3.7) 男性 10.7(8.5~13.5) 5.9(5.0~7.0) 8.3(7.1~9.8) 3.0(2.7~3.4) 2.5(2.3~2.7) 2.9(2.7~3.1) 女性 22.9(17.0~30.9) 11.4(8.9~14.5) 15.3(11.8~20.1) 5.6(4.9~6.4) 3.9(3.5~4.5) 4.9(4.3~5.6) FIT: 同图 1 3. 讨论
本研究为我国首个大型多中心结直肠癌筛查RCT研究,通过开展多中心人群为基础的结直肠癌筛查,平行比较了3种不同方案在人群结直肠癌筛查的可行性和有效性,为探索适合我国人群结直肠癌筛查的策略提供了高级别循证医学证据。本研究除纳入单次结肠镜筛查和每年1次的FIT筛查策略外,亦对基于风险评估的分级筛查策略进行了评价,在国内外当属首次。本研究结果提示,经过3次筛查,分级筛查组受试者整体人群参与率显著高于结肠镜组(89.2%比42.3%),而与FIT组整体人群参与率差别不大(89.2% 比99.3%);意向性分析结果表明,分级筛查组可达到与结肠镜组(OR结肠镜组比分级筛查组=1.19,95% CI:0.93~1.51,P=0.156)、FIT组(OR分级筛查组比FIT组=1.09,95% CI:0.88~1.34,P=0.440) 相近的进展期肿瘤检出率。关于检出进展期肿瘤的结肠镜检查负荷,结肠镜组最高(15.4次),分级筛查组居中(10.2次),FIT组最低(7.8次)。综上可知,基于风险评估的分级筛查策略在人群结直肠癌筛查中具有较好的可行性以及较高的筛检效能,能显著降低人群筛查时的内镜资源负荷,对医疗卫生资源紧张的地区具有积极意义。
人群参与率是影响筛查效果的最重要指标之一。结肠镜作为结直肠癌筛查的金标准,由于其具有侵入性且需肠道准备,以致受试者接受度不高、筛查参与率较低。一项基于中国城市人群癌症筛查项目的多中心研究纳入2012—2015年从中国16个省份招募的1 381 561名受试者。经风险评估后182 927名被认为结直肠癌高风险并推荐行结肠镜检查,随访筛查显示25 593名受试者按建议进行了结肠镜检查,参与率仅为14.0%[13]。一项在欧洲地区4个国家开展的结直肠癌筛查研究显示,结肠镜筛查人群参与率为22.9%~60.7%[16]。本研究结肠镜组结肠镜筛查人群参与率为42.3%,虽较全国平均数据增高,但整体来看仍处于较低水平,有很大的提升空间。作为非侵入性筛查技术,FIT具有较好的初筛依从性。本研究FIT组基线筛查人群参与率达94.0%;分级筛查组低风险者FIT基线筛查人群参与率显著较高风险者结肠镜筛查人群参与率增高(94.0%比49.0%);FIT组和分级筛查组在第1、2次随访筛查中均保持较高的人群参与率,提示FIT作为初筛不仅可有效提升人群基线筛查的参与率,对于保障随访筛查的参与率也有积极作用。此外,对于FIT阳性者,FIT组结肠镜检查的顺应性有较大提升(>70%),提示在大规模人群筛查时应充分利用高效易行的非侵入性筛查技术作为初筛手段以识别结直肠癌高风险人群,此种策略可显著提高人群筛查参与率以及高危人群的结肠镜检查顺应率。
按照风险等级实现分级筛查的策略是本研究亮点之一。传统筛查策略多采取“一刀切”的策略,即受检者均接受一致的筛查技术和方案,但由于人群患癌的风险度不同,此种筛查模式不仅造成了医疗资源的额外消耗,且影响筛查效率。根据人群风险分级推荐适宜的筛查技术可提高筛查效率和效果。本研究基于结直肠癌风险评估结果,并结合结肠镜和FIT特点,制定了一种新型风险分级筛查策略,即高风险人群被推荐接受结肠镜检查;低风险人群接受非侵入性FIT筛查作为初筛,对于FIT阳性者进一步进行诊断性结肠镜检查。此种分级筛查策略在既往横断面研究结果中已被证实对进展期结直肠癌具有较好的筛检效果[12]。目前的指南推荐FIT应以每年1次的频率进行连续筛查,以最大化提高筛查效果[4-6],但既往国内相关报道多为单次筛查[17-19]。本研究团队既往已针对不同筛查方案对结直肠癌的单次筛查效果进行了分析,发现单一轮次的FIT筛查和分级筛查对于进展期肿瘤的检出率显著低于结肠镜组[20]。本研究结果亦发现,单次结肠镜检查对进展期肿瘤的检出率为2.76%,而单次FIT及分级筛查的检出率分别仅为1.15%、1.65%;经2次随访筛查,FIT组和分级筛查组进展期肿瘤检出率均有了明显提升,尤其分级筛查组可达到与金标准结肠镜检查无统计学差异的进展期肿瘤检出率(OR结肠镜组比分级筛查组=1.19, 95% CI:0.93~1.51,P=0.156),一方面提示在结直肠癌筛查项目中,应对受检者进行重复筛查以最大化提高结直肠癌和癌前病变的检出率,降低漏诊率;另一方面证实此种分级筛查策略应用于大规模人群筛查具有可行性和有效性,可作为目前我国结直肠癌筛查策略的有效手段之一。
高效精准的风险预测模型是分级筛查策略的核心。本研究所采取的APCS评分包含年龄、性别、BMI、吸烟史及一级亲属结直肠癌家族史5个参数,可从个体基础特征、生活方式和家族史等方面进行风险评估,高风险人群具有较高的结直肠癌和癌前病变检出率,可作为结直肠癌筛查优先人群。但该风险评分未包含结直肠癌相关生物学标志物,其对结直肠癌风险预测的效能仍有较大提升空间。目前有研究者在临床资料的基础上结合遗传信息研发了结直肠癌相关遗传变异的多基因风险评分(polygenic risk score),与传统模型相比,可进一步提高对结直肠癌的预测能力[21-23]。未来的研究中,有望将非侵入性筛检技术与精准的风险预测模型相结合,以进一步提升分级筛查策略的人群筛检效果。
本研究局限性:(1)受限于整体的随访时间,本研究无法对3种筛查方案人群的结直肠癌死亡率进行评估,但队列人群的长期随访仍在开展,后续有望对不同筛查方案在降低结直肠癌死亡率中的作用进行比较。(2)FIT阳性者接受诊断性结肠镜检查的顺应性仍不理想。不依从者主要为合并其他疾病的老年人,间接说明在大规模老年人群中开展结肠镜检查的可行性不高。(3)研究未对分级筛查组中拒绝结肠镜检查的高风险人群提供其他替代的筛查方式,可能潜在影响筛查参与率。
综上所述,本研究基于一项全国多中心大样本RCT研究证实,相较于传统结肠镜和FIT筛查策略,新型基于风险评估的分级筛查策略对于人群结直肠癌的筛查是可行且有效的,尤其对医疗资源较匮乏的偏远地区,分级筛查是一项具有人群推广应用价值的结直肠癌筛查策略。
【方法学点评】
中国医学科学院北京协和医院医学科学研究中心代敏教授
随机对照试验可最大程度避免临床试验设计、实施过程中可能出现的各种偏倚,具有平衡混杂因素、提高统计学检验效能等诸多优点,被认为是评价干预措施有效性的金标准。此项随机对照试验目的是评价不同筛查方案对人群结直肠癌的筛查效果,主要评价指标为人群参与率和进展期肿瘤检出率。此项研究在中国5个省份6家研究中心开展,样本量较大且人群具有代表性。经过随机化分组,3种筛查方案的受试者基本人口学特征分布无统计学差异,能够初步平衡混杂因素、减少研究结果偏倚。在实施阶段,研究团队严格按照既定的研究方案开展并采取了若干质控措施(数据质控、结局事件质控等),保证了结果的真实性和可靠性。在数据分析策略方面,作者团队从人群参与率、病变检出率、结肠镜检查的资源负荷等多角度全面揭示了不同筛查方案在人群应用的可行性和有效性。对于主要的研究结局事件(进展期肿瘤检出率)评价方面,主要采用了意向性分析法,对于人群筛查项目来说,除对筛检技术的灵敏度、特异度等诊断指标进行评价外,人群对于筛检技术的接受度也是重要的衡量指标,采用意向性分析法可很好地评价不同筛查方案在真实人群中应用时病变检出情况。总体来讲,此项研究为一项高质量随机对照试验,研究结果展示了不同筛查方案在中国人群应用的可行性和有效性,可为制订我国结直肠癌筛查策略提供高级别循证医学证据。
作者贡献:刘畅负责研究设计、临床病理数据收集、病理诊断判读与论文撰写;郑宇超负责研究设计、模型构建与数据分析;谢文倩负责临床病理数据收集与图像采集;李晨、李晓晗负责指导研究设计与论文审校。利益冲突:所有作者均声明不存在利益冲突 -
图 6 集成学习模型对测试集图像识别效果的混淆矩阵
CAIS、normal:同图 4
表 1 6种模型对测试集图像识别效果的评价指标
模型 运算时间(s) 准确率(%) 精确率(%) 召回率(%) F1值(%) AUC VGG16 2071.33 80.33 86.40 72.00 78.55 0.80 VGG19 2147.58 84.67 84.67 84.67 84.67 0.85 Inception V3 2115.85 64.67 61.83 76.67 68.45 0.65 ResNet50 2062.04 87.33 90.00 84.00 86.90 0.87 Xception 2061.44 65.00 73.68 46.67 57.14 0.65 DenseNet201 2124.49 80.33 80.13 80.67 80.40 0.80 AUC:曲线下面积 表 2 6种集成学习模型对测试集图像识别效果的评价指标
集成学习模型 准确率(%) 精确率(%) 召回率(%) F1值(%) AUC VGG16+VGG19 83.67 77.33 88.55 82.56 0.84 VGG16+ResNet50 86.00 79.33 91.54 85.00 0.86 VGG16+DenseNet201 86.33 82.00 89.78 85.71 0.86 VGG19+ResNet50 88.33 87.33 89.12 88.22 0.88 VGG19+DenseNet201 87.33 86.00 88.36 87.16 0.87 ResNet50+DenseNet201 89.67 84.67 94.07 89.12 0.90 AUC: 同表 1 -
[1] Cao W, Chen HD, Yu YW, et al. Changing profiles of cancer burden worldwide and in China: a secondary analysis of the global cancer statistics 2020[J]. Chin Med J, 2021, 134: 783-791. DOI: 10.1097/CM9.0000000000001474
[2] Baalbergen A, Helmerhorst TJ. Adenocarcinoma in situ of the uterine cervix: a systematic review[J]. Int J Gynecol Cancer, 2014, 24: 1543-1548. DOI: 10.1097/IGC.0000000000000260
[3] Cleveland AA, Gargano JW, Park IU, et al. Cervical adenocarcinoma in situ: human papillomavirus types and incidence trends in five states, 2008—2015[J]. Int J Cancer, 2020, 146: 810-818. DOI: 10.1002/ijc.32340
[4] 刘从容. 宫颈腺上皮病变病理学相关问题及其研究进展[J]. 中华妇幼临床医学杂志, 2016, 12: 2-6. DOI: 10.3877/cma.j.issn.1673-5250.2016.01.001 Liu CR. Pathologic problems and research progress of cervical adenoepithelial lesions[J]. Zhonghua Fuyou Linchuang Yixue Zazhi, 2016, 12: 2-6. DOI: 10.3877/cma.j.issn.1673-5250.2016.01.001
[5] Liu J, Li L, Wang L. Acetowhite region segmentation in uterine cervix images using a registered ratio image[J]. Comput Biol Med, 2018, 93: 47-55. DOI: 10.1016/j.compbiomed.2017.12.009
[6] Xin TL, Chen L, Md Mamunur R, et al. A comprehensive review of computer-aided whole-slide image analysis: from datasets to feature extraction, segmentation, classification and detection approaches[J]. Artifi Intell Rev, 2022, 55: 4809-4878. DOI: 10.1007/s10462-021-10121-0
[7] Song D, Kim E, Huang X, et al. Multimodal entity coreference for cervical dysplasia diagnosis[J]. IEEE Trans Med Imaging, 2015, 34: 229-245. DOI: 10.1109/TMI.2014.2352311
[8] Asiedu MN, Simhal A, Chaudhary U, et al. Development of algorithms for automated detection of cervical pre-cancers with a low-cost, point-of-care, Pocket Colposcope[J]. IEEE Trans Biomed Eng, 2019, 66: 2306-2318. DOI: 10.1109/TBME.2018.2887208
[9] Li C, Chen H, Li XY, et al. A review for cervical histopathology image analysis using machine vision approaches[J]. Artifi Intell Rev, 2020, 53: 4821-4862. DOI: 10.1007/s10462-020-09808-7
[10] 庄福振, 罗平, 何清, 等. 迁移学习研究进展[J]. 软件学报, 2015, 26: 26-39. https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201501003.htm Zhuang FZ, Luo P, He Q, et al. Research progress of transfer learning[J]. Ruanjian Xuebao, 2015, 26: 26-39. https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201501003.htm
[11] Jun L, Guang YL, Xiang RT, et al. Transfer learning enhanced generative adversarial networks for multi-channel MRI reconstruction[J]. Comput Biol Med, 2021, 134: 104504. DOI: 10.1016/j.compbiomed.2021.104504
[12] Niu S, Liu M, Liu Y, et al. Distant Domain Transfer Learning for Medical Imaging[J]. IEEE J Biomed Health Inform, 2021, 25: 3784-3793. DOI: 10.1109/JBHI.2021.3051470
[13] 颜悦, 陈丽萌, 李锦涛, 等. 基于深度学习和组织病理图像的癌症分类研究进展[J]. 协和医学杂志, 2021, 12: 742-748. DOI: 10.12290/xhyxzz.2021-0452 Yan Y, Chen LM, Li JT, et al. Progress in cancer classification based on deep learning and histopathological images[J]. Xiehe Yixue Zazhi, 201, 12: 742-748. DOI: 10.12290/xhyxzz.2021-0452
[14] 杨志明, 李亚伟, 杨冰, 等. 融合宫颈细胞领域特征的多流卷积神经网络分类算法[J]. 计算机辅助设计与图形学学报, 2019, 31: 531-540. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJF201904003.htm Yang ZM, Li YW, Yang B, et al. Multi-flow convolutional neural network classification algorithm based on domain features of cervical cells[J]. Jisuanji Fuzhu Sheji Yu Tuxingxue Xuebao, 2019, 31: 531-540. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJF201904003.htm
[15] Qiao ZH, Herve D, Nicolas D, et al. 3-D consistent and robust segmentation of cardiac images by deep learning with spatial propagation[J]. IEEE Trans Med Imaging, 2018, 37: 2137-2148. DOI: 10.1109/TMI.2018.2820742
[16] Yang H, Sun J, Li H, et al. Neural multi-atlas label fusion: Application to cardiac MR images[J]. Med image Anal, 2018, 49: 60-75. DOI: 10.1016/j.media.2018.07.009
[17] Jamaludin A, Kadir T, Zisserman A. SpineNet: automated classification and evidence visualization in spinal MRIs[J]. Med image Anal, 2017, 41: 63-73. DOI: 10.1016/j.media.2017.07.002
[18] Sato M, Horie K, Hara A, et al. Application of deep learning to the classification of images from colposcopy[J]. Oncol lett, 2018, 15: 3518-3523.
[19] Simonyan K, Zisserman A. Very Deep Convolutional Networks for Large-Scale Image Recognition[J]. Comput Sci, 2014. https://doi.org/10.48550/arXiv.1409.1556.
[20] Russakovsky O, Deng J, Su H, et al. Imagenet large scale visual recognition challenge[J]. Int J Comput Vision, 2015, 115: 211-252.
[21] Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015: 1-9.
[22] Chollet F. Xception: Deep learning with depthwise separable convolutions[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2017: 1251-1258.
[23] He K, Zhang X, Ren S, et al. Deep residual learning for image recognition[C]. Proceedings of the IEEE Confer-ence on Computer Vision and Pattern Recognition, 2016: 770-778.
[24] Huang G, Liu Z, Van DML, et al. Densely connected convolutional networks[C]. Proceedings of the IEEE Confer-ence on Computer VIsion and Pattern Recognition, 2017: 4700-4708.
[25] Al-Haija QA, Adebanjo A. Breast Cancer Diagnosis in Histopathological Images Using ResNet-50 Convolutional Neural Network[C]. 2020 IEEE International IOT, Electronics and Mechatronics Conference (IEMTRONICS). IEEE, 2020.
-
期刊类型引用(7)
1. 李哲玮,史乾灵,刘辉,罗旭飞,王子君,田金徽,葛龙,陈耀龙. STAR指南术语体系(一):规划与启动. 协和医学杂志. 2025(01): 216-223 . 本站查看
2. 中西医联合防治策略标准研究项目组. 《中西医联合防治优势病种临床应用指南》制定技术规范. 中国中西医结合杂志. 2024(04): 389-398 . 百度学术
3. 中国医师协会风湿免疫科医师分会骨关节炎学组. 中国膝骨关节炎临床药物治疗专家共识(2023). 中华内科杂志. 2024(06): 560-578 . 百度学术
4. 杨楠,邹锟,何思颐,曾力楠,李海龙,黄亮,易秋莎,张明月,黄超,王强,张伶俐. 临床实践指南实施效果评价工具的信效度分析. 中国循证医学杂志. 2024(08): 904-909 . 百度学术
5. 张弼,于玲玲,高强,张鹏俊. 我国老年医疗卫生指南需求框架的构建及思考. 中华老年医学杂志. 2024(09): 1131-1136 . 百度学术
6. 孙雅佳,史乾灵,杨楠,郭强强,苏仁凤,陈泽,张广新,曹锡超,陈耀龙. 临床实践指南综合评价的思考与探索. 协和医学杂志. 2023(01): 22-30 . 本站查看
7. 陈耀龙,刘辉,姚志荣,高兴华. 提升皮肤病领域指南和共识质量的策略与建议. 中华皮肤科杂志. 2023(09): 805-808 . 百度学术
其他类型引用(2)