-
摘要: 人工智能正在融入病理学研究的各个领域,但在临床实践中却遇到了诸多挑战,包括因医疗数据隐私保护而形成“数据孤岛”,不利于人工智能模型的训练;现有人工智能模型缺乏可解释性,导致使用者无法理解而难以形成人机互动;人工智能模型对多模态数据利用不足,致使其预测效能难以进一步提升等。为解决上述难题,我们建议在现有病理人工智能研究中引入可信人工智能技术:(1)数据安全共享,在坚持数据保护的基础上打破数据孤岛,使用联邦学习的方法、仅调用数据训练的结果而不上传数据本身,在不影响数据安全的情况下大大增加可用于训练的数据量;(2)赋予人工智能可解释性,使用图神经网络技术模拟病理医生学习病理诊断的过程,使得模型本身具有可解释性;(3)多模态信息融合,使用知识图谱技术对更为多样和全面的数据来源进行整合并深入挖掘分析,获得更准确的模型。相信通过此三方面的工作,可信病理人工智能技术可使病理人工智能达到可控可靠和明确责任,从而促进病理人工智能的发展和临床应用。Abstract: Artificial intelligence (AI) has gradually integrated into every aspect of pathology research. However, we also encounter some problems in the practical application of pathological artificial intelligence. 1. Research institutions attach importance to the protection of data privacy, which results in the emergence of data islands and is detrimental to our training of AI models. 2. The lack of interpretability of existing AI models leads to users' incomprehension and difficulty in human-computer interaction. 3. AI models make insufficient use of multi-modal data, making it difficult to further improve their predictive effectiveness. To address the above-mentioned challenges, we propose to introduce the latest technologies of trusted artificial intelligence (TAI) into existing research of pathological AI, which is embodied as the following: 1. Securely share data. We try to break data islands on the basis of adhering to data protection. We can use federated learning methods, only provide the results of data training without uploading the data itself, and greatly increase the amount of data that can be used for training without affecting the data security. 2. Give AI interpretability. The technology of graphic neural networks is used to simulate the process of pathologists' learning pathological diagnosis, making the model itself interpretable. 3. Fuse multimodal information. Use the technology of knowledge graph to integrate and deepen the analysis of more diverse and comprehensive data sources in order to derive more accurate models. Through the above three aspects, we can achieve reliable and controllable pathological AI and clear the responsibility through trusted pathological AI technology, so as to promote the development and clinical application of pathological AI.
-
内容清晰、结构完整的论文摘要不仅有助于加速文章正式出版前的同行评审进程,还可帮助研究人员高效地进行文章的检索和筛选,以及对研究有效性和适用性进行初步评估[1-3]。临床实践指南的摘要概莫能外,报告了主要推荐意见关注内容的指南摘要还可促进指南的传播与实施[4]。指南标准化会议(Conference on Guideline Standardization,COGS)清单[5]和美国耳鼻喉头颈外科学会(American Academy of Otolaryngology-Head and Neck Surgery,AAO-HNS)的指南制订手册[6]均强调结构式摘要是高质量指南的特征之一。近30年来,中国发表的指南数量快速增长[7],但目前尚缺乏针对指南摘要报告现状和具体内容进行调查和分析的相关研究。本研究以2019年期刊公开发表的中国临床实践指南(下文简称“2019年中国指南”)为研究对象,旨在调查指南摘要的报告情况,分析摘要报告的具体内容,并比较摘要与正文报告内容的一致性,为相关研究人员撰写指南摘要及开展指南摘要报告规范研究提供参考。
1. 资料与方法
1.1 数据资料
纳入符合美国国家医学院1990年[8]或2011年[9]定义的指南,第一作者单位为中国机构,公开发表于同行评审期刊,正式刊出时间为2019年1月1日至2019年12月31日,语种为中文或英文。研究人员每2人一组,独立在中国知网、万方数据知识服务平台和中国生物医学文献数据库进行中文指南检索,在PubMed数据库进行英文指南检索,并补充检索中华医学期刊全文数据库、香港期刊在线、港澳期刊网、澳门期刊论文索引及台湾期刊论文索引系统。具体检索策略及文献筛选标准见《2019年期刊公开发表的中国临床实践指南文献调查与评价——制订人员及工作组情况》[10]。
1.2 信息提取
根据预先设定的信息提取表,由经过培训的4名研究人员每2人一组独立进行信息提取,如遇分歧则通过讨论或请第三方协商解决。信息提取内容包括:(1)指南基本信息:标题、发表语种、期刊收录类型[中国科学引文数据库(Chinese Science Citation Database,CSCD)收录期刊、非CSCD收录期刊、科学引文索引(Science Citation Index,SCI)收录期刊、非SCI收录期刊];(2)指南摘要相关信息:是否报告摘要、是否为结构式摘要、中文指南是否提供英文摘要、摘要字数等。
1.3 摘要内容分析
目前国内外尚无指南摘要报告质量的评价工具,本研究工作组主要基于Hayward等[4]发表的指南摘要报告标准,临床试验报告统一标准的摘要扩展版(Consolidated Standards of Reporting Trials for Abstract,CONSORT-Abstract)[11]、系统评价和Meta分析优先报告条目的摘要扩展版(Preferred Reporting Items for Systematic Reviews and Meta-Analyses for Abstract,PRISMA-Abstract)[12],以及国际实践指南报告规范(Reporting Items for Practice Guidelines in Healthcare,RIGHT)[13],提取其中与摘要或指南报告内容相关的条目,汇总形成初步的条目池,同时参考其他相关研究[1, 14],对条目进行合并去重,然后根据不同条目的报告内容对指南摘要的适用性进行条目筛选,最终经组内共识形成初拟版RIGHT-Abstract报告清单,用于初步评估指南摘要的报告质量。该清单共涵盖7个领域、包括19个条目,分别为背景(5个条目)、方法(6个条目)、结果(3个条目)、审核(1个条目)、讨论(2个条目)、注册(1个条目)和资助(1个条目)。具体条目内容及来源详见表 1。
表 1 初拟版RIGHT-Abstract报告清单条目来源领域 条目 Hayward等的摘要报告标准[4] CONSORT-Abstract[11] PRISMA-Abstract[12] RIGHT[13] 背景 指南关注疾病或卫生问题的简要描述 √ √ 指南制订的主要目的 √ √ √ √ 指南拟实施的主要目标人群 √ √ √ 指南推荐的主要使用者 √ 指南适合的使用环境 √ √ 方法 参与指南制订的主要人员 √ √ 证据检索相关信息 √ √ √ 证据选择的标准,如研究类型等 √ √ 证据综合相关信息 √ √ √ 证据质量分级方法 √ √ 指南的共识或决策方法及过程等信息 √ 结果 指南推荐意见关注的主要内容 √ √ 推荐强度相关内容,如分级方法等 √ 推荐意见实施的利弊 √ √ √ √ 审核 外部评审过程 √ √ 讨论 指南应用的促进和阻碍因素 √ √ 对未来研究的建议 √ 注册 指南注册信息,包括注册平台或注册号 √ √ 资助 指南制订过程中的资金来源 √ √ √ √ CONSORT:临床试验报告统一标准;PRISMA:系统评价和Meta分析优先报告条目;RIGHT:国际实践指南报告规范;√:初拟版RIGHT-Abstract报告清单的形成参考了该条目 4名研究人员每2人一组对摘要内容进行评价,如评价结果存在分歧,则通过讨论或请第三方协商解决。摘要内容完全符合或部分符合某条目标准,则评价为“报告”;反之,则评价为“未报告”。分别计算2019年中国指南摘要的领域报告率和条目报告率,计算方式如下:
$$ 领域报告率 =\frac{\text { 该领域各条目报告率之和 }}{\text { 该领域条目总数 }} $$ (1) $$ 条 目 报告率{\rm{ = }}\frac{{该条目评价结果为“报告”的指南数量}}{{指南总数}} \times 100{\rm{\% }} $$ (2) 1.4 摘要与正文内容报告一致性分析
4名研究人员每2人一组,基于初拟版RIGHT-Abstract清单条目对纳入指南的正文进行评价。指南正文各领域报告率和各条目报告率的计算方式与摘要相同。摘要与正文内容报告一致性定义为:对于某一条目,摘要与正文均评价为“报告”,且两者报告的信息基本一致。但对于推荐意见的报告,考虑到摘要篇幅的限制,规定摘要中提供推荐意见的主要关注内容,即评价为“报告”,而正文中需提供清晰、准确且可实施的推荐意见,则评价为“报告”。条目报告一致性的计算方式为:
$$ 条目报告 一致性{\rm{ = }}\frac{{该条目摘要和正文均评价为“报告”的指南数量}}{{指南总数}} \times 100{\rm{\% }} $$ (3) 1.5 统计学处理
采用Endnote X9、Microsoft Excel 2019和SPSS 26.0软件进行文献整理和数据汇总分析,计数资料以频数和百分数表示。
2. 结果
2.1 指南摘要的基本信息
最终纳入2019年中国指南226篇,其中96篇(42.5%)报告了摘要,包括79篇(82.3%,79/96)中文指南和17篇(17.7%,17/96)英文指南。在报告摘要的指南中,仅6篇(6.3%,6/96)为结构式摘要,仅16篇(16.7%,16/96) 在摘要中报告了推荐意见关注的主要内容。在报告摘要的中文指南中,52篇(65.8%,52/79)同时报告了中文和英文摘要。对摘要字数进行统计发现,中文指南摘要的平均字数为249个,英文指南摘要的平均字数为190个;结构式摘要的平均字数较非结构式摘要多94个(327比233)。
不同发表语种和期刊收录类型的指南摘要报告情况详见表 2。英文指南的摘要报告率和结构式摘要报告率均略高于中文指南(43.6% 比42.2%;7.7% 比1.6%)。CSCD收录期刊发表的指南摘要报告率高于非CSCD收录期刊发表的指南(50.0% 比30.1%)。
表 2 226篇2019年期刊公开发表的中国临床实践指南摘要报告率[n(%)]分组 报告摘要的指南数量 报告结构式摘要的指南数量 发表语种 中文(n=187) 79(42.2) 3(1.6) 英文(n=39) 17(43.6) 3(7.7) 期刊收录类型* CSCD收录(n=114) 57(50.0) 1(0.9) 非CSCD收录(n=73) 22(30.1) 2(2.7) SCI收录(n=34) 12(35.3) 2(5.9) 非SCI收录(n=5) 5(100.0) 1(20.0) CSCD:中国科学引文数据库;SCI:科学引文索引;*中文期刊按照是否被CSCD收录进行分类,英文期刊按照是否被SCI收录进行分类 2.2 指南摘要的报告质量
2.2.1 摘要各领域报告率及亚组分析
2019年中国指南摘要各领域报告率详见表 3。其中“背景”领域报告率最高(61.0%),“讨论”“注册”和“资助”领域的报告率最低,均为0。中文指南在“背景”领域的报告率高于英文指南(62.8% 比52.9%),在“方法”“结果”和“审核”领域的报告率均低于英文指南。CSCD收录期刊发表的指南摘要各领域报告率与非CSCD收录期刊发表的指南相近,相差不超过5.0%。
表 3 96篇2019年期刊公开发表的中国临床实践指南摘要各领域报告率(%)分组 背景 方法 结果 审核 讨论 注册 资助 整体报告率(n=96) 61.0 13.0 7.3 1.0 0 0 0 发表语种 中文(n=79) 62.8 12.0 5.9 1.3 0 0 0 英文(n=17) 52.9 17.6 13.7 5.9 0 0 0 期刊收录类型* CSCD收录(n=57) 62.5 11.1 5.8 1.8 0 0 0 非CSCD收录(n=22) 63.6 14.4 6.1 0 0 0 0 SCI收录(n=12) 53.3 15.3 16.7 0 0 0 0 非SCI收录(n=5) 52.0 23.3 6.7 20.0 0 0 0 CSCD、SCI:同表 2;*同表 2 2.2.2 摘要各条目报告率
指南摘要各条目报告率详见表 4(条目内容为表 1条目的简要概括)。“疾病和卫生问题”的条目报告率最高(91.7%),其次为“目的” (87.5%)和“目标人群”(70.8%),其余条目的报告率均低于50.0%,其中“证据选择”“证据综合”“推荐强度”“利弊”和“外部评审”等条目的报告率极低,均低于5.0%,而“应用的促进和阻碍因素”“未来的研究建议”“注册”及“资金来源”4个条目的报告率均为0。中文与英文指南摘要的报告率在各条目的分布情况较为相似,二者报告率相差最大的条目为“使用者”,差异达30.5%,其余条目间的报告率差异均不超过20.0%。
表 4 96篇2019年期刊公开发表的中国临床实践指南摘要各条目报告情况[n(%)]领域 条目 指南总数(n=96) 中文指南(n=79) 英文指南(n=17) 背景 疾病和卫生问题 88(91.7) 72(91.1) 16(94.1) 目的 84(87.5) 72(91.1) 12(70.6) 目标人群 68(70.8) 54(68.4) 14(82.4) 使用者 41(42.7) 38(48.1) 3(17.6) 使用环境 12(12.5) 12(15.2) 0(0) 方法 制订人员 37(38.5) 32(40.5) 5(29.4) 证据检索 6(6.3) 4(5.1) 2(11.8) 证据选择 2(2.1) 1(1.3) 1(5.9) 证据综合 4(4.2) 3(3.8) 1(5.9) 证据分级 7(7.3) 3(3.8) 4(23.5) 共识或决策过程 19(19.8) 14(17.7) 5(29.4) 结果 推荐意见 16(16.7) 13(16.5) 3(17.6) 推荐强度 4(4.2) 1(1.3) 3(17.6) 利弊 1(1.0) 0(0) 1(5.9) 审核 外部评审 1(1.0) 1(1.3) 0(0) 讨论 应用的促进和阻碍因素 0(0) 0(0) 0(0) 未来的研究建议 0(0) 0(0) 0(0) 注册 指南注册信息 0(0) 0(0) 0(0) 资助 资金来源 0(0) 0(0) 0(0) 2.3 指南摘要与正文报告内容的一致性
指南摘要与正文报告内容的一致性详见表 5(其条目内容为表 1条目的简要概括)。指南摘要与正文对“疾病和卫生问题”的报告一致性最高(91.7%),其次为“目的”(78.1%)、“目标人群”(70.8%)、“使用者”(38.5%)和“制订人员”(38.5%),其余条目的一致性均低于20.0%。7个条目出现仅在摘要中报告而未在正文报告的情况,但仅摘要报告的条目占比较少,均不超过10.0%。
表 5 96篇2019年期刊公开发表的中国临床实践指南摘要与正文内容一致性分析[n(%)]领域 条目 摘要与正文均报告 仅正文报告 仅摘要报告 均未报告 背景 疾病和卫生问题 88(91.7) 8(8.3) 0(0) 0(0) 目的 75(78.1) 5(5.2) 9(9.4) 7(7.3) 目标人群 68(70.8) 28(29.2) 0(0) 0(0) 使用者 37(38.5) 20(20.8) 4(4.2) 35(36.5) 使用环境 9(9.4) 9(9.4) 3(3.1) 75(78.1) 方法 制订人员 37(38.5) 59(61.5) 0(0) 0(0) 证据检索 5(5.2) 15(15.6) 1(1.0) 75(78.1) 证据选择 1(1.0) 11(11.5) 1(1.0) 83(86.5) 证据综合 4(4.2) 3(3.1) 0(0) 89(92.7) 证据分级 7(7.3) 46(47.9) 0(0) 43(44.8) 共识或决策过程 17(17.7) 10(10.4) 2(2.1) 67(69.8) 结果 推荐意见 13(13.5) 44(45.8) 3(3.1) 36(37.5) 推荐强度 4(4.2) 42(43.8) 0(0) 50(52.1) 利弊 1(1.0) 93(96.9) 0(0) 2(2.1) 审核 外部评审 1(1.0) 11(11.5) 0(0) 84(87.5) 讨论 应用的促进和阻碍因素 0(0) 38(39.6) 0(0) 58(60.4) 未来的研究建议 0(0) 16(16.7) 0(0) 80(83.3) 注册 指南注册信息 0(0) 6(6.3) 0(0) 90(93.8) 资助 资金来源 0(0) 39(40.6) 0(0) 57(59.4) 3. 讨论
3.1 摘要的报告情况
本研究对2019年中国指南的摘要报告情况进行调查分析发现,报告摘要的指南不足1/2,而报告结构式摘要的指南比率更低。
自1987年Haynes等[14]提出临床研究的结构式摘要以来,很多杂志采用了结构式摘要[2, 14]。研究显示,相较于非结构式摘要,结构式摘要可提供更多信息,更能准确反映文章内容[15-17]。早在21世纪初,就有学者对1987—2001年期间非英文期刊发表的临床试验研究的结构式摘要报告率进行了调查,发现结构式摘要的数量增长迅速,1999—2001年期间报告摘要的中文临床试验研究中,结构式摘要的报告率已达100.0%[18]。但2019年报告摘要的中国指南中,结构式摘要的占比仅为6.3%,与临床试验研究相比尚存在较大差距。除摘要结构外,语言的多样化亦具有重要意义,对于以中文语种发表的指南,同时提供相应的英文摘要是促进其在国际上传播推广和提高国际影响力的重要途径,但2019年报告摘要的79篇中文指南中,仍有1/3的指南未提供英文摘要。
3.2 摘要的具体内容
对2019年中国指南摘要的具体内容进行分析发现,摘要内容的报告主要集中在“背景”领域,对“方法”“结果”等重要领域的平均报告率均低于15.0%,尤其是“注册”和“资助”领域,尚无指南摘要报告相关内容。
制订方法是否正确规范是反映指南质量的重要标准[19],《中国制订/修订临床诊疗指南的指导原则(2022版)》也强调检索和评价证据等方法学过程是指南制订/修订的关键步骤之一[20],在摘要中适当报告指南制订人员,证据的检索、选择、综合和分级方法,共识形成过程等信息,可帮助读者判断指南方法学应用的准确性以及指南制订的严谨性。而推荐意见是指南的主体和核心部分,也是指导临床决策的关键内容[21],在摘要中报告主要推荐意见及其推荐强度和实施利弊,有助于临床医生快速作出综合决策。但受摘要篇幅的限制,上述内容可能无法全面呈现,但应至少在摘要中说明制订方法的关键步骤是否进行,以及推荐意见关注的核心内容,以帮助读者判断指南的科学性和适用性,避免因摘要信息报告不充分而遗漏相关指南。“注册”和“资助”信息是临床试验和系统评价摘要中建议报告的重要内容之一[11-12],在指南摘要中亦如此。注册信息可帮助用户判断指南的可信度,增加指南制订的透明性,避免重复制订及促进制订者之间的合作[22],在摘要中提供注册平台或注册号,可为读者提供更多信息,如国际实践指南注册平台提供了指南制订人员的相关资料、指南关注领域、适用人群、资助来源及计划书等。资助信息则影响指南结果的客观性,研究显示药企资助的临床研究、系统评价和指南更容易得出有利于资助方的结论[23-25],在摘要中提供资金来源可帮助读者更直观地判断指南推荐意见的可靠性,减少用户的顾虑。
此外,结合2019年中国指南报告质量的评价结果发现,摘要中报告率较低的大部分条目,在指南正文中的报告情况亦较差[26]。因此,为提高初拟版RIGHT摘要报告清单条目在指南摘要中的报告率,应首先提高指南的整体报告质量。
3.3 摘要与正文内容的一致性
对2019年中国指南摘要与正文报告内容的一致性进行分析发现,7个条目出现仅在摘要中报告而未在正文中报告的情况,但占比均较小。
关于摘要与正文内容报告不一致的情况,既往研究也存在相似结果。两项研究分别比较了1996—1997年和2011年2—3月6种医学期刊发表的研究性文章中摘要与正文内容的一致性,结果发现分别有18%~68%和3.33%~45%的文章摘要与正文内容存在差异[27-28]。对于指南而言,出现摘要与正文内容报告不一致的原因可能包括:(1)目前国内外尚缺乏指南摘要报告内容的统一规范,指南制订者缺乏可参考的相关标准;(2)期刊未对指南摘要应报告的关键信息作出规范和要求,指南制订者缺乏有效的指导,未严格遵照正文内容撰写摘要。总而言之,摘要应是对指南正文关键信息的准确报告,研发相应的报告规范,指导期刊和指南制订者规范报告摘要内容,有助于改善摘要与正文内容不一致的情况。
基于上述结果,提出以下建议:(1)指南制订者应采用结构式摘要的形式报告指南摘要,以中文发表的指南应尽可能同时报告中文和英文摘要,并在摘要中呈现指南核心推荐意见;(2)基于现有初拟版指南摘要报告清单,进一步研发正式的指南摘要报告规范;(3)期刊应在稿约中对指南摘要的报告格式和内容提出要求;(4)建议开展指南摘要评价及相关研究,以加强研究人员对摘要撰写的重视,推动指南摘要报告规范的发展和报告质量的提升。
3.4 局限性
目前国际上尚无公认的指南摘要报告质量评价工具,初拟版RIGHT-Abstract清单是基于当前主流的摘要或指南报告规范制订而成,可在一定程度上反映2019年中国指南摘要的报告质量。本研究尚存在一定的局限性:(1)仅对2019年期刊公开发表的中国临床实践指南摘要进行调查分析,结果的外推性不足;(2)2019年中国指南报告结构式摘要的比率极低,未对摘要结构的具体撰写形式进行进一步分析。
4. 小结
本研究为国内首次对临床实践指南的摘要报告现状及报告质量进行调查评价,为指南摘要报告规范相关研究的开展提供了重要参考。2019年中国指南摘要的报告率较低,结构式摘要占比较少,摘要提供的信息有限。目前,尚缺乏国内外公认的指南摘要报告规范,为促进我国指南摘要报告质量的提升,建议指南方法学家应加快研发指南摘要报告规范,为相关人员提供有效指导;同时,指南制订者和期刊应重视指南摘要格式和内容的撰写,以期进一步提升指南摘要的报告质量。
作者贡献:周燕燕负责查阅文献、撰写论文;邓杨负责整理文献和论文修订;包骥、步宏负责论文构思及终稿审校。利益冲突:所有作者均声明不存在利益冲突 -
[1] Li BH, Hou BC, Yu WT, et al. Applications of artificial intelligence in intelligent manufacturing: a review[J]. Front Inform Technol Electron Eng, 2017, 18: 86-96. DOI: 10.1631/FITEE.1601885
[2] Rajpurkar P, Chen E, Banerjee O, et al. AI in health and medicine[J]. Nat Med, 2022, 28: 31-38. DOI: 10.1038/s41591-021-01614-0
[3] European Commission. White Paper On Artificial Intelli-gence-A European approach to excellence and trust[EB/OL]. (2020-02-19)[2022-04-05]. https://ec.europa.eu/info/sites/info/files/commission-white-paper-artificial-intelligence-feb2020_en.pdf.
[4] 中国信息通信研究院. 可信人工智能白皮书[EB/OL]. (2021-07-09)[2022-04-05]. http://www.caict.ac.cn/k-xyj/qwfb/bps/202107/P020210709319866413974.pdf. [5] Parwani A. Whole Slide Imaging[M]. Switzerland: Springer Nature Switzerland AG, 2022: 223-236.
[6] Willemink MJ, Koszek WA, Hardell C, et al. Preparing Medical Imaging Data for Machine Learning[J]. Radiology, 2020, 295: 4-15. DOI: 10.1148/radiol.2020192224
[7] European Commission. General Data Protection Regulation[EB/OL]. (2016-04-27)[2022-04-05]. https://gdpr.eu/article-1-subject-matter-and-objectives-overview/.
[8] Law Reform Commission. Hong Kong Person Date Privacy Ordinance[EB/OL]. (2012-10-01)[2022-04-05]. https://www.pcpd.org.hk/english/data_privacy_law/ordinance_at_a_Glance/ordinance.html.
[9] Kaissis GA, Makowski MR, Rückert D, et al. Secure, privacy-preserving and federated machine learning in medical imaging[J]. Nat Machine Intel, 2020, 2: 305-311. DOI: 10.1038/s42256-020-0186-1
[10] Zhou SK, Greenspan H, Davatzikos C, et al. A Review of Deep Learning in Medical Imaging: Imaging Traits, Technology Trends, Case Studies With Progress Highlights, and Future Promises[J]. Proc IEEE Inst Electr Electron Eng, 2021, 109: 820-838. DOI: 10.1109/JPROC.2021.3054390
[11] 刘再毅, 石镇维, 梁长虹. 推进联邦学习技术在医学影像人工智能中的应用[J]. 中华医学杂志, 2022, 102: 318-320. Liu ZY, Shi ZW, Liang CH. Promoting the application of federated learning in medical imaging artificial intelligence[J]. Zhonghua Yixue Zazhi, 2022, 102: 318-320.
[12] Yang D, Xu Z, Li WQ, et al. Federated Semi-Supervised Learning for COVID Region Segmentation in Chest CT using Multi-National Data from China, Italy, Japan[J]. Med Image Anal, 2021, 70: e101992. DOI: 10.1016/j.media.2021.101992
[13] Lu MY, Chen RJ, Kong DH, et al. Federated learning for computational pathology on gigapixel whole slide images[J]. Med Image Anal, 2022, 76: e102298. DOI: 10.1016/j.media.2021.102298
[14] Du MN, Liu NH, Hu X. Techniques for Interpretable Machine Learning[J]. Commun ACM, 2020, 63: 68-77.
[15] Selvaraju RR, Cogswell M, Das A, et al. Grad-CAM: Visual Explanations from Deep Networks via Gradient-Based Localization[J]. Int J Comput Vis, 2020, 128: 336-359. DOI: 10.1007/s11263-019-01228-7
[16] Yu K, Wang F, Berry GJ, et al. Classifying non-small cell lung cancer types and transcriptomic subtypes using convolutional neural networks[J]. J Am Med Inform Assoc, 2020, 27: 757-769. DOI: 10.1093/jamia/ocz230
[17] Sousa I, Vellasco M, Silva E. Local Interpretable Model-Agnostic Explanations for Classification of Lymph Node Metastases[J]. Sensors, 2019, 19: 1-18. DOI: 10.1109/JSEN.2019.2912688
[18] Saporta A, Gui XT, Agrawal A, et al. Deep learning saliency maps do not accurately highlight diagnostically relevant regions for medical image interpretation[J]. MedRxiv, 2021. https://doi.org/10.1101/2021.02.28.21252634.
[19] Ehsan U, Passi S, Liao QV, et al. The Who in Explainable AI: How AI Background Shapes Perceptions of AI Explanations[J]. Arxiv, 2021. https://arxiv.org/abs/2107.13509.
[20] Li X, Dvornek NC, Zhou Y, et al. Efficient Interpretation of Deep Learning Models Using Graph Structure and Coopera-tive Game Theory: Application to ASD Biomarker Discovery[J]. Inf Process Med Imaging, 2019, 11492: 718-730.
[21] Li X, Zhou Y, Dvornek NC, et al. Efficient Shapley Explana-tion for Features Importance Estimation Under Uncertainty[J]. Med Image Comput Assist Interv, 2020, 12261: 792-801.
[22] Sarder SP. From What to Why, the Growing Need for a Focus Shift Toward Explainability of AI in Digital Pathology[J]. Front Physiol, 2022, 12: e821217.
[23] Hegde N, Hipp JD, Liu Y, et al. Similar Image Search for Histopathology: SMILY[J]. NPJ Digit Med, 2019, 2: 56-65.
[24] Li X, Duncan J. BrainGNN: Interpretable Brain Graph Neural Network for fMRI Analysis[J]. Med Image Anal, 2021, 74, e102233.
[25] Li X, Zhou Y, Dvornek NC, et al. Pooling Regularized Graph Neural Network for fMRI Biomarker Analysis[J]. Med Image Comput Assist Interv, 2020, 12267: 625-635.
[26] Amit S. Introducing the knowledge graph[R]. America: Official Blog of Google, 2012.
[27] 崔洁. 面向乳腺肿瘤诊断的知识图谱及辅助决策研究[D]. 上海: 东华大学, 2018.