Procedures of Establishing a Well-annotated Database of Color Fundus Photography of Diabetic Retinopathy for Artificial Intelligence Research
-
摘要: 近年来,随着人工智能技术的兴起,世界范围内对于眼底病尤其是糖尿病视网膜病变的人工智能识别研究越来越多,但不同人工智能识别软件准确度的验证与比较问题尚未解决。本文对北京协和医院眼科在建立1.5万张糖尿病视网膜病变眼底彩照人工智能研究标准数据库的过程中所遵循的规范进行阐述,以期为后续眼科以及其他相关学科建立更多的相关数据库提供参考。Abstract: With the development of artificial intelligence technology, explosive research on the recognition of retina diseases with artificial intelligence was published worldwide, among which, diabetic retinopathy attracted most attention. However, evaluation of different artificial intelligence software remains a problem. The Department of Ophthalmology, Peking Union Medical College Hospital published the first standard well-annotated color photo database of diabetic retinopathy for artificial intelligence research in China. We herein present the procedures for the establishment of the database and aim to provide reference for the future development of similar databases.
-
Keywords:
- diabetic retinopathy /
- artificial intelligence /
- annotation /
- database /
- standard procedure
-
甲状腺癌是最常见的头颈部恶性肿瘤,已成为中国发病率最高、上升速度最快的癌症之一[1-3]。医学生在公众健康教育,特别是亲属和患者健康宣教中发挥越来越重要的作用。医学生掌握甲状腺癌相关知识不仅可以提升自身健康意识,还可为具有可疑甲状腺结节的人群提供专业指导,缓解患者的过度焦虑[5-7]。目前针对医学生群体开展的黑色素瘤、人乳头瘤病毒、口腔癌调查结果显示,医学生普遍对基础知识掌握良好,但在临床实践和临床思维方面仍存在不足[4-5]。本研究采用问卷调查的形式对不同阶段的临床医学(八年制)专业医学生开展甲状腺癌相关知识及自查情况调查,以期为医学院校开展甲状腺癌临床教学提供借鉴和参考。
1. 对象与方法
1.1 对象
采用便利抽样的方法,以2020年3月就读于北京协和医学院临床医学(八年制)专业三至六年级的全体医学生为研究对象,将尚未开展诊断学、外科学等临床课程教学的三、四年级医学生定义为临床前阶段医学生(preclinical medical students,PMS),将已接受临床课程教学、部分已进入临床实习的五、六年级医学生定义为临床阶段医学生(clinical medical students,CMS)。甲状腺检查相关课程开设于四年级末,以诊断学大课授课及小组带教的方式进行教学;甲状腺结节及肿瘤疾病相关课程开设于五年级初,以外科学大课授课的方式进行教学。
本研究已通过北京协和医院伦理审查委员会审批(审批号:JS-2670),并征得调查对象的知情同意。
1.2 方法
采用自行设计的问卷开展调查[1-3, 8-10],问卷内容包括:(1)一般资料:调查对象的性别、年级;(2)甲状腺癌认知情况:甲状腺癌的流行病学知识、危险因素、早期临床表现、诊断和治疗,对甲状腺自查及开展甲状腺癌筛查的认识。问卷内容简洁易懂,分为单选题和多选题,问题按照一定的逻辑顺序编排。
2020年3月,通过微信一对一发放问卷,限制每个手机号仅可填写一次,控制答题时间在30 min内。信息填写不全的问卷将被剔除。
1.3 统计学处理
采用SPSS 23.0软件进行统计学分析,计量资料以均数±标准差表示,符合正态分布的数据采用独立样本t检验,不符合正态分布的数据采用Mann-Whitney U检验;计数资料以频数和百分数表示,采用卡方检验和Fisher精确概率法进行统计分析。以P<0.05为差异具有统计学意义。
2. 结果
2.1 一般资料
2020年3月就读于北京协和医学院临床医学(八年制)专业三至六年级医学生共337人,其中PMS 151人,CMS 186人。发放问卷337份,回收问卷275份,其中PMS 129份,回收率为85.4%;CMS 146份,回收率为78.5%,1份问卷因信息不全而被剔除,最终回收有效问卷共274份(PMS 129份,CMS 145份)。其中,5人对“你是否了解甲状腺癌这种疾病?”的回答选择“否”或“不清楚”而跳过剩余全部题目。参与调查的医学生中,女生142人,男生132人,男生与女生对甲状腺癌的认知情况比较差异无统计学意义(P=0.148)。
2.2 甲状腺癌认知情况
2.2.1 关于甲状腺癌基础知识
关于甲状腺癌知晓情况,CMS的知晓率为100%,3.9%的PMS不了解甲状腺癌。对甲状腺癌初步了解的医学生群体中,PMS和CMS对甲状腺癌预后方面的认识存在显著差异(P<0.001),97.2%的CMS知晓甲状腺癌相较于其他多数癌症预后好,而PMS的知晓率仅为64.5%,且4.8%的PMS认为甲状腺癌预后较差。在PMS和CMS两个医学生群体中,亲戚朋友患甲状腺疾病的医学生均超过1/3(38.7% 比34.5%,P=0.526),详见表 1。
表 1 临床医学(八年制)专业医学生甲状腺癌相关知识认知情况[n(%)]问题及选项 PMS CMS P值 1 你是否了解甲状腺癌这种疾病?(n=274) 0.022a 是 124(96.1) 145(100) 0.022a 否 5(3.9) 0(0) <0.001a 不清楚 0(0) 0(0) 2 据你所知,甲状腺癌的整体预后/严重程度如何?(n=269) <0.001a 相比其他癌症较好 80(64.5) 141(97.2) <0.001b 与其他癌症相近 2(1.6) 2(1.4) >0.999a 相比其他癌症较差 6(4.8) 0(0) <0.001a 不清楚 36(21.0) 2(1.4) <0.001a 3 自己或亲戚、朋友是否有人患甲状腺疾病?(n=269) 0.526b 有 48(38.7) 50(34.5) 无 76(61.3) 95(65.5) 4 你从何处获取与甲状腺癌相关的大部分信息? (n=269)(多选) 自己或周围人曾患过甲状腺相关疾病 42(33.9) 24(16.6) 0.001b 媒体(公众号、电视、广告) 53(42.7) 23(15.9) <0.001b 医学院课程 54(43.5) 139(95.9) <0.001b 医生线下科普 30(24.2) 28(19.3) 0.373b 自己感兴趣 12(9.7) 3(2.1) 0.008a 不清楚 13(10.5) 1(0.7) <0.001a 5 你认为以下哪些是甲状腺癌发生的危险因素?(多选)(n=269) 饮酒 52(41.9) 39(26.9) 0.010b 吸烟 53(42.7) 71(49.0) 0.328b 身高# 3(2.4) 6(4.1) 0.513a 肥胖# 53(42.7) 50(34.5) 0.169b 压力# 84(67.7) 88(60.7) 0.253b 气候寒冷# 21(16.9) 106(73.1) <0.001b 辐射# 80(64.5) 120(82.8) 0.157b 一级亲属(父母)有甲状腺癌病史# 83(66.9) 133(91.7) <0.001b 较高的促甲状腺激素水平# 98(79.0) 118(81.4) 0.647b 不清楚 11(8.9) 4(2.8) 0.035a 6 触摸到甲状腺结节,有多大概率为甲状腺癌?(n=269) <0.001a >25%~35% 1(0.8) 3(2.1) 0.627a >15%~25% 10(8.1) 7(4.8) 0.321a >5%~15%# 14(11.3) 27(18.6) 0.125b 5及%以下 8(6.5) 66(45.5) <0.001b 不清楚 91(73.4) 42(29.0) <0.001b 7 触摸到甲状腺结节后,应首选哪项检查确定是否为甲状腺癌?(n=269) <0.001a 细针穿刺活检 21(16.9) 23(15.9) 0.869b 甲状腺B超# 41(33.1) 110(95.6) <0.001b 头颈部CT 6(4.8) 8(5.5) >0.999a 颈部MRI 2(1.6) 1(0.7) 0.596a 不清楚 54(43.5) 3(2.1) <0.001a 8 无症状和结节时,是否也应规律行上述检查以筛查甲状腺结节?(n=269) <0.001b 是 52(41.9) 90(62.1) 0.001b 否# 24(19.4) 42(29.0) 0.088b 不清楚 48(38.7) 13(9.0) <0.001b 9 确诊甲状腺癌后,是否应立刻行手术切除?(n=269) <0.001a 是 9(43) 22(15.2) 0.021a 否# 72(58.1) 119(82.1) 0.001b 不清楚 43(34.7) 4(2.8) <0.001a 10 是否知道微小甲状腺癌可以定期监测而不需要手术治疗?*(n=191) 0.094b 知道# 53(73.6) 100(84.0) 不知道 19(26.4) 19(16.0) 11 如合并甲状腺炎,其严重程度是否与甲状腺癌的发生和治疗相关?(n=269) <0.001a 是# 53(42.7) 83(57.2) <0.001b 否 1(0.8) 22(15.2) <0.001a 不清楚 70(56.4) 40(27.6) <0.001b 12 除手术外, 甲状腺癌的治疗方式还有哪些?(多选)(n=269) 放射性核素治疗# 64(51.6) 56(38.6) 0.037b 促甲状腺激素抑制治疗# 66(53.2) 95(65.5) 0.046b 放射外照射治疗# 48(38.7) 79(54.5) 0.010b 化疗# 56(45.2) 57(39.3) 0.386b 免疫治疗 45(36.3) 37(25.5) 0.063b 不清楚 43(34.7) 5(3.4) <0.001a PMS:临床前阶段医学生;CMS:临床阶段医学生;*答题条件为:第9题回答“否”;#知识性题目的正确答案;aFisher精确概率法;b卡方检验 关于甲状腺癌知识来源,PMS与CMS获取知识的途径存在较大差异,除不了解甲状腺癌的学生外,PMS的甲状腺癌知识多来源于医学院课程(43.5%)、媒体(42.7%)、自己或周围人曾患过甲状腺相关疾病(33.9%),而CMS主要来源于医学院课程(95.9%)。
关于甲状腺癌的危险因素,CMS对于“气候寒冷” “一级亲属家族史”的认知水平较PMS高(73.1% 比16.9%,P<0.001;91.7% 比66.9%,P<0.001),其余危险因素两组间认知水平无显著统计学差异。关于甲状腺结节的恶性程度,PMS与CMS认识水平相近,但更高比率的CMS认为甲状腺结节的恶变概率在5%及以下(45.5% 比6.5%,P<0.001)。相较于PMS,CMS更认同甲状腺超声在甲状腺癌诊治过程中的作用(95.6% 比33.1%,P<0.001),认为即使无症状、未触及结节也应行一定的专业检查以筛查甲状腺癌(62.1% 比41.9%,P=0.001)。
关于甲状腺癌的治疗,相较于PMS,CMS认为不应诊断后立刻行手术治疗(82.1% 比58.1%,P=0.001)。认同不应立刻手术治疗的医学生(191/269)中,84.0%的CMS和73.6%的PMS知晓临床存在可观察的微小甲状腺癌(P=0.094)。关于甲状腺癌手术之外的治疗方法,CMS相较于PMS了解更多。
2.2.2 关于甲状腺自查
CMS开展甲状腺自查的比率高于PMS(55.9%比12.1%,P<0.001),但80.2%(65/81)的学生不经常进行甲状腺自查。从未检查或不规律检查甲状腺的原因两者间存在显著差异,PMS多因不知道如何自查(26.7% 比5.4%,P<0.001),而CMS多认为“没有必要”(56.6%)或“从未想过”(31.0%)。至于其他原因,部分回答为“因为年轻,患甲状腺癌的概率很小”。对于甲状腺检查方法的获取途径,97.5%(79/81)的CMS主要通过医学院课程(包括介绍甲状腺疾病的临床课程及介绍甲状腺知识的基础课程)学习获取,仅13.3% (2/15)的PMS是从医学院课程学习获取(因PMS仅接受过基础课程学习),两者间比较差异具有显著统计学意义(P<0.001),详见表 2。
表 2 临床(八年制)专业医学生甲状腺自查认知情况[n(%)]问题及选项 PMS CMS P值 1 你是否规律自查?(n=269) <0.001a 是 4(3.2) 16(11.0) 0.019a 检查过,不经常 11(8.9) 65(44.8) <0.001b 否 109(87.9) 64(44.1) <0.001b 2 你为何未规律自查?*(n=249) <0.001a 从未想过 58(48.3) 40(31.0) 0.006b 没有必要 25(20.8) 73(56.6) <0.001b 害怕发现异常情况 0(0) 2(1.6) 0.499a 不知道如何检查 32(26.7) 7(5.4) <0.001a 其他 5(4.2) 7(5.4) 0.771a 3 你从何处学习到甲状腺检查方法?#(n=96) <0.001a 自己或周围人曾患过甲状腺 相关疾病 6(40.0) 0(0) <0.001a 媒体(公众号、电视、广告等) 1(6.7) 0(0) 0.155a 医学院课程 2(13.3) 79(97.5) <0.001a 医生线下科普 3(20.0) 1(1.2) 0.011a 自己感兴趣 0(0) 0(0) 不清楚 3(20.0) 1(1.2) 0.011a *答题条件为:第1题回答“否”或“检查过,不经常”;#答题条件为:第1题回答“是”或“检查过,不经常”;PMS、CMS:同表 1;aFisher精确概率法;b卡方检验 3. 讨论
3.1 甲状腺癌教育的整体效果显著
随着诊疗水平的提高,甲状腺癌的发病率呈逐年上升趋势,公众对于甲状腺结节和甲状腺癌的重视程度日益增高。医学生在公众教育和科普,特别是亲属和患者的宣教中发挥着重要作用。本研究首次在医学生中针对甲状腺癌相关知识开展问卷调查,调查结果初步显示医学生整体对甲状腺癌了解较为充分,其中在甲状腺癌的诊断、治疗及自查方面,CMS相较于PMS认知度更高,大多数CMS表示其知识来源于课堂教学。研究还发现,CMS对于甲状腺结节的恶变过于乐观,不能规律进行自查,且支持开展不必要的人群甲状腺结节筛查。
北京协和医学院对医学生开展甲状腺癌相关知识教育效果显著,临床医学(八年制)医学生接受临床课程教育后对于甲状腺癌相关知识有充分的掌握。PMS尚未开展临床课程学习,通过临床前课程(如解剖学、组织胚胎学等)对甲状腺癌有一定的了解,但对疾病治疗、预后方面的认识与临床实际情况存在偏差,未掌握甲状腺结节检查的正确方法,而PMS群体常因医学生身份而被咨询甲状腺结节相关问题。鉴于PMS对甲状腺癌的认识存在明显不足,医学院校应在临床前通识教育中设置相关课程,并持续加强临床课程中关于甲状腺癌相关知识(包括流行病学、病因及危险因素、临床表现、诊断、治疗和预防)的教学,使医学生在临床轮转前对甲状腺癌有一定的专业认识。
3.2 甲状腺自查情况尚不理想
本研究进一步发现,尽管CMS对于甲状腺癌相关知识掌握较好,且其亲戚、朋友曾患甲状腺疾病的比例超过1/3,但定期规律行甲状腺自查的医学生却非常少。4.2% 的医学生认为年轻人不会患甲状腺癌,因此不必进行规律自查。但数据显示,15岁以后甲状腺癌的发病率显著提升,仅死亡率相较于老年人更低[1]。45.5% 的CMS对于甲状腺结节恶变概率的估计(5%及以下)低于流行病学研究结论(5%~15%)[6]。临床课程详细介绍了甲状腺癌的多种治疗手段(如外科手术、放射性核素治疗等),并强调患者获益良好,使学生普遍认为甲状腺癌治愈率较高,对其预后持过度乐观的态度。CMS对于甲状腺癌其他知识的认知水平较高,但对其预后过于乐观而轻视甲状腺癌的早诊,因而忽视了甲状腺自查的重要性。随着医学的发展,尽管甲状腺癌的预后得到进一步改善,但仍需向医学生强调自查作为甲状腺癌早诊手段的重要性。
3.3 存在过度筛查的错误观念
在甲状腺癌诊断评估方面,CMS的重视程度较高,支持在无症状、无结节人群中积极开展甲状腺超声筛查。随着医学技术的进步,甲状腺结节的诊断越来越便捷,是否有必要广泛筛查甲状腺癌亦受到广泛关注[10]。1999年,韩国启动的甲状腺癌筛查项目使得1993—2011年韩国的甲状腺癌诊断率上升14倍,但死亡率较之前无明显改善[11]。Miyauchi[12]对1179例低风险甲状腺癌患者进行监测,在平均47个月的随访中未出现因甲状腺癌而死亡的患者,也无患者发生远处转移,同时1085例(92.0%)患者避免了甲状腺癌切除手术。因此,现有证据认为广泛开展甲状腺超声筛查甲状腺癌属于过度诊治[7],不推荐开展甲状腺癌人群筛查。对于满足观察条件的微小甲状腺癌患者,可予以密切监测和随访[13]。临床阶段,应注重培养医学生灵活运用知识的能力,鼓励其开展患者健康宣教和科普宣传;同时在课程设置方面,注重向医学生传递公共卫生和卫生经济学知识,避免其在开展临床宣教或公众科普过程中引起不必要的焦虑,增加社会经济负担。
3.4 研究的局限性
本研究尚存在一定局限性和不足:(1)部分学生未对问卷调查进行反馈,导致结果可能存在一定偏倚,未纳入分析的医学生可能对甲状腺癌话题不感兴趣或对相关知识不了解,导致对调查结果过于乐观。(2)本研究仅在一所医学院校开展调查,且样本数量有限,考虑到学生学习效果的个体差异性及各院校临床医学(八年制)专业培养计划、授课质量的不同,研究的代表性有限。
4. 小结
甲状腺癌的适宜诊疗思路为积极开展自查,无症状或未触及结节时避免超声筛查,即使出现症状和甲状腺结节也应寻求专业医师咨询并进行诊断性检查,避免过度焦虑担忧。对于医学生的培养,应在不同阶段设定合适的教学目标,注重理论与实践相结合,保证“临床前通识-临床综合课-临床见/实习”的持续培养。同时,不断优化教学设计,使医学生对甲状腺癌的认识更为系统全面、与时俱进。当医学生掌握了足够的甲状腺疾病相关知识后,将在社会和医院中承担重要角色,积极应对和缓解公众对于癌症的担忧。
作者贡献:陈有信为项目总负责人和总策划;于伟泓负责数据库的策划与具体落实;张潇、吴婵、陈欢、杨治坤、贺峰、张枝桥负责阅片与质量控制;张碧磊, 巩迪、王月麟、杨景元、李冰负责数据标注;孙燕媛、马亚静负责数据库管理与建库过程记录;陆慧琴、夏蔚、周伟、张东磊、潘庆敏、杨宁、王淑娜、孙晓蕾、遇颖、苏畅、万博、汪明启、王敏负责真实世界数据收集。利益冲突:无 -
[1] 王亚星, 薛灿灿, 李建军. 眼科人工智能研究存在的主要问题及对策[J]. 眼科, 2021, 30: 81-84. https://www.cnki.com.cn/Article/CJFDTOTAL-YAKE202102004.htm [2] U.S. Food and Drug Administration. FDA permits marketing of artificial intelligence-based device to detect certain diabetes-related eye problems[EB/OL]. (2018-04-11)[2021-08-21]. https://www.fda.gov/news-events/press-announcements/fda-permits-marketing-artificial-intelligence-based-device-detect-certain-diabetes-related-eye.
[3] Gulshan V, Peng L, Coram M, et al. Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs[J]. JAMA, 2016, 316: 2402-2410. DOI: 10.1001/jama.2016.17216
[4] 中华医学会眼科学会眼底病学组. 我国糖尿病视网膜病变临床诊疗指南(2014年)[J]. 中华眼科杂志, 2014, 50: 851-865. DOI: 10.3760/cma.j.issn.0412-4081.2014.11.014 [5] Rivera SC, Liu X, Chan AW, et al. Guidelines for clinical trial protocols for interventions involving artificial intelligence: the SPIRIT-AI extension[J]. Nat Med, 2020, 26: 1351-1363. DOI: 10.1038/s41591-020-1037-7
-
期刊类型引用(1)
1. 俞利,刘楠. 心脏外科手术后右心衰竭诊断方法研究进展. 中国医药. 2024(09): 1402-1406 . 百度学术
其他类型引用(1)