-
摘要: 证据合成即使用系统、明确的方法对现有研究进行合成。目前的证据合成方法种类众多,应用领域广泛,如何选择和使用最佳的证据合成方法是研究人员、政策制定者和其他利益相关者普遍关注的问题。本文在归纳与总结证据合成方法发展现状和分类的基础上,阐述证据合成方法的定义、特点及应用中存在的问题,并就证据合成方法应用中面临的问题与挑战提出思考与建议。Abstract: Evidence synthesis is the synthesis of existing research using a systematic and appropriate method. Various types of evidence synthesis are currently in use. Correctly choosing and applying the best evidence synthesis method is crucial for researchers, policymakers, and stakeholders. Thus, based on summarizing the current situation, progress, and classification of evidence synthesis methods, we introduced the definition and characteristics of common evidence synthesis methods and problems in their application, and presented thoughts and suggestions for the problems in the application of evidence synthesis methods.
-
Keywords:
- evidence synthesis /
- methodology /
- current situation and progress
-
国际癌症研究机构发布的2020年全球癌症统计数据显示,乳腺癌已成为女性最高发的恶性肿瘤(新增病例在所有肿瘤中占比11.7%),每年可导致68.5万病例死亡[1]。准确诊断是精准治疗的前提。Ki-67是乳腺癌诊断过程中常用的免疫组化标志物,是评估肿瘤细胞增殖活性的关键指标,Ki-67指数可作为乳腺肿瘤良恶性及其恶性程度的辅助诊断指标。一般情况下,乳腺癌的Ki-67指数高于10%,随Ki-67指数升高,肿瘤生长加快、组织分化能力降低,患者预后较差[2]。
目前临床工作中,Ki-67指数大多需病理医生通过显微镜对肿瘤细胞进行人工计数获得[3];部分研究通过浏览整张免疫组化染色的全视野数字图像(whole slide image, WSI),采用视觉评估法计算Ki-67指数[2]。上述方法工作量大、效率低、准确率差且具有主观性。2019年10月,国际乳腺癌Ki-67工作组(International Ki-67 in Breast Cancer Working Group,IKWG)召开会议, 讨论了Ki-67免疫组化检测在乳腺癌诊断与治疗中的应用现状[4],指出基于机器学习的自动化评估可能有助于解决当前Ki-67免疫组化判读中的难题[2, 4-5]。当前,深度学习在病理图像处理领域已取得了显著成效[6-8],自动化评估Ki-67指数亦取得重要进展。根据病理图像的处理方式,大致可分为两类:一类是基于图像处理技术,一类是基于机器学习和神经网络。Xing等[9]提出了一种基于全卷积网络的KiNet模型,对Ki-67细胞核进行检测和识别,并在胰腺神经内分泌肿瘤数据集中得到了良好的分类效果验证,曲线下面积(area under the curve, AUC)为0.724。Negahbani等[10]利用点标注的方式制作了SHIDC-B-Ki-67数据集,并提出一种用于Ki-67细胞检测和分类的模型,对免疫阳性细胞、免疫阴性细胞和淋巴细胞检测和分类的精确度为77.66%。Shete等[11]将基于染色强度的阈值化和分水岭分割方法相结合,依据细胞染色区域面积、细胞形态学特征、纹理特征等实现了对乳腺肿瘤细胞恶性程度自动化检测。Ko等[12]对图像进行染色归一化,分离染色区域后实现重叠细胞核分离,改善了不同实验室或环境中由染色变化引起的图像处理问题。但上述研究均是在单个图块上对Ki-67指数进行定量分析,并将部分区域定量分析的结果代替整张WSI的Ki-67指数。本研究提出一种智能化定量分析Ki-67指数的方法,可识别整张WSI中的Ki-67指数,提高Ki-67指数评估的准确性和客观性。
1. 材料与方法
1.1 研究材料与数据集分组
回顾性纳入2020年1— 12月北京协和医院乳腺癌患者的病理切片。纳入标准:根据组织病理和免疫组化结果,确诊为乳腺浸润性癌;排除标准:切片质量不合格。
采用德国Leica公司Aperio AT2高通量切片扫描仪将病理切片以40倍率扫描为WSI图像。由2名病理科医生根据2019年IKWG制定的指南[4]对所有WSI中的Ki-67指数进行人工判读后,按5:8的比例随机将WSI图像分为A、B两个数据集。2名病理科医生选取WSI中Ki-67阳性肿瘤细胞最集中且分布均匀的区域(热点区域,图 1)对A数据集进行标注,用于WSI热点区域识别模型训练与测试;B数据集用于评估模型对Ki-67指数计算结果的准确性,并采用Bland-Altman法[13]对人工判读与智能定量分析结果进行一致性评价。
本研究已通过北京协和医院伦理审查委员会审批(审批号:S-K311),并豁免患者知情同意。
1.2 方法
1.2.1 整体研究框架
本研究提出的Ki-67指数智能化定量分析方法主要包括2个部分(图 2):(1)提出一种融合空间和多尺度特征的高精度乳腺癌WSI热点区域识别模型;(2)在识别出的热点区域内,40倍视野下随机选取每张WSI的10个视野进行自动细胞识别、分类、计数,计算10个视野下的Ki-67指数均值,为整张WSI的Ki-67指数。
1.2.2 图像预处理
由于WSI制作、扫描过程中可因抖动、电子脉冲干扰等因素的影响,导致图像失真、模糊,在分析前需进行预处理。结合实际情况和预试验比较结果,借助Opencv-Python库并采用高斯滤波对图像进行去噪、平滑图像、去除空白背景等处理[14]。由于在HSV(Hue, Saturation, Value)颜色空间中分析更方便,首先根据公式(1)将原始图像从RGB颜色空间转换至HSV颜色空间,然后基于Otsu算法[15]获取二值化的组织掩码,并进行形态学开闭运算,提取组织区域图像。
$$ \left\{\begin{array}{l} V=\max (R, G, B) \\ S=\frac{\max (R, G, B)-\min (R, G, B)}{\max (R, G, B)} \\ H=\left\{\begin{array}{l} 60 \times \frac{G-B}{S \times V}, \text { 如果 } S \neq 0, \text { 且 } \max (R, G, B)=R \\ 60 \times\left(2+\frac{B-R}{S \times V}\right), \text { 如果 } S \neq 0, \text { 且 } \max (R, G, B)=G \\ 60 \times\left(4+\frac{R-G}{S \times V}\right), \text { 如果 } S \neq 0, \text { 且 } \max (R, G, B)=B \end{array}\right. \end{array}\right. $$ (1) 其中,R、G、B分别表示红色、绿色、蓝色,取值范围均为[0, 255];H为色调,取值范围为[0, 1];V为明度,取值范围为[0, 255]。
1.2.3 提取热点区域掩码与图块
按7:1:2的比例将A数据集随机分为训练集、验证集和测试集。采用ASAP(Automated Slide Analysis Platform) 软件对热点区域进行标注,然后提取热点区域掩码图像。用组织区域图像减去热点区域即可获取正常区域掩码图像。在2种图像内部,将原始WSI图像于40倍视野下随机裁剪为2000个512×512像素的图块(patch)。在上述图块中随机选取50个,对其中的Ki-67阳性肿瘤细胞、阴性肿瘤细胞和非肿瘤细胞进行标注(Ki-67指数的计算仅包括肿瘤细胞,若不排除非肿瘤细胞,Ki-67指数将偏低),见图 3。标注后,计算Ki-67指数[16]。
1.2.4 热点区域识别
WSI可完全保留病理切片上的原始组织特征信息,对于数据量巨大且缺乏像素级的标注,病理医生可通过缩放、拖拽、平移图像的方式浏览整张WSI图像。在作出诊断决策时,需同时考虑单个区域相邻的信息和不同区域之间的相关性信息,最后确定整张WSI图像的Ki-67指数[8]。常用的病理图像分类深度学习方法,一般是将一张数万×数万像素的WSI切分为数万张图块,通过病理医生对热点区域的粗标注引入医学先验知识[17],此时数万张图块对应一个标签,然后采用VGG[18]、ResNet[19]、MobileNet[20]等卷积神经网络模型对图块进行分类[21]。此种分类方法会导致图块在整张WSI图像中的空间位置信息丢失,无法融合相邻图块的信息和空间位置信息。
针对该问题,本研究采用一种融合空间和多尺度特征的乳腺癌WSI热点区域识别方法,即条件随机场模型[22](图 4A)。条件随机场模型是Lafferty等[23]于2001年提出的将最大熵模型和隐马可夫模型相结合的一种概率无向图模型。该模型在自然语言处理中的命名实体识别任务以及计算机视觉中的图像分割任务等领域均有广泛应用。
在概率无向图模型中,随机变量之间的关系较直观,易于理解。在实际应用时,目的是计算联合概率分布。为简化计算,假设将WSI中的图块设置为X1、X2、X3…Xn,若一个图块为热点区域,则其相邻图块为热点区域的概率很大(图 4B)。进一步对图块的关系简化(图 4C),并根据公式(2)计算模型的联合概率分布。
$$ \begin{aligned} P\left(x_{1}, x_{3}, x_{4}\right)=& \frac{1}{Z(x)}\left[\psi_{1}\left(X_{1}, X_{3}\right) \times \psi_{2}\left(X_{3}, X_{4}\right)\right.\\ &\left.\times \psi_{2}\left(X_{1}, X_{4}\right)\right] \end{aligned} $$ (2) 1.2.5 模型构建与相关参数设置
经图像预处理获取热点区域和正常组织区域的图块后,将训练集和验证集图块输入至ResNet34预训练模型[19]进行特征提取。每个图块被编码为固定长度的Embedding,作为概率无向图模型中的节点进行空间特征维度建模。模型可输出每个图块的位置分布概率,用以判定特定图块是否位于热点区域。高精度乳腺癌WSI热点区域识别模型框架见图 5。
图 5 乳腺癌WSI热点区域识别模型整体框架图WSI: 同图 2硬件参数:Linux版本为CentOS 3.10.0~693.el7.x86_ 64,CPU版本为Intel(R)Xeon(R) Silver 4114 @ 2.20 GHz,显卡为NVIDIA GeForce RTX 2080 Ti(显存容量11 GB,显存位宽352 b,显存频率14 000 MHz),内存为32GB 2666 MHz DDR4。软件环境:编程语言为Python 3.6.5,相关的深度学习框架为Torch,CUDA及cuDNN环境分别为10.0和7.4,CPU环境运行下的编译器为GCC 4.8。Python计算包:Torchvision 0.4.2,Opencv-Python 4.5.1.48,Openpyxl 3.0.9,Openslide-Python1.1.2。模型训练时的参数:Batch Size为32,优化器为Adam,学习率为0.001,损失函数为Cross Entropy,Epoch为30。
1.2.6 热点区域识别与肿瘤细胞自动计数
WSI输入经过训练的ResNet34热点区域识别模型,获取热点区域概率热力图,其中概率高于0.5的区域认定为热点区域。在热点区域内,40倍视野下随机选取10个视野进行Ki-67指数计算。首先对输入的RGB图像进行预处理,然后按照公式(3)将RGB值转换成光密度(optical density, OD)空间:
$$ O D=-\log 10\left(\frac{I}{I_{0}}\right) $$ (3) 其中,I为RGB空间的颜色矢量,$\frac{I}{I_{0}}$为其归一化后的结果,即标准化OD矩阵[24],取值范围为[0, 1]。OD矩阵的逆矩阵即为所需的反卷积矩阵。Ki-67免疫组化染色图像中感兴趣的颜色为蓝色(H)和棕色(DAB),其中棕色由黄色或橙色(红色+绿色)与较低比例的黑色或蓝色混合组成。由于棕色的主要成分为红色和绿色,与H相关的颜色以蓝色为主,因此可采用颜色反卷积法[25]分离、区分DAB和H染色。由于细胞之间存在重叠现象,需采用基于距离变换的分水岭算法对颜色反卷积法获取的二值化图像进行处理,具体算法如下:首先将颜色反卷积后的图像转换为灰度图并进行开闭操作,以消除边界上的干扰;然后对灰度图进行距离变换,将粘连的细胞“打断”;最后进行膨胀和填充等操作,采用基于连通分量的方法分别对Ki-67阳性肿瘤细胞、Ki-67阴性肿瘤细胞和非肿瘤细胞进行自动标记和计数,计算Ki-67指数(图 6)。
1.3 统计学处理
采用SPSS 23.0软件进行统计学分析。以病理科医生人工判读结果为金标准,计算模型对热点区域识别的准确率以及识别的Ki-67指数误差,误差在±0.2之间视为模型计算结果正确。采用Bland-Altman法评价人工判读和模型计算Ki-67指数的一致性。
2. 结果
2.1 数据集
共入选符合纳入和排除标准的乳腺癌患者病理切片132张。其中A数据集50张(训练集、验证集和测试集WSI图像分别35张、5张、10张,分别包含图块70 000个、10 000个、20 000个),B数据集82张。
2.2 热点区域智能化识别结果
训练后的ResNet34模型对测试集热点区域识别的平均准确率为81.5%。热点区域可视化结果见图 7。
2.3 Ki-67指数定量结果
在热点区域识别的基础上,模型可根据选取的视野,自动对细胞进行分类、计数(图 8),最终计算整张WSI中的Ki-67指数。以病理科医生人工判读结果为金标准,本研究该模型对B数据集82张切片Ki-67指数计算准确率为90.2%(74/82)。
2.4 Ki-67指数一致性评价
采用Bland-Altman法对人工判读与模型计算的Ki-67指数进行一致性评价。Bland-Altman法的基本思想是以原始数据的均值、差值分别为横轴、纵轴绘制散点图,计算二者差值的均数(d)及标准差(SD),并得出95%一致性界限(limits of agreement, LOA),即一致性较好的标准为95%的差值位于该LOA内。
如图 9所示,82个Ki-67指数差值中,78个(95.12%)位于LOA范围内,4个(4.88%)位于LOA范围外,d =-0.033 90,SD为0.161 882, 标准误为0.01,LOA范围为-0.3460~ 0.2831。两种方法测定的Ki-67指数结果一致性较好[24]。
3. 讨论
乳腺癌免疫组化Ki-67指数在治疗方案制订和预后风险评估中占据重要地位,临床意义显著。目前在临床工作中,人工判读Ki-67指数工作量大,结果具有主观性,亟需探寻一种高效、易操作且准确率高的Ki-67指数评估方法。本研究基于ResNet34算法,首次构建针对乳腺癌WSI图像可自动识别并输出Ki-67指数的智能化判读系统,结果显示该方法对Ki-67指数计算结果的准确率为90.2%,与人工判读结果一致性较好,有望应用于临床,辅助临床决策。
组织病理是肿瘤确诊的金标准,病理科医生通过对病理切片进行观察,可为肿瘤诊断提供最重要的依据。免疫组化是组织病理学与细胞病理学的关键组成部分,在肿瘤诊断、分子分型、精准治疗等方面均具有极大的影响力,但实际应用过程中,受判读区域选择、计数细胞总和、计数方法等因素的影响,其结果准确性、可重复性方面仍存在诸多挑战。近年来,人工智能技术快速崛起,其在医学中的应用越来越广泛,医工结合、医工交叉已成为研究的新趋势[26]。但既往主要针对病理图像的图块进行研究,尚缺乏直接可识别整张WSI图像中Ki-67指数的方法[9-12]。本研究基于深度学习技术建立的整张WSI图像中Ki-67指数智能定量方法,在判读区域选择、计数细胞总和、计数方法3个方面均有明显改进,在保障了Ki-67指数判读结果的高准确率和可重复性的同时,可快速(识别一张WSI图像平均耗时60 s)输出结果,优势明显。
3.1 判读区域选择
由于肿瘤细胞具有较高的异质性,在乳腺癌免疫组化WSI图像中,Ki-67阳性肿瘤细胞多呈不均匀分布,存在明显的热点区域、冷点区域和边缘区域,不同区域内的Ki-67指数存在较大差异,其中以热点区域最高,边缘区域次之,冷点区域最低。因此,判读区域选取不同,必然导致Ki-67指数判读结果不一致,影响结果的准确性。IKWG建议,乳腺癌Ki-67指数免疫组化WSI中,若存在热点区域,则判读区域应选择在热点区域内[26]。本研究建立的融合空间和多尺度特征的高精度乳腺肿瘤WSI热点区域识别模型,对热点区域具有较高的识别能力(平均准确率为81.5%)且速度较快,结果重复性好,是Ki-67指数计算结果具有高准确率的前提和重要保障。
3.2 计数细胞总和
判读区域选定后,需对区域内细胞进行识别与分类,以计算Ki-67指数。对于细胞较少的区域,Ki-67指数判读结果稳定性差。部分国家的指南指出,应在热点区域计数200个肿瘤细胞进行Ki-67指数判读[27]。IKWG建议,免疫组化Ki-67指数定量分析中,每个区域内以计数1000个肿瘤细胞为宜,至少不应低于500个肿瘤细胞。本研究Ki-67指数智能化量系统在计算Ki-67指数前,首先对区域内肿瘤细胞进行计数,若Ki-67阳性肿瘤细胞数量不足500个,则需重新选择判读区域,因此保障了结果的准确性、稳定性和客观性。
3.3 计数方法
显微镜下人工阅片对肿瘤细胞进行分类,易发生“误数”或“漏数”的现象,导致计算结果不准确。本研究构建的模型可程序化自动分类与计数,不仅结果准确(准确率为90.2%)、省时高效,且避免主观因素的影响。Bland-Altman法一致性评价结果显示,人工判读与模型计算Ki-67指数的一致性良好,提示该智能定量方法对Ki-67指数判读结果的误差较小,可达到人工阅片水平,再次验证了其具有准确性高和可重复性好的优势。
本研究局限性:(1)受限于样本量,虽然模型对Ki-67指数的评估具有较高的准确性,但模型仍可能存在过拟合现象;(2)缺乏多中心数据对模型的性能进行外部验证。
综上,本研究提出的融合空间和多尺度特征的乳腺癌免疫组化Ki-67指数智能定量分析方法,可快速、准确、客观对Ki-67指数进行判读,辅助病理科医生完成乳腺癌诊断,提升了工作效率,为乳腺癌患者进行精准分子分型和个体化治疗提供科学可信的理论依据和技术支持。
作者贡献:苏仁凤、玉炫负责资料搜集、整理分析并撰写论文初稿;史乾灵、罗旭飞、孙雅佳、兰慧、任梦娟、吴守媛、王平、王玲、赵俊贤负责论文初稿修订;陈耀龙负责论文选题、结构设计、团队组建、质量控制及审校。利益冲突:所有作者均声明不存在利益冲突 -
表 1 证据合成领域的重要事件
年份 重要事件 1753 Lind首次提出研究合成在减少偏倚中的重要性[5] 1904 Karl最早使用Meta分析对接种伤寒疫苗与死亡率的相关性进行分析[7] 1972 Cochrane发表《疗效与效益:健康服务中的随想》,提出应对随机对照试验进行系统评价[8] 1976 Glass正式提出Meta分析的概念及其统计分析方法[9] 1977 Glass和Smith最早在社会科学领域使用Meta分析[10] 1992 Chalmers在英国牛津成立首个Cochrane中心 1993 Cochrane协作网在英国牛津正式成立,旨在为临床治疗实践和医疗卫生决策提供科学依据 1999 Moher等最早提出QUOROM(Quality of Reporting of Meta-analyses)声明,旨在提高随机对照试验Meta分析的报告质量[11] 2000 Campbell协作网在宾西法尼亚大学正式成立,旨在为非医学领域提供系统评价证据 2004 GRADE工作组在BMJ发表《如何针对研究合成的结论进行分级》的方法学文章[12] 2009 Moher等更新了QUOROM声明,并将其更名为PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-analyses)[13] 2010 Research Synthesis Methods创刊,是国际上首本关于研究合成方法的学术杂志 2011 英国国家健康研究所(National Institute for Health Research)下设的评价和传播中心(Centre for Reviews and Dissemination)建立PROSPERO注册平台,为全球系统评价提供免费注册 2011 美国医学科学院将系统评价写入指南新定义[14] 2012 Systematic Review创刊,是国际上首本专门发表系统评价及其研究方法的学术杂志 2020 证据合成国际网络发布立场声明,提出证据合成国际网络的9项核心原则和5个主要目标[6] 表 2 证据合成方法及其与系统评价的区别和联系
证据合成方法 其他术语 定义 特征及其与系统评价的区别和联系 系统评价 (systematic review) 系统综述 通过系统检索某一主题的所有相关研究,按照纳排标准进行文献筛选,对纳入研究进行严格的偏倚风险和证据质量评价,并对各研究结果进行定量合成或定性客观评价,以对拟解决的问题进行系统总结的方法[18] 相较于其他证据合成方法,系统评价在方法学上更具透明性、可重复性、系统性和可更新性,但在其制作的各步骤中均可能产生偏倚,如检索文献不全导致抽样偏倚、文献筛选出现选择偏倚等[19] 快速评价 (rapid review) 快速综述、快速评估 通过加速或简化系统评价的制作流程,以在短时间内为决策者作出紧急决策提供信息[20-21] 虽然快速评价与系统评价在制作流程上存在相似之处,但其制作周期更短,决策者常将其用于突发事件或需快速作出反应的决策中[22]。简化检索策略、限制灰色文献数量、仅提取关键变量,以及进行简单的质量评价等均可缩短快速评价的制作时间,但易增加偏倚风险,如限制检索时间导致发表偏倚、限制质量评价导致研究结果可信度降低等[23] 概况性评价 (scoping review) 范围综述、范围审查、概况性综述 通过系统检索初步评估文献的潜在规模和范围的方法[24],倾向于关注研究的广度而非深度 与系统评价相似,概况性评价同样遵循系统的检索流程,但二者关注的研究目的不同。系统评价倾向于解决具体的研究问题,而概况性评价主要用于识别特定领域的证据类型、确定文献的关键概念或定义、识别研究差距,为系统评价提供依据等[24]。由于通常不对文献的方法学质量进行评价,其结果易存在偏倚,因此不建议用于政策制定[23] 证据地图 (evidence map/mapping review/systematic map) 证据图谱、证据图 通过对相关领域现有证据进行系统检索,以确定研究空白和未来研究需求,并以表格或图形直观呈现结果的方法[25],有助于判断是否进一步开展系统评价 相较于系统评价,证据地图侧重于呈现某个领域研究的整体情况,而不进行深入分析。证据地图仅对纳入研究进行描述性分析,易导致结果过度简化,掩盖研究与结果间的异质性。由于其通常不对纳入研究进行质量评价,研究结论的可靠性较差[23] 系统评价再评价 (overview of review) 伞型评价、元评价 通过全面收集拟解决问题的多个相关系统评价进行综合研究的方法[26] 有助于解决多个系统评价结果或结论不一致的问题,可为决策者和使用者提供更为集中的高质量证据,但其结论可靠性受纳入研究质量的影响 动态系统评价 (living syste-matic review) / 通过定期更新以实时纳入最新相关研究的系统评价[27],对提高结果的准确性、时效性与适用性发挥重要作用 相较于传统系统评价,动态系统评价的可持续性更新将带来额外的工作量,需要稳定的团队进行持续性制作。更新系统评价可能涉及数据的重新分析,易增加Ⅰ类错误(即假阳性错误)的发生风险[28]。其主要特点在于保证系统评价结果的时效性、准确性和临床适用性 元民族志 (meta-ethnography) Meta民族志、元人种学、元人种志 通过对比分析原始研究的核心概念以产生新知识、新理解和新发现的解释性方法[29] 与系统评价注重检索的全面性不同,元民族志采用目的性抽样进行资料收集,直至达到理论饱和。作为定性研究证据合成的常用方法,元民族志的特点在于不局限于既定框架,可根据纳入研究的主题进行合成,对发展理论体系、理论框架和高阶模型具有重要意义[30] 主题综合 (thematic synthesis) 主题合成、主题集成 是一种基于主题分析合成原始研究的解释性方法[31]。主题综合涉及三个阶段:第一阶段是对单个研究结果逐行自由编码;第二阶段是应用自由编码构建“描述性主题”;第三阶段是形成“分析性主题”[31] 相较于系统评价,主题综合更能反映定性研究结果的主题观点。主题综合结合了扎根理论和元民族志的方法,主要取决于研究人员的经验和理论知识,易受研究人员的主观影响,但也更易被理解和接受,在定性研究证据合成中较为常用 框架综合 (framework synthesis) 框架合成、框架集成 采用预先建立的框架提取和合成结果的高度结构化方法,其中预先框架由背景材料和团队讨论形成[32] 与系统评价及其他证据合成方法不同,框架综合采用预先建立的框架提取和合成结果,其在很大程度上是一种演绎方法。该方法最初仅用于定性研究,但有学者认为此方法适用于所有研究类型[33] 扎根理论 (grounded theory) / 通过系统收集、分析与归纳相关研究以产生更高层次理论的方法[34],包括三种流派,分别为原始扎根理论、程序化扎根理论和建构型扎根理论[35] 与系统评价相对线性的过程不同,扎根理论需不断迭代和深入,对数据进行反复分析和解释。扎根理论能够从经验数据中建构新的概念和理论,而非仅对其进行描述[35]。比较是贯穿扎根理论整个研究过程的分析思路,其中常数比较法最为常见[36]。在扎根理论编码过程中,研究人员需警惕资料过度切割与碎片化,导致无法产生更高层次的理论 /:无其他术语 表 3 证据合成方法研究报告规范汇总
序号 报告规范 发表年份 条目数量
(个)适用研究类型 适用范围 1 PRISMA 2009[45] 2009 27 系统评价和Meta分析 全文 2 PRISMA-Equity[46] 2012 27 公平性系统评价和Meta分析 全文 3 PRISMA-Abstracts[47] 2013 12 系统评价和Meta分析 摘要 4 PRISMA-NMA[48] 2015 27 网状Meta分析 全文 5 PRISMA-IPD[49] 2015 27 单个病例数据系统评价和Meta分析 全文 6 PRISMA-P[50] 2015 17 系统评价和Meta分析计划书 全文 7 PRISMA-Harms[51] 2016 27 系统评价和Meta分析 危害/不良反应/安全性数据 8 PRISMA-CI[52] 2017 33 复杂干预系统评价和Meta分析 全文 9 PRISMA-ScR[53] 2018 22 概况性评价 全文 10 PRISMA-DTA[54] 2018 27 诊断准确性试验系统评价和Meta分析 全文 11 PRISMA-A[55] 2019 27 针灸系统评价和Meta分析 全文 12 PRISMA-M[56] 2020 27 艾灸系统评价和Meta分析 全文 13 PRISMA-CHM[57] 2020 24 中草药系统评价和Meta分析 全文 14 PRISMA 2020[58] 2021 27 系统评价和Meta分析 全文 15 PRISMA-S[59] 2021 16 系统评价和Meta分析 方法 16 PRISMA-DTA for Abstracts[60] 2021 12 诊断准确性试验系统评价和Meta分析 摘要 17 PRISMA-EcoEvo[61] 2021 27 生态学和进化生物学系统评价和Meta分析 全文 18 PRISMA-ATCM[62] 2022 27 中医药领域动物实验系统评价和Meta分析 全文 19 RAMESES: meta-narrative reviews[63] 2013 20 元叙事 全文 20 RAMESES: realist syntheses[64] 2013 19 现实主义综合 全文 21 ENTREQ[65] 2012 21 定性合成研究 方法/讨论 22 PRIO-harms[66] 2018 27 系统评价再评价 危害/不良反应/安全性数据/全文 23 eMERGe[67] 2019 19 元民族志 全文 24 SwiM[68] 2020 9 无Meta分析的系统评价 方法/结果/讨论 25 PRIOR[69] 2022 27 系统评价再评价 全文 PRISMA:系统评价和Meta分析的优先报告条目;PRISMA-Equity:公平性系统评价和Meta分析的优先报告条目;PRISMA-NMA:网状Meta分析的优先报告条目;PRISMA-Abstracts:系统评价和Meta分析摘要的优先报告条目;PRISMA-IPD:单个病例数据系统评价和Meta分析的优先报告条目;PRISMA-P:系统评价和Meta分析研究计划书的优先报告条目;PRISMA-Harms:PRISMA危害报告清单:改进系统评价中危害的报告;PRISMA-CI:复杂干预系统评价和Meta分析报告规范;PRISMA-ScR:概况性评价的优先报告条目;PRISMA-DTA:诊断准确性试验系统评价和Meta分析的优先报告条目;PRISMA-A:针灸系统评价和Meta分析的优先报告条目;PRISMA-M:艾灸系统评价和Meta分析报告规范;PRISMA-CHM:中草药系统评价和Meta分析报告规范;PRISMA-S:系统评价和Meta分析文献检索的优先报告条目;PRISMA-DTA for Abstracts:诊断准确性试验系统评价和Meta分析摘要的优先报告条目;PRISMA-EcoEvo:生态学和进化生物学系统评价和Meta分析的优选报告条目;PRISMA-ATCM:中医药领域动物实验系统评价报告规范;RAMESES: meta-narrative reviews:元叙事报告规范;RAMESES:realist syntheses:现实主义综合报告规范;ENTREQ:提高定性合成研究报告透明度声明;PRIO-harms:系统评价再评价危害报告清单;eMERGe:元民族志报告规范;SwiM:无Meta分析的系统评价报告规范;PRIOR:系统评价再评价的优先报告条目 -
[1] Graham ID, Logan J, Harrison MB, et al. Lost in knowledge translation: time for a map?[J]. J Contin Educ Health Prof, 2006, 26: 13-24. DOI: 10.1002/chp.47
[2] Munn Z, Tufanaru C, Aromataris E. JBI's systematic reviews: data extraction and synthesis[J]. Am J Nurs, 2014, 114: 49-54.
[3] Munn Z, Stern C, Aromataris E, et al. What kind of systematic review should I conduct?A proposed typology and guidance for systematic reviewers in the medical and health sciences[J]. BMC Med Res Methodol, 2018, 18: 1-9. DOI: 10.1186/s12874-017-0458-6
[4] Clarke M. History of evidence synthesis to assess treatment effects: Personal reflections on something that is very much alive[J]. J R Soc Med, 2016, 109: 154-163. DOI: 10.1177/0141076816640243
[5] Lind J. A Treatise on the Scurvy[M]. London: A Millar in the Strand, 1757.
[6] Gough D, Davies P, Jamtvedt G, et al. Evidence Syn-thesis International(ESI): Position Statement[J]. Syst Rev, 2020, 9: 1-9. DOI: 10.1186/s13643-019-1259-2
[7] Pearson K. Report on certain enteric fever inoculation statistics[J]. BMJ, 1904, 3: 1243-1246.
[8] Cochrane AL. Effectiveness and Efficiency: Random Reflections on Health Services[M]. London: Nuffield Provincial Hospitals Trust, 1972.
[9] Glass GV. Primary, secondary, and meta-analysis of research[J]. Edu Res, 1976, 5: 3-8.
[10] Smith ML, Glass GV. Meta-analysis of psychotherapy outcome studies[J]. Am Psychol, 1977, 32: 752-760. DOI: 10.1037/0003-066X.32.9.752
[11] Moher D, Cook DJ, Eastwood S, et al. Improving the quality of reports of meta-analyses of randomised controlled trials: the QUOROM statement. Quality of Reporting of Meta-analyses[J]. Lancet, 1999, 354: 1896-1900. DOI: 10.1016/S0140-6736(99)04149-5
[12] Atkins D, Best D, Briss PA, et al. Grading quality of evidence and strength of recommendations[J]. BMJ, 2004, 328: 1490. DOI: 10.1136/bmj.328.7454.1490
[13] Moher D, Liberati A, Tetzlaff J, et al. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement[J]. Ann Intern Med, 2009, 151: 264-269. DOI: 10.7326/0003-4819-151-4-200908180-00135
[14] Institute of Medicine. Clinical practice guidelines we can trust[M]. Washington DC: National Academies Press, 2011.
[15] Xiao Y, Watson M. Guidance on Conducting a Systematic Literature Review[J]. J Plan Educ Res, 2019, 39: 93-112. DOI: 10.1177/0739456X17723971
[16] Dixon-Woods M, Agarwal S, Young B, et al. Integrative approaches to qualitative and quantitative evidence[M]. London: Health Development Agency, 2004.
[17] Petticrew M, Rehfuess E, Noyes J, et al. Synthesizing evidence on complex interventions: how meta-analytical, qualitative, and mixed-method approaches can contribute[J]. J Clin Epidemiol, 2013, 66: 1230-1243. DOI: 10.1016/j.jclinepi.2013.06.005
[18] 杨克虎, 李秀霞, 拜争刚. 循证社会科学研究方法: 系统评价与Meta分析[M]. 兰州: 兰州大学出版社, 2018. [19] 周旭毓, 方积乾. Meta分析的常见偏倚[J]. 循证医学, 2002: 216-220. https://www.cnki.com.cn/Article/CJFDTOTAL-YEBM200204012.htm [20] 田金徽. 证据生态系统中证据合成与转化研究方法进展与挑战[J]. 中国药物评价, 2022, 39: 1-10. https://www.cnki.com.cn/Article/CJFDTOTAL-YAPJ202201001.htm [21] Khangura S, Konnyu K, Cushman R, et al. Evidence summaries: the evolution of a rapid review approach[J]. Syst Rev, 2012, 1: 1-9. DOI: 10.1186/2046-4053-1-1
[22] Hamel C, Michaud A, Thuku M, et al. Defining Rapid Reviews: a systematic scoping review and thematic analysis of definitions and defining characteristics of rapid reviews[J]. J Clin Epidemiol, 2021, 129: 74-85. DOI: 10.1016/j.jclinepi.2020.09.041
[23] Grant MJ, Booth A. A typology of reviews: an analysis of 14 review types and associated methodologies[J]. Health Info Libr J, 2009, 26: 91-108. DOI: 10.1111/j.1471-1842.2009.00848.x
[24] Munn Z, Peters MDJ, Stern C, et al. Systematic review or scoping review?Guidance for authors when choosing between a systematic or scoping review approach[J]. BMC Med Res Methodol, 2018, 18: 143. DOI: 10.1186/s12874-018-0611-x
[25] Miake-Lye IM, Hempel S, Shanman R, et al. What is an evidence map?A systematic review of published evidence maps and their definitions, methods, and products[J]. Syst Rev, 2016, 5: 28. DOI: 10.1186/s13643-016-0204-x
[26] Cochrane Training. Cochrane Handbook for Systematic Reviews of Interventions[M/OL]. (2022-08-04)[2023-02-08]. https://training.cochrane.org/handbook.
[27] Elliott JH, Turner T, Clavisi O, et al. Living systematic reviews: an emerging opportunity to narrow the evidence-practice gap[J]. PLoS Med, 2014, 11: e1001603. DOI: 10.1371/journal.pmed.1001603
[28] Simmonds M, Salanti G, McKenzie J, et al. Living systematic reviews: 3. Statistical methods for updating meta-analyses[J]. J Clin Epidemiol, 2017, 91: 38-46. DOI: 10.1016/j.jclinepi.2017.08.008
[29] Noblit GW, Hare RD, Hare RD. Meta-ethnography: Synthesizing qualitative studies[M]. California: Sage Publications, 1988.
[30] 张静怡, 张雅婷, 盖琼艳, 等. 定性资料的系统评价方法学汇总[J]. 中国循证心血管医学杂志, 2017, 9: 523-527. https://www.cnki.com.cn/Article/CJFDTOTAL-PZXX201705006.htm [31] Thomas J, Harden A. Methods for the thematic synthesis of qualitative research in systematic reviews[J]. BMC Med Res Methodol, 2008, 8: 45. DOI: 10.1186/1471-2288-8-45
[32] 刘雪寒, 鲁春丽, 郑偌祥, 等. 定性研究的综合方法概述及其在医学中的应用进展[J]. 世界中医药, 2021, 16: 3093-3099. https://www.cnki.com.cn/Article/CJFDTOTAL-SJZA202120024.htm [33] Barnett-Page E, Thomas J. Methods for the synthesis of qualitative research: a critical review[J]. BMC Med Res Methodol, 2009, 9: 59. DOI: 10.1186/1471-2288-9-59
[34] Bowen GA. Grounded theory and sensitizing concepts[J]. Int J Qual Meth, 2006, 5: 12-23. DOI: 10.1177/160940690600500304
[35] 于兆吉, 张嘉桐. 扎根理论发展及应用研究评述[J]. 沈阳工业大学学报(社会科学版), 2017, 10: 58-63. https://www.cnki.com.cn/Article/CJFDTOTAL-SHES201701009.htm [36] Dixon-Woods M, Agarwal S, Jones D, et al. Synthesising qualitative and quantitative evidence: a review of possible methods[J]. J Health Serv Res Policy, 2005, 10: 45-53. DOI: 10.1177/135581960501000110
[37] Schick-Makaroff K, MacDonald M, Plummer M, et al. What Synthesis Methodology Should I Use?A Review and Analysis of Approaches to Research Synthesis[J]. AIMS Public Health, 2016, 3: 172-215. DOI: 10.3934/publichealth.2016.1.172
[38] Cochrane Collaboration. Cochrane handbook for systematic reviews of diagnostic test accuracy (v2.0)[M/OL]. [2023-02-08]. https://methods.cochrane.org/sdt/handbook-dta-reviews.
[39] Sandelowski M, Barroso J. Handbook for synthesizing qualitative research[M]. New York: Springer Publishing Company, 2006.
[40] JBI. JBI Manual for Evidence Synthesis[M/OL]. [2023-02-08]. https://jbi-global-wiki.refined.site/space/MANUAL.
[41] Jeffrey CV, Larry VH, Harris C. The handbook of research synthesis and meta-analysis[M]. New York: Russell Sage Foundation, 2019.
[42] Paré G, Trudel MC, Jaana M, et al. Synthesizing information systems knowledge: A typology of literature reviews[J]. Inf Manage, 2015, 52: 183-199. DOI: 10.1016/j.im.2014.08.008
[43] Cronin P, Ryan F, Coughlan M. Undertaking a literature review: a step-by-step approach[J]. Br J Nurs, 2008, 17: 38-43. DOI: 10.12968/bjon.2008.17.1.28059
[44] 国家市场监督管理总局, 中国国家标准化管理委员会. 术语工作原则与方法: GB/T 10112-2019[S]. 北京: 中国标准出版社, 2019. [45] Moher D, Liberati A, Tetzlaff J, et al. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement[J]. PLoS Med, 2009, 6: e1000097. DOI: 10.1371/journal.pmed.1000097
[46] Welch V, Petticrew M, Tugwell P, et al. PRISMA-Equity 2012 Extension: Reporting Guidelines for Systematic Reviews with a Focus on Health Equity[J]. PLoS Med, 2012, 9: e1001333. DOI: 10.1371/journal.pmed.1001333
[47] Beller EM, Glasziou PP, Altman DG, et al. PRISMA for Abstracts: Reporting Systematic Reviews in Journal and Conference Abstracts[J]. PLoS Med, 2013, 10: e1001419. DOI: 10.1371/journal.pmed.1001419
[48] Hutton B, Salanti G, Caldwell DM, et al. The PRISMA Extension Statement for Reporting of Systematic Reviews Incorporating Network Meta-analyses of Health Care Interventions: Checklist and Explanations[J]. Ann Intern Med, 2015, 162: 777-784. DOI: 10.7326/M14-2385
[49] Stewart LA, Clarke M, Rovers M, et al. Preferred Reporting Items for Systematic Review and Meta-Analyses of individual participant data: the PRISMA-IPD Statement[J]. JAMA, 2015, 313: 1657-1665. DOI: 10.1001/jama.2015.3656
[50] Moher D, Shamseer L, Clarke M, et al. Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols(PRISMA-P)2015 statement[J]. Syst Rev, 2015, 4: 1. DOI: 10.1186/2046-4053-4-1
[51] Zorzela L, Loke YK, Ioannidis JP, et al. PRISMA harms checklist: improving harms reporting in systematic reviews[J]. BMJ, 2016, 352: i157.
[52] Guise JM, Butler ME, Chang C, et al. AHRQ series on complex intervention systematic reviews-paper 6: PRISMA-CI extension statement and checklist[J]. J Clin Epidemiol, 2017, 90: 43-50. DOI: 10.1016/j.jclinepi.2017.06.016
[53] Tricco AC, Lillie E, Zarin W, et al. PRISMA Extension for Scoping Reviews(PRISMA-ScR): Checklist and Explanation[J]. Ann Intern Med, 2018, 169: 467-473. DOI: 10.7326/M18-0850
[54] McInnes MDF, Moher D, Thombs BD, et al. Preferred Reporting Items for a Systematic Review and Meta-analysis of Diagnostic Test Accuracy Studies: The PRISMA-DTA Statement[J]. JAMA, 2018, 319: 388-396. DOI: 10.1001/jama.2017.19163
[55] Wang X, Chen Y, Liu Y, et al. Reporting items for systematic reviews and meta-analyses of acupuncture: the PRISMA for acupuncture checklist[J]. BMC Complement Altern Med, 2019, 19: 208. DOI: 10.1186/s12906-019-2624-3
[56] Zhang X, Tan R, Lam WC, et al. PRISMA extension for moxibustion 2020: recommendations, explanation, and elaboration[J]. Syst Rev, 2020, 9: 247. DOI: 10.1186/s13643-020-01502-7
[57] Zhang X, Tan R, Lam WC, et al. PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)Extension for Chinese Herbal Medicines 2020(PRISMA-CHM 2020)[J]. Am J Chin Med, 2020, 48: 1279-1313. DOI: 10.1142/S0192415X20500639
[58] Page MJ, McKenzie JE, Bossuyt PM, et al. The PRISMA 2020 statement: an updated guideline for reporting systematic reviews[J]. BMJ, 2021, 372: n71.
[59] Rethlefsen ML, Kirtley S, Waffenschmidt S, et al. PRISMA-S Group. PRISMA-S: an extension to the PRISMA Statement for Reporting Literature Searches in Systematic Reviews[J]. Syst Rev, 2021, 10: 39. DOI: 10.1186/s13643-020-01542-z
[60] Cohen JF, Deeks JJ, Hooft L, et al. Preferred reporting items for journal and conference abstracts of systematic reviews and meta-analyses of diagnostic test accuracy studies(PRISMA-DTA for Abstracts): checklist, explanation, and elaboration[J]. BMJ, 2021, 372: n265.
[61] O'Dea RE, Lagisz M, Jennions MD, et al. Preferred reporting items for systematic reviews and meta-analyses in ecology and evolutionary biology: a PRISMA extension[J]. Biol Rev Camb Philos Soc, 2021, 96: 1695-1722. DOI: 10.1111/brv.12721
[62] Zhao B, Hu K, Zeng X, et al. Development of a reporting guideline for systematic reviews of animal experiments in the field of traditional Chinese medicine[J]. J Evid Based Med, 2022, 15: 152-167. DOI: 10.1111/jebm.12480
[63] Wong G, Greenhalgh T, Westhorp G, et al. RAMESES publication standards: meta-narrative reviews[J]. BMC Med, 2013, 11: 20. DOI: 10.1186/1741-7015-11-20
[64] Wong G, Greenhalgh T, Westhorp G, et al. RAMESES publication standards: realist syntheses[J]. BMC Med, 2013, 11: 21. DOI: 10.1186/1741-7015-11-21
[65] Tong A, Flemming K, McInnes E, et al. Enhancing transparency in reporting the synthesis of qualitative research: ENTREQ[J]. BMC Med Res Methodol, 2012, 12: 181. DOI: 10.1186/1471-2288-12-181
[66] Bougioukas KI, Liakos A, Tsapas A, et al. Preferred reporting items for overviews of systematic reviews including harms checklist: a pilot tool to be used for balanced reporting of benefits and harms[J]. J Clin Epidemiol, 2018, 93: 9-24. DOI: 10.1016/j.jclinepi.2017.10.002
[67] France EF, Cunningham M, Ring N, et al. Improving reporting of Meta-Ethnography: The eMERGe Reporting Guidance[J]. BMC Med Res Methodol, 2019, 19: 25. DOI: 10.1186/s12874-018-0600-0
[68] Campbell M, McKenzie JE, Sowden A, et al. Synthesis without meta-analysis(SwiM) in systematic reviews: reporting guideline[J]. BMJ, 2020, 368: l6890.
[69] Gates M, Gates A, Pieper D, et al. Reporting guideline for overviews of reviews of healthcare interventions: development of the PRIOR statement[J]. BMJ, 2022, 378: e070849.
[70] Cook CN, Nichols SJ, Webb JA, et al. Simplifying the selection of evidence synthesis methods to inform environmental decisions: a guide for decision makers and scientists[J]. Biol Conserv, 2017, 213: 135-145. DOI: 10.1016/j.biocon.2017.07.004
[71] Pullin A, Frampton G, Jongman R, et al. Selecting appro-priate methods of knowledge synthesis to inform biodiversity policy[J]. Biodivers Conserv, 2016, 25: 1285-1300. DOI: 10.1007/s10531-016-1131-9
[72] Booth A, Noyes J, Flemming K, et al. Structured methodology review identified seven(RETREAT)criteria for selecting qualitative evidence synthesis approaches[J]. J Clin Epidemiol, 2018, 99: 41-52. DOI: 10.1016/j.jclinepi.2018.03.003
-
期刊类型引用(1)
1. 刘辉,杨楠,史乾灵,罗旭飞,张海荣,田金徽,靳英辉,陈耀龙. 医学期刊发表中国指南和共识类文献科学性、透明性和适用性评级方法学——样本确定及专科分配. 协和医学杂志. 2024(02): 429-434 . 本站查看
其他类型引用(0)
计量
- 文章访问数: 515
- HTML全文浏览量: 72
- PDF下载量: 120
- 被引次数: 1