Eur Radiol:人工智能辅助骨折检测改善成骨不全儿童的骨折诊断表现

5小时前 吾乃喵大人 MedSci原创 发表于上海

本研究首次针对成骨不全患儿群体,系统评估市场主流AI骨折检测工具的外部性能,揭示了AI在患者骨病骨架异常复杂环境中的表现局限。

亮点总结

  • 尽管人工智能(AI)骨折检测工具单独使用时,性能逊于专业放射科医师,但AI辅助显著提升了放射科医师在成骨不全(OI)儿童骨折诊断中的准确率。
  • AI辅助帮助减少了放射科医师的假阳性率,提高了诊断一致性,促进了多读者间的诊断协同。
  • 该研究首次针对罕见骨骼疾病儿童群体,验证了现有商业AI工具的适用性和局限性,强调了个性化训练和临床环境下人机协作的重要性。

成骨不全(OI)是一种罕见的遗传性骨骼脆弱病症,约发病率为1/10,000,因骨质脆弱而导致多发性骨折、慢性残疾与疼痛。其骨骼形态因反复骨折及愈合而复杂异常,进一步加大了临床骨折诊断的难度,尤其是对于经验有限的医师而言易发生漏诊。人工智能骨折检测技术近年快速发展,相关研究显示多病种、多年龄段患者中AI可提升骨折诊断敏感度与准确性,但针对罕见病如OI儿童中的适用性与安全性尚未充分评估,存在可能的性能下降和患者群体偏倚。鉴于该AI工具未针对骨脆弱疾病患者进行专门训练,研究亟需评估其在OI患者群中对放射科医师诊断的辅助价值及潜在风险。

近日,发表于European Radiology杂志的一项研究,聚焦于评估一款人工智能辅助诊断系统在成骨不全儿童骨折检测中的实际应用效果。该多读者研究纳入48名经遗传确诊的成骨不全儿童(共计336张涉肢体与骨盆的X线影像),由7位具儿科放射学经验的放射科医师分别在无AI辅助及有AI辅助两轮阅片条件下进行骨折识别。研究对比医师自身阅片、无AI及有AI辅助结果与两位专家共识构建的金标准,全面评估AI工具的诊断准确性、敏感度、特异度以及多读者间一致性,并探讨AI对医师决策调整的影响。

本研究是一项单中心回顾性影像回顾及前瞻性多读者诊断试验。研究收集了2021年4月至2022年4月间Great Ormond Street Hospital中诊治的48例年轻成骨不全患者所有附肢及骨盆X线影像,共计336个影像投影。两位专家放射科医师根据临床背景及既往影像进行骨折标注,作为金标准。7名具备儿科放射学经验的放射科医师分别在第一轮无AI辅助、第二轮有AI辅助的条件下对清洗脱敏的影像进行了骨折判读及标注。AI工具使用Milvue Suite-SmartUrgences©系统(CE认证),支持对骨折高概率区域自动框选但不区分急性或愈合骨折。两轮间设8周洗脱期,并随机重排图像顺序以减少记忆偏差。诊断分析包括按骨折、单张影像及整体检查三个层面进行真阳性(TP)、假阳性(FP)、真阴性(TN)、假阴性(FN)的统计,计算敏感度、特异度、阳性预测值(PPV)、阴性预测值(NPV)及准确率,并采用Cohen’s Kappa评估多读者一致性。

研究结果

1. 数据集概况

平均患者年龄12岁(6-17岁),84%为下肢及骨盆影像,余为上肢。

数据集中患者、检查、图像和骨折的分布情况

2. AI与放射科医师诊断性能比较

  • 放射科医师整体优于AI单独检测,尤其体现于准确率及特异度。
  • AI辅助显著提升医师敏感度、特异度及总体准确率,减少误诊与漏诊现象。
  • AI倾向漏诊(下假阴性较多80 vs 41),医师倾向过度诊断(假阳性较多)。
  • 医师多数选择采纳AI建议以修正错误,约74.6%修正为一致,且近83%此类修正获得正确诊断结果,尤以将假阳性更正为真阴性最为显著。

3. 急性骨折与愈合骨折诊断

AI无法区分骨折性质,但AI辅助医师对急性与愈合骨折分类准确率均有所提升(68.2%提升至73.3%)。

4. 多读者一致性

AI辅助显著提升多读者间一致性指标(Cohen’s Kappa):

  • 检查层面0.52提升至0.74
  • 单影像层面0.57提升至0.78
  • 骨折层面0.53提升至0.66

5. 典型判读案例

  • 图示案例明确反映出,多个放射科医师未能识别但AI正确提示的骨折,以及AI漏诊的典型示例,说明AI在某些隐匿性骨折检测中具辅助价值。
  • 某些假阳性AI标注如骨骺区结构异常被误判骨折,放射科医师自信纠正该类误判。

图:一名1岁幼女的右侧股骨正位X线投影,显示股骨颈处有一处急性骨折

图:一名11岁男性患者的右侧股骨正位X线投影,显示原位保留有一根髓内钉,图像可见两处正在愈合的骨折,一处位于股骨近端骨干,另一处位于骨干中段区域

图:一名15岁男性患者的左侧股骨侧位X线投影,显示三处骨折——正在愈合的股骨近端骨干骨折、急性股骨远端干骺端骨折以及急性胫骨近端骨折

6. AI与医师分歧分析

医师在绝大多数医师与AI分歧场景中判对,AI多因低识别率导致遗漏,对于AI能正确提示情况医师往往表现为过度诊断。

研究价值与意义

本研究首次针对成骨不全患儿群体,系统评估市场主流AI骨折检测工具的外部性能,揭示了AI在患者骨病骨架异常复杂环境中的表现局限。结果提醒临床实施应谨慎,尤其是在未经特定罕见病训练的AI系统导入时。尽管AI单独性能不及专业医师,AI辅助作用下放射科医师的整体诊断性能得到显著优化,并有效降低误诊,提升医师间诊断一致性,强化了临床诊疗的信心。该“人机协作”模式有望成为稀有疾病诊断辅助的重要范式。研究进一步标明,AI模型需针对患儿及罕见骨骼疾病数据进行针对性训练,方能释放更强的诊断潜力。

此外,结果强调临床实施时必须保留经验丰富医生的最后决策权,避免盲目依赖AI,防范自动化偏见与能力弱化。未来工作应扩大样本规模、引入对照组、评估不同AI产品、研究实际临床环境下AI辅助对患者结局改善的直接影响,为AI规范化应用提供强有力数据支持。因此,本研究为罕见骨病领域AI辅助诊断提供了宝贵的实证基础,同时推动了医疗人工智能伦理和公平性的探讨。

原始出处

Pauling C, Laidlow-Singh H, Evans E, Garbera D, Williamson R, Fernando R, Thomas K, Martin H, Arthurs OJ, Shelmerdine SC. External validation of an artificial intelligence tool for fracture detection in children with osteogenesis imperfecta: a multireader study. European Radiology. 2025. https://doi.org/10.1007/s00330-025-11790-z.

相关资料下载:
[AttachmentFileName(sort=1, fileName=acab67d177bbc9dbffb1746115ffac7f_d8654659dd83ee74d909ce6eedae4513_8.pdf)] GetArticleByIdResponse(id=301c88e62657, projectId=1, sourceId=null, title=Eur Radiol:人工智能辅助骨折检测改善成骨不全儿童的骨折诊断表现, articleFrom=MedSci原创, journalId=2334, copyright=原创, creationTypeList=[1], summary=本研究首次针对成骨不全患儿群体,系统评估市场主流AI骨折检测工具的外部性能,揭示了AI在患者骨病骨架异常复杂环境中的表现局限。, cover=https://img.medsci.cn/20250110/1736477959652_8538692.jpg, authorId=0, author=吾乃喵大人, originalUrl=, linkOutUrl=, content=<p style="color: #333333;"><strong>亮点总结</strong></p> <ul style="color: #333333;"> <li>尽管人工智能(AI)骨折检测工具单独使用时,性能逊于专业放射科医师,但AI辅助显著提升了放射科医师在成骨不全(OI)儿童骨折<a href="https://www.medsci.cn/guideline/list.do?q=%E8%AF%8A%E6%96%AD">诊断</a>中的准确率。</li> <li>AI辅助帮助减少了放射科医师的假阳性率,提高了诊断一致性,促进了多读者间的诊断协同。</li> <li>该研究首次针对罕见骨骼疾病儿童群体,验证了现有商业AI工具的适用性和局限性,强调了个性化训练和临床环境下人机协作的重要性。</li> </ul> <p style="color: #333333;">成骨不全(OI)是一种罕见的遗传性骨骼脆弱病症,约发病率为1/10,000,因骨质脆弱而导致多发性骨折、慢性残疾与疼痛。其骨骼形态因反复骨折及愈合而复杂异常,进一步加大了临床骨折诊断的难度,尤其是对于经验有限的医师而言易发生漏诊。人工智能骨折检测技术近年快速发展,相关研究显示多病种、多年龄段患者中AI可提升骨折诊断敏感度与准确性,但针对<a href="https://rare.medsci.cn/">罕见病</a>如OI儿童中的适用性与安全性尚未充分评估,存在可能的性能下降和患者群体偏倚。鉴于该AI工具未针对骨脆弱疾病患者进行专门训练,研究亟需评估其在OI患者群中对放射科医师诊断的辅助价值及潜在风险。</p> <p style="color: #333333;">近日,发表于European Radiology杂志的一项研究,聚焦于评估一款人工智能辅助诊断系统在成骨不全儿童骨折检测中的实际应用效果。该多读者研究纳入48名经遗传确诊的成骨不全儿童(共计336张涉肢体与骨盆的X线影像),由7位具儿科放射学经验的放射科医师分别在无AI辅助及有AI辅助两轮阅片条件下进行骨折识别。研究对比医师自身阅片、无AI及有AI辅助结果与两位专家<a href="https://www.medsci.cn/guideline/list.do?q=%E5%85%B1%E8%AF%86">共识</a>构建的金标准,全面评估AI工具的诊断准确性、敏感度、特异度以及多读者间一致性,并探讨AI对医师决策调整的影响。</p> <p style="color: #333333;"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250721/1753088160750_8106296.png" /></p> <p style="color: #333333;">本研究是一项单中心回顾性影像回顾及前瞻性多读者诊断试验。研究收集了2021年4月至2022年4月间Great Ormond Street Hospital中诊治的48例年轻成骨不全患者所有附肢及骨盆X线影像,共计336个影像投影。两位专家放射科医师根据临床背景及既往影像进行骨折标注,作为金标准。7名具备儿科放射学经验的放射科医师分别在第一轮无AI辅助、第二轮有AI辅助的条件下对清洗脱敏的影像进行了骨折判读及标注。AI工具使用Milvue Suite-SmartUrgences&copy;系统(CE认证),支持对骨折高概率区域自动框选但不区分急性或愈合骨折。两轮间设8周洗脱期,并随机重排图像顺序以减少记忆偏差。诊断分析包括按骨折、单张影像及整体检查三个层面进行真阳性(TP)、假阳性(FP)、真阴性(TN)、假阴性(FN)的<a href="https://www.medsci.cn/search?q=%E7%BB%9F%E8%AE%A1">统计</a>,计算敏感度、特异度、阳性预测值(PPV)、阴性预测值(NPV)及准确率,并采用Cohen&rsquo;s Kappa评估多读者一致性。</p> <p style="color: #333333;"><strong>研究结果</strong></p> <p style="color: #333333;">1. 数据集概况</p> <p style="color: #333333;">平均患者年龄12岁(6-17岁),84%为下肢及骨盆影像,余为上肢。</p> <p style="color: #333333;"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250722/1753149866311_92910.png" /></p> <p style="color: #333333; text-align: center;"><span style="color: #2c2c36;">数据集中患者、检查、图像和骨折的分布情况</span></p> <p style="color: #333333;">2. AI与放射科医师诊断性能比较</p> <ul style="color: #333333;"> <li>放射科医师整体优于AI单独检测,尤其体现于准确率及特异度。</li> <li>AI辅助显著提升医师敏感度、特异度及总体准确率,减少误诊与漏诊现象。</li> <li>AI倾向漏诊(下假阴性较多80 vs 41),医师倾向过度诊断(假阳性较多)。</li> <li>医师多数选择采纳AI建议以修正错误,约74.6%修正为一致,且近83%此类修正获得正确诊断结果,尤以将假阳性更正为真阴性最为显著。</li> </ul> <p style="color: #333333;">3. 急性骨折与愈合骨折诊断</p> <p style="color: #333333;">AI无法区分骨折性质,但AI辅助医师对急性与愈合骨折分类准确率均有所提升(68.2%提升至73.3%)。</p> <p style="color: #333333;">4. 多读者一致性</p> <p style="color: #333333;">AI辅助显著提升多读者间一致性指标(Cohen&rsquo;s Kappa):</p> <ul style="color: #333333;"> <li>检查层面0.52提升至0.74</li> <li>单影像层面0.57提升至0.78</li> <li>骨折层面0.53提升至0.66</li> </ul> <p style="color: #333333;">5. 典型判读案例</p> <ul style="color: #333333;"> <li>图示案例明确反映出,多个放射科医师未能识别但AI正确提示的骨折,以及AI漏诊的典型示例,说明AI在某些隐匿性骨折检测中具辅助价值。</li> <li>某些假阳性AI标注如骨骺区结构异常被误判骨折,放射科医师自信纠正该类误判。</li> </ul> <p style="color: #333333;"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250722/1753149866328_92910.png" /></p> <p style="color: #333333; text-align: center;">图:<span style="color: #2c2c36;">一名1岁幼女的右侧股骨正位X线投影,显示股骨颈处有一处急性骨折</span></p> <p style="color: #333333; text-align: center;"><img src="https://img.medsci.cn/20250722/1753149866335_92910.png" /></p> <p style="color: #333333; text-align: center;">图:<span style="color: #2c2c36;">一名11岁男性患者的右侧股骨正位X线投影,显示原位保留有一根髓内钉,图像可见两处正在愈合的骨折,一处位于股骨近端骨干,另一处位于骨干中段区域</span></p> <p style="color: #333333; text-align: center;"><img src="https://img.medsci.cn/20250721/1753088316014_8106296.png" /></p> <p style="color: #333333; text-align: center;">图:<span style="color: #2c2c36;">一名15岁男性患者的左侧股骨侧位X线投影,显示三处骨折&mdash;&mdash;正在愈合的股骨近端骨干骨折、急性股骨远端干骺端骨折以及急性胫骨近端骨折</span></p> <p style="color: #333333;">6. AI与医师分歧分析</p> <p style="color: #333333;">医师在绝大多数医师与AI分歧场景中判对,AI多因低识别率导致遗漏,对于AI能正确提示情况医师往往表现为过度诊断。</p> <p style="color: #333333;"><strong>研究价值与意义</strong></p> <p style="color: #333333;">本研究首次针对成骨不全患儿群体,系统评估市场主流AI骨折检测工具的外部性能,揭示了AI在患者骨病骨架异常复杂环境中的表现局限。结果提醒临床实施应谨慎,尤其是在未经特定罕见病训练的AI系统导入时。尽管AI单独性能不及专业医师,AI辅助作用下放射科医师的整体诊断性能得到显著优化,并有效降低误诊,提升医师间诊断一致性,强化了临床<a href="https://www.medsci.cn/guideline/search?keyword=%E8%AF%8A%E7%96%97">诊疗</a>的信心。该&ldquo;人机协作&rdquo;模式有望成为稀有疾病诊断辅助的重要范式。研究进一步标明,AI模型需针对患儿及罕见骨骼疾病数据进行针对性训练,方能释放更强的诊断潜力。</p> <p style="color: #333333;">此外,结果强调临床实施时必须保留经验丰富医生的最后决策权,避免盲目依赖AI,防范自动化偏见与能力弱化。未来工作应扩大样本规模、引入对照组、评估不同AI产品、研究实际临床环境下AI辅助对患者结局改善的直接影响,为AI规范化应用提供强有力数据支持。因此,本研究为罕见骨病领域AI辅助诊断提供了宝贵的实证基础,同时推动了医疗人工智能伦理和公平性的探讨。</p> <p style="color: #333333;"><span style="font-size: 12px; color: #808080;">原始出处</span></p> <p style="color: #333333;"><span style="font-size: 12px; color: #808080;">Pauling C, Laidlow-Singh H, Evans E, Garbera D, Williamson R, Fernando R, Thomas K, Martin H, Arthurs OJ, Shelmerdine SC. External validation of an artificial intelligence tool for fracture detection in children with osteogenesis imperfecta: a multireader study.&nbsp;<em>European Radiology</em>. 2025.&nbsp;<span class="cursor-pointer underline !decoration-primary-700 decoration-dashed">https://doi.org/10.1007/s00330-025-11790-z</span>.</span></p>, belongTo=, tagList=[TagDto(tagId=8461, tagName=人工智能), TagDto(tagId=447125, tagName=成骨不全)], categoryList=[CategoryDto(categoryId=10, categoryName=骨科, tenant=100), CategoryDto(categoryId=18, categoryName=儿科, tenant=100), CategoryDto(categoryId=40, categoryName=影像放射, tenant=100), CategoryDto(categoryId=84, categoryName=研究进展, tenant=100), CategoryDto(categoryId=20656, categoryName=梅斯医学, tenant=100)], articleKeywordId=0, articleKeyword=, articleKeywordNum=6, guiderKeywordId=0, guiderKeyword=, guiderKeywordNum=6, opened=1, paymentType=1, paymentAmount=0, recommend=0, recommendEndTime=null, sticky=0, stickyEndTime=null, allHits=373, appHits=0, showAppHits=0, pcHits=14, showPcHits=373, likes=0, shares=0, comments=0, approvalStatus=1, publishedTime=Tue Jul 22 10:04:00 CST 2025, publishedTimeString=5小时前, pcVisible=1, appVisible=1, editorId=6556175, editor=影像放射新前沿, waterMark=0, formatted=0, deleted=0, version=5, createdBy=49478106296, createdName=吾乃喵大人, createdTime=Mon Jul 21 16:58:48 CST 2025, updatedBy=92910, updatedName=rayms, updatedTime=Tue Jul 22 10:04:48 CST 2025, ipAttribution=上海, attachmentFileNameList=[AttachmentFileName(sort=1, fileName=acab67d177bbc9dbffb1746115ffac7f_d8654659dd83ee74d909ce6eedae4513_8.pdf)], guideDownload=1, surveyId=null, surveyIdStr=null, surveyName=null, pushMsXiaoZhi=true, qaList=[{id=860084, encryptionId=8a5b86008475, articleId=301c88e62657, userName=administrator, question=在AI辅助诊断环境下,如何平衡技术效率与保持放射科医师专业能力发展的关系?, answer=需要建立持续培训机制,明确AI仅作为辅助工具,保持医师独立判读能力,并定期进行无AI参与的诊断能力评估。, clickNum=0, type=article, createdAt=1753149907642, updatedAt=1753149907642}, {id=860076, encryptionId=04428600e6c5, articleId=301c88e62657, userName=administrator, question=在成骨不全儿童的骨折诊断中,AI辅助系统最常出现哪类错误(假阳性或假阴性)?这对临床实践有何启示?, answer=AI更易出现假阴性(漏诊),而放射科医师更易出现假阳性(过度诊断)。这提示临床实践中需要人机协作,结合AI的高特异性与医师的经验判断,以取得最佳诊断效果。, clickNum=0, type=article, createdAt=1753149907642, updatedAt=1753149907642}])
acab67d177bbc9dbffb1746115ffac7f_d8654659dd83ee74d909ce6eedae4513_8.pdf
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2274354, encodeId=d63522e435405, content=<a href='/topic/show?id=d3a024808e0' target=_blank style='color:#2F92EE;'>#人工智能#</a> <a href='/topic/show?id=0f2d128e516f' target=_blank style='color:#2F92EE;'>#成骨不全#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=3, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=24808, encryptionId=d3a024808e0, topicName=人工智能), TopicDto(id=128751, encryptionId=0f2d128e516f, topicName=成骨不全)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Tue Jul 22 10:04:48 CST 2025, time=5小时前, status=1, ipAttribution=上海)]
    5小时前 梅斯管理员 来自上海

相关资讯

AI辅助罕见病诊断新突破:胶原蛋白VI肌营养不良的深度解析

在罕见病胶原蛋白VI相关先天性肌营养不良症(COL6-CMD)的诊断中,运用人工智能(AI)技术,实现了高准确率的自动图像分类,显著提升诊断效率与客观性。

Ann Oncol:人工智能进军肿瘤病理学:现状、挑战及展望

AI促进多组学数据的整合,实现更精准的患者分层和个性化治疗策略,未来有望引领癌症管理进入精准医学新时代。

Gigascience:拥抱大数据复杂性的生命科学人工智能应用新篇章

人工智能(AI)正成为生命科学研究的核心工具,尤其在多组学大数据的解析中展现出独特优势。

European Heart Journal:基于超声心动图的 AI 模型实现心脏淀粉样变性快速精准筛查,性能优于传统评分

AI模型不仅具备临床可行性,能极大提升基层诊断能力,降低过度诊断与漏诊风险,还能优化稀有病诊疗流程,避免患者因诊断艰难而错失有效治疗时机。

【综述】|工智能在胃癌诊疗和患者预后预测中的应用现状及未来展望

本文将重点综述DL在胃癌诊断、疗效评估和预后预测中的应用现状及未来发展方向。

Lancet Digit Health:复旦大学等 42 家医院联合研发!鼻咽癌内镜AI诊断系统显著提升基层医生准确率

研究开发了基于Swin Transformer结构的鼻咽癌诊断深度学习系统(STND),覆盖了全国42家医院,是迄今最大规模的多中心鼻咽癌内镜影像数据集。

我国学者突破专科壁垒:AI-ECG 实时提醒助力非心脏科医生,房颤诊断与抗凝治疗效率大幅提升

本研究创新性地将高度准确的AI-ECG诊断技术整合进临床决策支持系统,向非心脏科医生针对潜在房颤患者发出即时提醒,有效缓解了非专家环境下房颤识别和管理的难题。

突破肝病治疗瓶颈:新药研发可否按下加速键?

肝胆相照平台特邀中山大学附属第三医院彭亮教授分享了AI技术在医疗中的应用的相关话题,并将精华部分整理成文,供临床医生参考。

人工智能在临床医学中的应用、研究现状及发文趋势

人工智能在临床医学中的应用、研究现状及发文趋势