往期推荐:
结肠憩室炎误导性特征的 CT 发现
对HRCT的囊性肺疾病诊断的实用方法
可代做分享:基于MRI的肝内肿块型胆管细胞癌分级中肿瘤内异质性的定量分析:一项多中心研究
可代做分享:基于 MRI 的临床影像组学深度学习模型用于子宫内膜癌分子亚型分类的开发与验证
子宫内膜癌和宫颈癌的影像学检查
背景
髋部骨折,特别是在老年患者中,是临床上高发且严重的问题。尽管随着医疗进步,髋部骨折1年内的死亡率已从30%降至22%,但髋部骨折依旧是导致老年人死亡和失去自理能力的重要因素。早期精准诊断与分型对于选择合适的治疗方案极为关键。然而,由于影像复杂度高,急诊科初学医生对骨折的敏感性和特异性远低于资深放射科医师,约有4-12%的骨折未在初次X线片中被识别。近年来,人工智能(AI)方法被逐步应用于骨折检测,但多为二分类(有无骨折)或粗分类(骨折类型),且多为整张影像级别输出,缺乏对骨折区域的精准定位与分割,更缺少分型分级的解读能力。
方案设计
本研究为回顾性队列分析,利用2010-2021年获得的10,308例髋部X线影像,从中随机抽取986张进行标注(每张图片对应一只股骨、共1454只股骨)。两位资深放射科医师对股骨骨折进行定位、分型和分级(使用Garden分型、Evans分型)。数据随机分为训练、验证和测试三组。采用YOLOv8深度卷积神经网络,训练其从ROI区域内同时完成骨折分割、类型归类和分级任务。与主流分类网络(如VGG16、DenseNet121、InceptionV3、ResNet50V2和EfficientNetB4)进行对比,评价指标涵盖检测AUC、分型准确率和Dice系数(评估分割性能)。
结果解读
·分割与分类性能:YOLOv8模型在测试集取得了0.77的Dice系数(95% CI: 0.56–0.98),分割能力高,与人工标注吻合良好。
·分类和分级准确率:模型多分类总体准确率为86.19%(95% CI: 80.77–90.55),位居所有对照网络之首。绝大多数错误发生在同一骨折部位的不同分型之间,完全分错部位的仅有少数。
·检测能力:骨折有无判断的AUC为0.981(95% CI: 0.965–0.997),与以往文献报道齐平或略优。
·对比分析:YOLOv8在分割和分型的全面性与解释性上明显优于传统分类模型,同等AUC下显著提升分型准确度,具有更高临床实用性与可解释性。
·数据泛化:影像来自多种设备和模式,增强了模型对不同实际场景的适应性,支持未来多中心泛化的可行性。
可改进点
1.标注样本数量有限:训练集中的某些类型(如低移位股骨颈骨折、转子下骨折)样本较少,导致模型在这些类型上的表现较弱。未来应使用半自动标注等方法进一步补充稀有类型样本,提高模型平衡性。
2.单中心数据来源:虽然采用了多设备,但所有影像均源于同一地区医疗结构,尚未做多中心泛化测试。后续需评估其在更多中心、不同影像标准下的稳定表现。
3.尚无临床验证:该模型虽体外评估成绩优秀,但未在真实临床路径上进行医生辅助诊断的有效性测试,缺乏二次读片或辅助诊断的具体评价,建议未来增加现场临床试验验证。
4.分割方式实用性待验证:分割区域是否优于传统的“箭头标记”或“框选”方式对于提升诊断信心、医生感知,目前仅为假设,亟需临床实证支持。
模型性能评估结果,见“单一分割模型评估”。左图:模型的混淆矩阵。右图:典型的检测结果。参考标准以细线显示,分割结果以粗线显示。颜色代表骨折类型。顶行,从左至右:无骨折,Garden I 或 II 型股骨颈骨折,Garden III 或 IV 型股骨颈骨折。底行,从左至右:Evans I 或 II 型粗隆间骨折,Evans III 或 IV 型粗隆间骨折,股骨粗隆下骨折。