人工智能在骨科领域的应用现状及前景
2011—2016年,得益于多个研究团队及软件公司在医学影像和人工智能(artificial intelligence,AI)领域的突破,AI与医疗的结合获得了前所未有的关注。2017年,国务院发布了《新一代人工智能发展规划》,将智能医疗纳入了国家发展战略,并提出了培育高水平人工智能创新人才和团队、加大高端人工智能人才引进力度、建设人工智能学科的要求。自此3年以来,在市场新兴、政策落地等环境下,医疗行业也迎来了探索的新机遇,医疗行业的需求从某种程度上讲,也正在从就医流程的优化转向对资源配置不平衡的调整。一些利用AI技术解决医学科学问题的项目也如雨后春笋般出现。
AI是一种用计算机来构造复杂的、拥有与人类智慧同样本质特性的机器的概念;机器学习指的是利用算法帮助决策判断完成智能任务的方法,是实现人工智能的一种方法;而深度学习则是近些年得益于大数据的积累发展而出的,依靠神经网络模型的一种实现机器学习的技术。
其实AI理论的提出已有半个世纪之久,机器学习的想法也可追溯至20世纪80年代,而深度学习的真正飞速发展,还是从2010年以来的各个开源的标注图像数据资料建立开始的。目前深度学习主要包含计算机视觉和自然语言处理。本文旨在介绍AI在骨科应用的现状和前景,一定程度上也是对计算机视觉和医疗影像技术、人工神经网络在骨科的应用前景进行介绍。
AI在医学领域发展中的困境
实现机器学习的基础在于大量优质的、经过标记的样本,正所谓大量的“人工”才有“智能”,如此训练出的模型,可以快速、准确、低成本地进行判断,应用到医学领域则可以帮助医生进行分析及决策。目前在自然图像识别领域,已经公开了百万级的图像数据库帮助训练识别生活中的常见物品。想要从中训练一个优异的模型只需要筛选样本即可。
然而,当我们沿着同样的道路把目光转向医学领域时,样本的获取以及质与量的维持,则相对更加困难。首先,医学图像包涵患者敏感信息,而且只能由医疗机构获取,对知情权的告知获准,数据的脱敏、收集、整理过程都有着严格要求。也正因为此,一个千级或万级的数据库在医疗行业就已经称得上是“大数据”。同时,样本并不仅仅是指图像本身,还包含人工标注,即对图像内容的分类诊断。众所周知,目前的医学影像诊断还是更多地依赖医生个人经验。因此最适合做标注工作的应该是该领域专家,而他们的时间又是有限的。这样就对诊断标准的客观一致性和标注人员的严格培训提出了更高的要求,以降低观察者间因主观性产生的偏倚。另外,体系的构建也是人工智能在医学领域发展的关键。包括人才和团队乃至学科建设,市场的成熟,以及相关法律约束和政府相关机构的监管和质控,相信这些都会在将来逐渐完善成熟。
数据的质与量直接决定着预测模型的准确性,AI学界一直在尝试利用算法研究和技术更新弥补样本不足带来的问题。比如利用迁移学习提高训练效率,利用半监督学习应对标注人员不足的问题等。总的来讲,虽然算法成果可以帮助智能医疗克服种种问题,但医疗数据样本的收集整理仍然是限制智能医疗发展的最大瓶颈。
AI在骨科领域的应用现状
由于骨科的诊断和预后需要依靠医学图像的阅读,AI在骨科中的应用则主要集中在对这些图像的深度学习上。深度学习可以自主分析医学图像,从而提高诊断的准确性和速度,优先标记紧急患者,减少由于疲劳和/或缺乏经验而造成的人为错误,减轻工作人员的负担和压力,并一定程度上改善骨科的诊治。此外,根据有经验医生的专业知识进行的深度学习方法培训,可以将这些经验分享到较小的医疗机构和较偏远的地区。
在骨科影像资料中,我们主要针对的问题包括骨折,脊柱退变、畸形,关节疾患等。而这些问题中大部分特征明显,非常适合应用AI。例如,对骨折的判断,正常的骨骼骨质连续,而对于海量影像中骨骼图像信号的学习,可以赋予模型快速发现骨折的能力,甚至对于容易漏诊的微小的骨折征象,模型都能在数秒中筛查出来。在2024年一项汇集13万张肢体骨骼平片的模型开发实验中,骨折诊断的敏感性在纯人工诊断组和智能辅助组中分别达到了80.8%(P<0.05)和93.9%(P<0.05);特异性分别达到了87.5%(P<0.05)和93.9%(P<0.05),平均误诊率降低了47.0%(P<0.05)。而在一项非医学影像识别模型的迁移学习识别桡骨骨折的研究中,ROC曲线下面积达到了0.954,证明了自然图像识别模型迁移学习骨科影像识别也可以达到不错的效果,这也为未来研究带来了更多可能性。
关节方面,来自斯坦福大学的研究人员开发的MRNet囊括了1370例MRI检查资料,可以显著提高放射科医生诊断前交叉韧带撕裂、半月板损伤的敏感性和特异性。2024年一项囊括9024例患者的研究中,诊断模型在诊断髋骨骨折方面同样表现优异。近期,AI更是被用来预测患者若干年内接受全膝关节置换的可能性。
除了创伤和关节领域的尝试,脊柱疾患的AI研究也是热点之一。脊柱疾患诊断的第一步是需要AI具备识别椎体的能力,即定位能力。早在2012年,Glocker等人构建的AI识别、定位椎体的准确率已达到81%。对于脊柱畸形如脊柱侧弯的研究,也有一种基于3D表征的形态分析方法,用以辅助脊柱畸形诊断。而Jamaludin等于2017开发的针对多项腰椎疾患的诊断模型,覆盖了腰椎间盘退变、腰椎管狭窄、终板异常等诊断参数,其上万的数据量提高了其诊断功能的可靠性。
影像分割不仅仅在诊断中发挥作用,在手术规划中也是如此。深度学习最重要的场景之一便是在影像资料中对骨骼关节进行分割和识别,并且基于识别的关键点进行径线测量,并辅助制定手术方案。通过图像分割技术识别影像资料中的骨骼肌,在辅助创伤手术中可以获得不错的效果;而在关节假体置换手术中,经过分割和测量的髋臼和股骨头配合智能的径线测量,可以为假体的选择和安装提供准确的参数。康奈尔大学的研究人员基于4万余例重大住院卒中术后患者的数据所开发的AI系统,可以实现对9种术后并发症的预测,从而完善外科手术决策。也有研究综合患者本人的性别、年龄、慢性病史、吸烟饮酒史等参数对患者椎间融合术术后并发症与死亡率进行预测,发现年龄、糖尿病史、BMI对患者术后并发症和死亡率影响明显。这类研究也为AI预测骨科患者预后指明了方向。另外随着传感器普及和数据积累,术后康复训练也可以由AI介入评估指导。
展望
AI作为数字资产,其可复制性可以保证骨科领域的智慧资源以一种更低成本、更客观辅助的特点普及到基层医疗设施之间,然而骨科领域深度学习的实施并非没有局限性。深度学习的过程及其决策方式往往难以解释。在医疗行为中,可解释性至关重要。在不了解深度学习算法工作原理的情况下,就不可能建立起信任并集成到日常骨科诊疗中。因此,使深度学习算法具有可解释性,既有利于计算机科学领域开发改进AI算法,也有利于医学领域实现新的医学发现。可以说深度学习算法目前被视为无法解释的黑盒方法,为了增加医学界对这些算法的信任,AI可视化就显得尤为重要,这种技术将人工智能的关注区域标示出来,从而帮助我们建立信任。
综上所述,“智能”来自“人工”,高质量和庞大的数据库为其表现奠定了基础。因此,既往数据的再挖掘,前瞻性数据收集的标准化以及开放合作通道的建设,将会帮助研究者、医疗团体乃至国家,步入智能医疗的快车道。接下来,如何建设骨科AI数据平台,将会是真正开启智能骨科时代的敲门砖。