“88%科室使用AI产品的是肺结节筛查,6%是冠脉分析,其余依次是骨龄、乳腺和前列腺智能诊断”。
日前,中国医学影像AI产学研用创新联盟发布的《中国医学影像AI白皮书》,让传说中的AI医疗扎堆肺结节筛查现象有了一个更直观体现。
AI医疗是AI技术运用最广泛也较为成熟的领域,但伴随争议声越来越大,看好者认为AI能帮助解决医疗资源缺乏的问题,并能提高医生工作效率,从而创造价值;唱衰者则质疑其同质化严重,落地进程极为缓慢。难道AI医疗走入死胡同了吗?
▶▷现状
肺结节筛查成AI医疗企业必选题
“在我接触以及同行交流中发现,通常做AI医疗的企业,都有肺结节筛查产品”,暨南大学附属第一医院放射科主任张水兴教授也有类似感受,“像我们科室除了AI辅助肺结节筛查,还有乳腺癌钼靶筛查、骨龄筛查。同时,正与AI企业开展甲状腺结节筛查研究”。这两年不少AI医疗企业来登门推广自己的影像产品,记者采访过程中又有一家来敲门。
中国医学影像AI产学研用创新联盟理事长刘士远就曾表示:对比中美AI医疗公司业务布局可见,目前美国医疗AI企业行业分布较广泛,而中国医疗AI企业大多集中在影像方面。
根据估算,目前国内1500多家AI公司中,从事医学影像的公司有130家以上。肺结节筛查诊断赛道上玩家众多,既有阿里、腾讯等行业巨头的身影,也有零氪科技、深睿医疗、图玛深维、汇医慧影等已经过多轮融资的头部创业公司。
▶▷原因
对科技企业来说,肺结节筛查易入门
为什么大家都扎堆肺结节筛查?在张水兴看来,对于科技企业来说,肺结节筛查可谓入门级别。
肺结节主要是指肺实质内单发或多发直径不超过3cm的圆形或类圆形结节影,不能排除早期肺癌的可能。《肺结节诊治中国专家共识(2018年版)》肺结节的发病率35.5%,其中诊断为肺癌的肺结节占0.54%。
肺结节的恶性比例不高,但与肺癌的关系紧密,也让大众容易“谈结节色变”。
这样的场景想必不少人似曾相识:张阿姨体检结果显示肺上有一个8mm的小结节,医生告知肺结节有良恶之分,良性的话通过服药可控甚至无需治疗,但若为恶性则需立即切除,可能形成肺癌危及生命。令人纠结的是,既怕错把肺癌当良性疾病,耽误最佳治疗时机;也怕贸然手术白挨一刀,影响肺功能,降低生活质量。一个结节让张阿姨整日忧心忡忡,寝食难安。
一位影像AI领域从业者向记者透露,随着高分辨率CT的广泛使用以及公众对体检的重视,肺部结节愈来愈成为临床常见问题,公开数据也较多。如果是恶性肺结节,就提示患癌的风险。所以AI企业在肺结节领域很容易出产品,收效周期短,就更有希望转换成经济效益。像肝癌就少有人触及,一是肝癌影像表现多样,如巨块型、结节型、弥漫型和小癌型;二是肝癌伴有复杂肝病背景,如肝硬化、脂肪肝、酒精肝等;赛题训练集的各种肝癌数据不均衡,增加了判断难度。
AI医疗企业现阶段都在烧钱,算法五花八门,准确率还有待提高,付费场景尚未实现,张水兴直言,这种情况下,能沉下心做研发的凤毛麟角,不少企业登门只是着急向医生推销产品。
▶▷问题
AI医疗产品敏感性高,特异性不高
国际顶级期刊《自然》近年发表的一篇题为《深度学习作为提高组织病理学诊断准确性和效率的工具》的研究文章中,研究人员表示深度学习算法的灵敏度达到了100%,但假阳性率也高达40%。
“的确,AI能发现越来越小的肺结节,当医生工作量大、工作疲劳时,AI能轻易帮忙找到3毫米以下的肺结节,但同时也存在不少假阳性,这就需要医生再做一次把关”,张水兴表示:“我们很多AI医疗产品敏感性高,特异性不高”。
所谓敏感性,就是指其在诊断疾病的时候不漏诊的机会有多大,所谓特异性就是指该指标在诊断某疾病时,不误诊的机会有多大。
广东省人民医院影像医学部主任兼放射科主任梁长虹最近在2019第四届全球人工智能与机器人峰会上,就分享了一个案例:去年美国药监局批准了一款基于人工智能的软件,这款软件的应用程序Viz.AI Contact会分析计算机断层扫描(CT)结果并短信通知神经血管专家,来判断脑血管梗塞情况。
但权威杂志《放射学》(Radiology)的主编对于这个软件系统给予了强烈批评。因为这个软件系统到目前为止公开的数据没有多少,唯一可用的结果来自美国心脏协会2018年国际卒中会议的报告。该系统训练和验证数据来自埃默里大学医生建立的ALADIN非公开数据集。另外,提供了两个神经放射学家的名字,一位本身就在这家软件系统公司工作,另外一位正规途径查不到身份。“最重要的是它的特异性只有52%,类似于甩硬币(的概率)”。这提醒我们的AI公司,注意资料的完整性和可索源性。
▶▷展望
从实验室漂亮数据到临床运用仍存距离
零氪科技联合创始人兼CTO罗立刚指出,现在部分医疗AI产品过度重视算法,而忽视医生的工作习惯和系统稳定性,“在既定的训练数据场景中表现良好,但临床环境更为复杂,有可能不能满足临床需求,只能被搁置”。
罗立刚坦言,一家企业若想研发AI辅诊系统,具备处理影像、基因等多模态数据的能力,是必要条件。此外,作为系统科学,医学数据逻辑、建模、分层非常复杂和丰富。只有算法专家和医学专家深度融合,彼此听懂各自的“语言”,才能跨过医疗AI的门槛。
“算法再漂亮,不代表实际临床中就能起效果”,张水兴感慨,“我从2014年就开始接触AI医学影像,并参与研发,AI企业做医疗远比大家想象的难,AI医疗不仅是一个科技领域,更有医学专业的高要求”。需要在AI运用中医生与AI企业技术人员不断沟通,完善产品,从而更好服务百姓。
南方日报记者 李劼 通讯员 张灿城