| 雷峰网
0
本文作者: 李雨晨 | 2019-03-28 21:50 |
3月26日,由中国医学影像AI产学研用创新联盟牵头,汇集了国内三甲医院的影像专家、科研专家和AI医学公司的《中国医学影像AI白皮书》在动脉网举办的VB100新春战略发布日上发布,刘士远教授、沈定刚教授分别作为白皮书的主编和副主编,出席了此次发布会。
中国医学影像AI产学研用创新联盟成立于2018年4月12日,联盟理事长单位为上海长征医院。
担任中国医学影像AI产学研用创新联盟理事长的刘士远教授在现场说到,该联盟由从事医学影像AI最核心的公司、专家、医生组成,包括国内55家从事医学影像AI的企业,35家包括清华、复旦、交大等相关的科研机构,以及120家全国的著名医院。“可以说,代表了目前国内医学影像AI领域最权威的声音。”
医学影像AI发展到今天已经自成一脉,成为医学AI中最为繁盛的分支,值得单独拿出来深入剖析。在此次《中国医学影像AI白皮书》发布之前,雷锋网曾在2018年底推出《2018医学影像AI行业研究报告》。可以看到的是,这两份报告都将重心落在了医学影像AI这一话题上,探讨了医学影像AI的问题与发展之路。
刘士远教授在会上表示,“我们希望白皮书的发布,能对行业产生一定的指导作用,对企业能有参考价值,对国内想了解医学影像AI、但不明了的人,或者跨学科的人,起到知识普及的作用。”
刘士远教授从事医学影像诊断工作30余年,同时也是AI技术的观察者和参与者。
2018年7月,雷锋网受邀参加了第五届医学图像计算青年研讨会(MICS 2018),并且围绕医学影像AI的发展和刘士远教授进行了一次深入对话。在那次对话中,刘士远教授坦率地说,医学影像AI的形势很好,但是医学的术语、识别、标记标准制定等基础工作对医学影像AI公司是一件非常重要的事情。现在一些公司的算法模型是通过什么样的数据、怎样做出来的,很多医生都不知道,在一个封闭的环境中,容易做出一个高准确率的模型,但在真实世界中就不一定经得起检验。
“产品要有生命力,首先要保持这个种子是对的,培养、施肥、修剪方式是合适的,才可能让它长起来。”
因此,2018年4月,联盟成立后,刘士远教授就打算汇聚各方力量,把行业的现状、问题以及未来记录下来。在白皮书的发布会上,刘士远感慨道,经过半年左右的酝酿、努力、耕耘,《中国医学影像AI白皮书》这块“宝贝疙瘩”终于落地。同时,他也说,白皮书是第一次发布,也是第一版,“但以后我们每年都会做”。
随后,中国医学影像AI产学研用创新联盟副理事长钱大宏教授,对《中国医学影像AI白皮书》的部分重要内容进行解读,分析了医学影像AI在15大临床应用中的发展价值所在。
他说到,从技术层面来看,影像的技术也在不断发展,从图像的分割、配准到识别、映射,各种模型和技术的应用都是AI影像不可缺少、并且不断发展的重要因素。
钱大宏教授分别从心血管疾病AI、乳腺AI、骨龄判读AI、前列腺癌AI、病理AI等几个方面进行了解读,这几个部分中,部分领域的产品已经开始落地,但是行业标准以及影像数据库等方面的工作还远远没有完成。
钱教授也说,AI也开始逐步跟传统的PACS系统进行对接。尤其是区域里开放式的AI的PACS系统。“可以看到这么多AI诊断模块,都处在不同的发展阶段,进展非常迅速。”
在此次发布会上,还有一位值得关注的嘉宾——沈定刚教授,上文提到的医学图像计算青年研讨会正是由沈教授倡议发起。作为此次《中国医学影像AI白皮书》的副主编,沈教授撰写了白皮书中“人工智能在医疗领域的应用概述”和“医疗影像AI算法的最新进展”两章。
去年,在雷锋网承办的2018 CCF-GAIR全球人工智能与机器人峰会上,沈定刚教授曾发表主题演讲《深度学习在医学影像分析中的应用》。可以看到的是,从去年到今天,沈教授的很多观点都没有变。
在他看来,现在国内很多初创公司的发力点集中在诊断环节,但医学是一个很长的链条,成像、检测、诊断、治疗、预后每个环节都大有文章可做。
因此,沈教授提出,我们必须要搭建平台,一个平台里面有相应的分割、配准、分类和一系列诊断的算法,有了新的应用以后,把相应的模块像搭积木一样搭起来就可以做应用。所以“平台化、全栈式的人工智能肯定是未来趋势。”
医学印象AI的进步很大程度上得益于医学影像的算法,那么到目前,用于医学影像的算法都有哪些进展?作为医工交叉的专家,沈教授作出了解答:“医学影像AI的每个应用都不一样,所以方法非常多。还有同一个AI应用,用的都是非常某一点片面的开发。为了解决这两方面的问题,我们要做很多的研究来应对挑战。”
沈教授提出,过去的一年里面,在影像AI领域至少有几个方面的发展值得关注,包括小数据训练、分布式计算、多模态判断、可解释化等。其中,小数据训练在医学领域是一个重要的问题。“我们开发一个新的应用,有时候数据非常多,但是标注的数据非常少,或者有些疑难疾病的数据量比较少。”
数据的问题一直存在。此前,雷锋网的《2018医学影像 AI 行业研究报告》曾指出,大型三甲医院一年产生的影像数据在10T以上,但是却存在数据不准、数据不全的问题。
据南方医科大学副教授刘再毅介绍,医院影像科每天产生很多数据,但其中能用的连1%都不到。而且,影像学诊断有两大难点——异病同影和同病异影。 影像数据需要与后期准确的诊断治疗结果进行关联才有价值。但医院里的数据往往不完整,拿肺癌或其他肿瘤来说,在大医院,满足要求的可能只有10%~20%。在二甲等地方医院,很多病人做完检查之后,转移到上级医院看病,有完整资料的病人可能只有1%~2%。
考虑到数据缺失的情况,近几年,出现了几种解决小样本问题的方法,这些方法被称为Fewshot learning(若只有一个标注样本,则称为Oneshot learning)。沈教授说到,“我们要尝试把大数据已经学习好的东西迁移到小数据里面。”
除此以外,分布式的学习也非常重要。当前国内医院的数据是不出院的,但是医疗AI模型要需要足够多的多中心样本进行训练,那么怎样训练一些方法来达到训练模型的目的?
沈教授提出三个方法,可以考虑在多中心训练时,贡献用于优化的梯度或者是在模型训练结束后,通过模型的集成达到模型共享的目标以及将上述两种方法结合起来。
总的来看,医疗AI产品属于新生事物,无先例可循,准证审批规则有待成熟,仍需要数据标准及辅助诊断性能评价标准等。从技术到市场的全面理解,更好地建立行业共识,继而推动技术革命,走向产业化落地,是中国医学影像AI产学研用创新联盟希望看到的事情。
刘士远教授说到,医疗AI很火,但也存在被消费的情况,做企业的人也很辛苦。企业需要行业帮它们提供一些燃料或者营养,而不是一直地消耗它。只有医工结合,企业壮大,未来实现盈利,才能够让医疗AI更加活跃。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。