专访科大讯飞医疗CEO陶晓东:GE、飞利浦之后,我正在为讯飞医疗布哪些局?

简介:

近日,国内首家人工智能实体医院正式成立,其AI系统学习了近百万张医学影像资料、53本专业医学教材、200万去标识化真实电子病历、40万医疗文献及病历报告。

而这背后的核心操刀人之一,便是陶晓东。

从GE Healthcare Research Manager,到飞利浦医疗放射解决方案首席架构师,再到科大讯飞智慧医疗事业部总经理,陶晓东几乎经历了影像方案从研究到落地的各个环节,深谙医疗AI浪潮之水的深浅。

访谈前,陶晓东博士打趣道:AI在国内大热后有个现象,CEO每对外吹一次牛,都得CTO花很多精力来填坑。为了不给工程师们添堵,今天我就有1说1,希望把最真实的科大讯飞智慧医疗事业部和医疗AI行业现状展现给大家。

以下是雷锋网与陶晓东的谈话内容:

雷锋网:您加盟科大讯飞后的这几个月主要在处理哪些事项?

这段时间更多还是把精力投入在战略梳理上面。

在医疗领域,其实科大讯飞还是一个新兵,所以我们首先要了解行业,然后发现并总结我们的优势,以及如何发挥这些优势。其次需要搞清楚哪些企业和机构是我们的真客户,这部分工作花了很多时间去梳理。

另一方面,我也花不少精力与产品团队沟通,把讯飞的医疗产品定义清楚。把产品定位和客户梳理顺畅后,再去思考什么样的产品对这些目标客户是有价值的。

雷锋网:梳理后得出的结论,现阶段哪类机构是你们的目标客户(受众)?

主要面向医院、政府、医生和病人。

从现在整个产品形态来看,直接受众主要还是医生,为他们提供一些辅助工具。

第二是医院,从信息化的角度出发,把医院信息整合起来,帮医院管理者更好地做决策。

第三是把小医院的项目做好后,后续可能会向两端延伸:一是政府,二是个人(病人)。

从政府角度讲,如区域卫生资源的配置,我们更多去跟医改的政策结合,用技术服务医改。

面向病人这端的产品,现在还没有想的特别清楚。为什么这么说呢?大家也都看到互联网医疗前段时间挺热,这些互联网医疗产品相对更 To C,但具体解决了多少问题,还有待商榷,所以我们的To C产品还处于摸索状态。

雷锋网:到时候向哪些机构收钱?

目前主要面向医院,所以现阶段的市场推广工作也蛮辛苦。医保这方面其实还没想法,但不排除和保险公司合作的可能性。

雷锋网:讯飞以往的医疗产品主要基于语音,如语音病例录入系统。而您则是影像出身,这个时候,您同时管理基于影像和语音这大技术分支的医疗项目团队时,会不会存在一些沟通和管理上的难题和阻碍?

语音是讯飞的第一个应用,也是第一个切入点。科大讯飞这么多年来被贴了一个非常大的标签:语音公司,所以过往的医疗产品也是基于语音来做。

我一直都在研究影像,其实不管是语音还是影像,我们的核心管理团队大多都是技术出身,再一步步做到管理。我们都非常了解底层技术、了解项目、了解产品,做过一定客户需求梳理后,又从上往下开始做管理。

从我自身角度讲,我现在已经很难再切入到技术底层去研究算法,而是更多关注语音或影像在医疗场景中现在能做什么?技术发展到了哪一步?关注客户需求,如何把语音和影像切入进去。如果从业务、场景、应用、客户层面做战略梳理的话,技术背景差异其实不会存在很明显的隔阂。

雷锋网:近期整个战略的优先级,是以影像为主还是以语音录入为主?

影像和语音产品,这两者对我来说都是手段,是工具,产品最终还是要解决临床、解决比较实质的问题。

现在医生的工作非常繁重,像三甲医院的医生每天要写很多文书,可能有30%的时间花在写各种各样的文档上。我们要做的就是如何用语音去帮助他提高效率。

而影像这边,很多医生每天大概要读150个片子难免有疏漏,我们要帮他们做辅助和预检。

这里其实有一个坑,做辅助诊疗如果准确率达不到100%,都有可能会增加医生的工作量,所以这也是摆在我们面前的一个挑战。现在影像产品得做成一个既能帮助医生,而且又很安全的应用,不能增加医生的风险。如果医生觉得机器存在一定的风险,理论上他就得审核机器看的所有片子,这时候辅助的意义也就成了伪命题。

从长期来讲,如何真正服务医生、服务病人,其创新逻辑分四种层面:

第一个是基于我的技术,我能做,所以我去做。

第二个是因为我能帮助医生,所以我去做。

第三个是因为我能帮助病人,所以我去做。

第三个是因为我能帮助社会,所以我去做。

雷锋网:就我个人推断,讯飞今年会在影像方向投入精力更多吧?

目前影像团队正在建。

影像还处于研究到产品的过程,至于团队构成,一部分是我们自己业务部门的团队,另一部分是讯飞研究院的团队,图像识别和医学这两类研究者都是必不可少的。

基于我过去在飞利浦的经验,很多医学知识我们是不具备的:临床医生、影像科医生和工程技术人员,这三者的“语言”实际上不通,各自又术业有专攻。

影像科的医生可能对另外两边都有些许认知,但他们毕竟是医生。

把大家整合在一起,让这些人充分理解为什么要做这件事情。因为很多时候,他们在解决的一个问题时,经过一系列研究后,最后发现根本不是用这种方式去做。

让三方“语言”互通,认知同步,是非常关键的一点。

雷锋网(公众号:雷锋网):你们先重点会从哪些点去突破?比如肺结节、眼底等。

肺结节是一个重要方向。

当然,这背后也引出了一个挺有意思的现象,市场上绝大多数初创影像公司都在做肺结节,大家都在说自己是90%、95%的准确率。

为什么都在做肺结节,实际上说明大家的创新能力还不够,其次是大家能够得到的资源都很相似,因为肺部CT是公开数据最多的。

对讯飞而言,一方面是孵化出一个能用的产品,发现一个能够帮助到医生的场景。另外一方便是把团队医学影像的能力提升起来,接下来主要会做像乳腺的钼靶、超声甲状腺结节、核磁图像分析等方面的研究,其中乳腺钼靶产品8月份已经在“智慧医院”投入试点应用。

雷锋网:刚您也提到之前在飞利浦工作,从器械商到人工智能公司做医疗业务,您个人经历了哪些转型?

首先从业务和研究的角度上来讲,转变其实并不是太大。

我在GE和飞利浦期间,在研究院与业务部门都工作过。所以我十分清楚大公司在做产品和做研究两方面有哪些不同。

在飞利浦担任总架构师时,其中一部分工作在做用户需求的梳理,以及解决方案的设计,这需要跟用户有着特别多的沟通。

基于这些经验,所以我也很熟悉团队中的销售、售前、产品、研发等环节,我知道他们需要做什么。

其中一个较为明显的转变,是因为国内外各种环境的差异所引发的系列问题。

加入讯飞是我第二次海归,虽然过去对国内医疗市场有所了解,但还是有很多东西要学,包括整个运营方式,工作方式等。

国内外智能医学影像行业有一点很不一样,美国很多前沿研究是医生自己在做,而在国内,因为医生实在太忙,做研究时间通常是晚上10点以后和周末,两地医生投入的精力不一样。

国内有一特色优势,我们有大量工程技术人员会支持医生做研究,这使得国内在一些研究方面更超前。

我觉得在医学影像研究方面,中国很有可能在短时间内会超过美国。不过换句话说,也不是超过不超过的问题,研究不是竞赛,最终的目的还是要解决问题,中国有中国的问题,美国有美国的问题。

雷锋网:企业在与医院、政府合作上,中美有哪些差异?

中美两地的侧重点有些不一样,美国现在把18%的GDP用在医疗上,如何降低成本对美国来说是非常大的挑战。

我去年在美国做的一个项目是帮助医院做管理改进,提高效率,让医院对自己有一个全景的认识:让他们知道哪些流程可以改进;哪些工作人员需要做什么样的培训;帮助它减少不必要的检查等。

而中国面临的是基层医生不足、家庭医生不足的问题。这种情况下,如何用信息化的手段去支撑分级诊疗和双向转诊,将来会是一大挑战。

另外一个问题是如何给基层医生一个智能化的工具?基层医生往往因为经验不足,使得自己只能做60分的事情。但如果给他一个比较好的工具,就可能做到80分。

解决这些大环境存在的问题,会是科大讯飞从更长期的战略方向。

雷锋网:你们是先从基层医院开始打,还是三甲医院?

目前更多以三甲医院为主。

基层医院比三甲医院多得多,基层医院的主客观环境更为复杂。而各个三甲医院的配置相比而言比较相似,医生经验也更加丰富,能提出一些非常棒的需求,提出的这些需求也可以反馈到我们的产品设计当中,以及技术开发的Roadmap里去。

但存在个问题,三甲医院有优秀的医生给产品提需求,那么基层医院影像产品的需求谁来提?基层医生可能受限于专业水平,而让三甲医院的医生往往不了解基层医院的具体情况。

所以如何平衡技术创新和模式创新,都需要仔细考虑。

雷锋网:现在应用在医院的产品,成熟度到了哪个阶段?

得看产品形态。

我们一部分产品已经被医院常态使用,也有科研合作、试用、商务谈判前的试用和商务之后的试用产品。

这些产品有的反馈较好,有些一般,也有个别产品医生被抱怨比较多。

当然,被抱怨也是好事,是我们持续改进产品的动力。

您举几个反馈好的、反馈一般和反馈较差的例子?

这其实与场景关系很大,产品体验不好,往往和我们选错了场景或者场景不成熟有关。

像我们最早做口腔科的语音病历录入,由于场景的特殊性,使得医生在治疗、诊断过程中没法动手去写病例,口述便成了一个刚需。

医生们过去做完诊断、治疗后,需要大概要花8-10分钟的时间去写病历,现在口述内容全部记录下来后,再通过语义理解去帮它做结构化。虽然机器整理出来的结果存在一些错误,但医生只花一两分钟时间修改就已足够。讯飞在跟北大口腔医院合作期间,效率提升还是挺明显的。

而对于使用效果欠佳的场景,我们还在持续梳理,其中门诊电子病历是一项。刚才我也讲到国家在推行“一患一医一诊室”,但其实很难做到。很多时候医生在门诊跟病人谈的同时,也要跟病人家属谈,甚至下一个病人也在场插话,这些事情都发生在3-5分钟内,既要管理病人的情绪,又要顾及家属的情况,在这种场景下,语音录入会比较困难,那么相关产品也挺难发挥出它的作用。

雷锋网:除了语音外,现在有推出哪些AI影像产品?

现在有几家医院在试用正式的影像产品,这些都属于SFDA3类的产品。

目前更多还处于用科研手段做一些简单的、医生认为合适的、不影响他们正常诊疗过程的一些产品。还有一些利用回顾性的历史数据,跟医生过去的诊断做比较。

市场上的近百家影像企业我不知道有多少家现在正在跟CFDA沟通,或者有多少家是有有质量认证。有质量认证后才可以去申请CFDA认证。

智能医学影像产品市场一下子变成了一个大的泡沫,泡沫起来后,实际上有很多不是专业的从业人员在里面。很多创业者对整个监管和流程并不熟悉,所以我也很想了解这里面到底有多少人已经做成功了。

我在GE中国期间,2011-2013年我职责的一部分就是负责中国这些产品的上市,上市之前要做临床实验,要到CFDA去申请认证,当时Cover了四五个项目。

雷锋网:给国内智能影像市场的成熟度打个分?

抛开“证儿”的问题,大概打70分左右。

至于为什么打70分,剩下的30分因为什么,我举几个例子说明:

首先场景定义是一个难题:技术人员对医学的理解还不够深刻,很多AI公司还没有真正切入到诊断治疗过程中,如果要真正切入进去的话,他们要做的事情,应该是在非常合适的场景去辅助医生,甚至解决临床问题。

其次从业者需要了解医疗环节有哪些规范、风险,要尽量规避这些风险。而且要注意一点,必须要满足医生的需求,而不是满足技术的需求。

另一方面,GE、西门子、飞利浦有那么大的成像设备市场,但它们的后处理工作站也仅仅几亿美元的规模。而这几亿美元的规模背后,各家都有几十个不同领域的App在支撑。一平均下来后发现,单个软件在全球也可能只有1000万的市场,这其实非常非常小。

到底是什么原因呢?我觉得第一是研发成本问题,其次是一些很小的应用可能在全球也就只有几千个用户,但因为竞品有,其他友商觉得我也必须要有,最终导致这样的循环。

从GE、西门子、飞利浦的角度来讲,它有影像设备的销售做支撑,所以它仍然可以养一支影像团队。而从我们这种没有影像设备的纯人工智能公司而言,不得不进行模式的创新,而不能完全跟它在这个领域拼。因为这个领域,GE、西门子和飞利浦已经做的很好,并且把能做的都做了。

雷锋网:您是如何评价今年智能影像突然这么火?是因为纯图像识别的赚不了钱,所以开始探索影像,还是其他?

我个人觉得,主要是因为最近open域的医学影像数据开始变多了。

之前只能从医院里拿数据,这非常难,即便现在从医院里面拿数据也极其困难。

现在各种各样公开的老年痴呆症、肺结节数据很多,中国也在做脑计划,里面有大量数据用在临床应用里,此外像kaggle等比赛里的数据也非常多。

开放数据的增多催生了这个行业,数据多了之后,算法和应用也在不断成熟,这个轮子转起来之后,逐渐形成了一个良性循环。

其实我做这么多年影像,很早之前还有过创业的想法,但一直都没走出来。(笑)

雷锋网:这里做个假设,假如您创业会选择哪个方向?

如果要做的话,可能会进入健康管理领域。但相比而言,健康管理的重点更多是对数据的采集,它非采集标准的数据,可能需要采集血糖、血压、生活习惯、食物、餐饮习惯等数据。针对慢病管理采集各种生活习惯的数据,还是比较困难的,挑战也比较多。

其实我之前也考虑过养老行业,但养老这个方向怎么讲呢,还挺让人沮丧的。

雷锋网:你们团队做影像研究,更倾向于用传统的机器学习方法,还是用深度神经网络、卷积神经网络这些新工具去做?

更多是卷积神经网络。

在方法上,有句谚语这样说的“如果你唯一的工具是一个锤子,那么你看什么东西都像钉子”,

现在大家都是拿着深度神经网络、卷积神经网络,到处找应用,讯飞也在这个阵营里。让我比较庆幸的是,在没有特别多医学经验的情况下,我们在很短的时间内实际上做到了相对比较好的表现。从这一情况来看,说明我们的人工智能算法已经有了一定的水平。

雷锋网:谈到锤子和钉子的问题,市场有一现状,有些公司冲着解决问题去,主要精力是先找好钉子。有些大公司人力财力比较雄厚,所以他们更多先去优化自己的AI工具,也就是磨炼锤子,然后等锤子做好后再去找钉子。目前科大讯飞是先以找钉子为主,还是以打造锤子为主?

这种现象确实存在,尤其是一两年前的AI圈,很多知名AI公司热衷事先建立算法壁垒,全力打造好锤子后再去找钉子。

但存在一个问题,有些业务技术壁垒高,而有些业务则是场景壁垒高,不同的业务得选择不同的打法去做。所以有时候在针对部分业务时,一条腿长、一条腿段短的走路方式确实有它的合理性。

但医疗行业属于技术壁垒和场景壁垒都比较高的项目,任何医疗AI公司走任意一个极端肯定有问题。

从场景上讲,医疗领域有哪些具体的问题是讯飞等公司能够解决的,现在还很难说,得继续探讨。但从讯飞的立场来看,比较饱和的业务我们肯定不会去碰。

从打磨工具角度讲,其实工具的定义和作用也在持续变化,不同的阶段,都需要我们不断从不同的场景中去定义和发现,哪些是算法缺口,哪些是专家缺口,哪些是数据缺口,根据缺口去针对性地解决问题。

对我们团队而言,在锤子和钉子两方面的协调上,我觉得更多还是在应用里面把工具用好就行。

雷锋网:有哪些业务你们不会做入?

首先成像我们肯定不会去做。

有一些与治疗结合非常紧密的,我们可以去进行辅助治疗,但单纯的治疗我们可能不会去做。

我们更多会做雪中送炭的项目,但这不是说锦上添花的事情我们就不做,锦上添花业务的市场和份额还蛮大,因为大部分专家都集中在“锦上”了。

雷锋网:我比较好奇一点,科大讯飞头牌竞争对手Nuance的医疗业务收入,占总收入50%左右,为什么讯飞医疗业务收入占比并不是很高。

Nuance的主要收入是语音病历转写。

实际上,美国医院一直有使用语音转写习惯,而且美国的电子病例普及率达到了47%,这其中有72%是用语音转写的。

属于国情的差别,现在美国完全可以做到一患一诊室,问诊过程可满足一对一,相对来讲比较安静。

而且由于政策要求,需要医生把病例写得非常完整,这就得花费很多时间。一个放射科的报告,往往要写三、四页。

电子病历越要求完整详细,语音转写的作用就越突出。

这为用户习惯的培养,创造了天然的土壤。

虽然国内电子病例国家也有规范和要求,但强制性并不高,与医生的很多绩效不直接挂钩,这就导致医生往往缺少使用语音转写的需求,用户习惯也较难养成。

语音转写在国内处于市场培育阶段,现在也有一些厂家在做,所以我们希望与它们一起把这个市场培育起来。

除此之外,我相信国家也会对电子病例的要求越来越严格,否则健康档案是不完整的。客观环境成熟后,会加快医生习惯的养成。

当然,这是个庞大的系统工程,需要比较漫长的过程。



本文作者:亚峰
本文转自雷锋网禁止二次转载, 原文链接
相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
12天前
|
存储 运维 监控
祝贺!中国电子学会科技进步一等奖
祝贺!中国电子学会科技进步一等奖
14 0
|
人工智能 供应链 监控
“数字化”成两会热词 马化腾杨元庆周鸿祎周云杰等都说了什么?
“数字化”成两会热词 马化腾杨元庆周鸿祎周云杰等都说了什么?
137 0
“数字化”成两会热词 马化腾杨元庆周鸿祎周云杰等都说了什么?
|
5G vr&ar
回顾2021虚拟与增强现实产业年会暨「金V奖」颁奖盛典
回顾2021虚拟与增强现实产业年会暨「金V奖」颁奖盛典
120 0
回顾2021虚拟与增强现实产业年会暨「金V奖」颁奖盛典
|
机器人
吴磊正式成为科沃斯机器人全球代言人 大势青年引领智能生活
9月27日,全球最早的家用服务机器人研发与生产商之一——科沃斯机器人正式宣布95后实力演员吴磊成为品牌全球代言人,这也是吴磊的首个全球科技品牌代言
503 0
|
定位技术
中国的“科技打拐”,让全球儿童保护机构都来取经了
3月18日,A20全球关爱儿童社会领导力峰会在北京开幕,该峰会是第一次在中国举办的面向全球尤其是发展中国家儿童关爱保护类社会组织的国际会议。在会议中,阿里巴巴和中国公安部合作搭建的“团圆”系统,以高达97.36%的失踪儿童找回率备受关注,“中国经验”让各国与会代表感到兴奋。
4816 0