“知识图谱” (Knowledge Graph)是谷歌在2012年提出的一个技术概念,它是语义搜索的一个应用,能够将搜索结果进行知识系统化,任何一个关键词的输入都能导出完整的知识体系。除了能为用户进行搜索、推荐等具服务外,知识图谱在垂直领域的应用也在不断延生和拓展。
其中,来自北京的创业团队康夫子正通过构建医疗知识图谱,打造精准的人机对话模型,并推出病历结构化、临床决策支持系统和全科机器人医生三项针对医疗资讯和问诊的服务。
借助AI打造机器人医生,增加医疗资源供给
“主要是让计算机在阅读海量的医疗文献和电子病历数据后,自动学习诊断逻辑,并进行推理计算”,康夫子创始人&CEO张超告诉猎云网,自然语言理解是知识图谱依托的重要技术之一,此外,知识图谱的构建还离不开庞大的数据支撑,而医学作为一门知识驱动类的学科,“如果能多维度收集足够丰富、可靠的数据,就能在辅助决策层面发挥应用的价值”。
病历结构化方面,由于不同医院的数据编码各异、写法也千差万别,因此,康夫子需要利用NLP技术,深度挖掘和分析医疗文本的信息,将非结构化文本形式的病历数据变成可用于统计、查询和分析的结构化数据,以便机器可以准确完整地“读懂”病历。
当前,其病历结构化模块已经在国内20多家大三甲医院中全院级别使用。
临床决策支持系统(Clinical Decision Sopport System,简称 CDSS)这部分,主要是实现智能辅助临床决策,能够缓解基层医生资源不足的问题。临床对辅助诊断的要求相对比较高,因此对于结论的可推测性要求非常严格。康夫子这套基于机器学习、人工智能和NLP的系统,通过对海量病历进行深度挖掘和学习,将经验丰富的专家经验提炼成AI模型算法。
在线体验智能诊断功能(附部分导诊步骤)
例如,当医生填写完病历分析患者的病情后,系统会弹出提醒,给出推荐的治疗方案和建议,以降低医疗风险,避免基层全科医生由于经验缺乏而可能造成的误诊、漏诊的情况。
全科机器人医生则主要承担分诊导诊服务。患者在医院大厅挂号时,只需在系统中填入姓名、年龄等信息,并输入相应症状,“医生”就能通过模拟医生询问患者病情,获取患者病情信息,并基于医疗知识图谱,给出疑似疾病、推荐就诊科室。
“我们希望能够为患者提供比较精准的回复和决策,比如咳嗽三天和咳嗽三个月,患者没有办法去判断具体病情的差异”,张超表示,“全科机器人医生不仅能解决患者不知道挂哪个科室、盲目就医的问题,减轻导诊台人工服务的压力,提高服务效率,还有效地利用了‘候诊’的时间,节省医生写病历的时间,提高诊疗效率”。
在线体验智能问答功能(附部分问答步骤)
据悉,康夫子目前已吸收2000多万本医疗文献、超400万份病例报告,可在其中提取50%~90%的知识点(根据内容复杂程度有所差别),知识准确率超过90%,覆盖了所有科室约6000种常见疾病。
而这些成绩,团队只花了不到三年的时间。2015年,张超辞职离开了工作五年的百度,从百度自然语言处理部资深研发工程师、文本知识挖掘方向负责人,转型成为一名创业者。之后,两位技术合伙人,前百度高级研发工程师张冲和前百度NLP高级研发工程师栗晓华也陆续加入。
辞职百度转型创业,利用AI将医生从繁杂的劳动中解放出来
创业初始,团队瞄准的是做孕妇饮食营养的健康分析和食谱推荐——根据孕妇的饮食情况,基于构建孕妇人群知识图谱,提出合理健康的饮食建议。
但由于这个项目的刚需不强,AI技术的发挥空间有限,因此半年后,康夫子决定进行项目转型。此时,基于多年的行业积累和体验,张超发现,在网站搜索上,医疗健康类的问题常常会出现很多答案,但回复却并不精确,同一种症状甚至会有十几个可能出现的病症结果,用户体验并不好。
根据症状、诊断、治疗三个维度中的一种或多种组合推荐相似病例
最终,团队决定基于此前的技术积累,通过“AI+数据”的模式赋能医疗健康领域,从医院端(效率)和患者端(体验)提升医疗行业效率。张超表示,短期内将收取一定的服务费,长期则是通过增值服务去变现,比如撮合交易,帮助患者做健康管理、预警等。
鉴于医疗行业本身的特质,技术能力和行业资源必须兼备,对此,张超表示,“我们并不直接接触B端,而是和专业的机构合作,基于他们搜集的数据,我们再在这些经过脱敏的数据的基础上进行整理。在这个过程中,新的合作伙伴也会不断找过来”。
近日,康夫子就与国内领先的云计算识别领导厂商浪潮集团有限公司(以下简称浪潮)、山东健康医疗大数据有限公司(以下简称山东健康医疗)达成战略合作,依托山东健康医疗的数据资源,以及浪潮在全国范围内的“浪潮健康医疗大数据云平台”,结合康夫子在医疗数据治理、AI技术等方面的积累,推进智慧医疗的落地。
对于所有“AI+”项目来说,只有理解了行业和场景,才能真正智能化。接下来,康夫子还将围绕康复、随访等场景进行远程医疗健康管理。
2010年,张超研究生毕业后就拿到了百度的offer,尽管也是在做自然语言处理相关的业务,但概念并不像今天这样为人所知。
对比AI浪潮带来的行业泡沫,他笑称,“当年我们在百度做自然语言处理,很多人不懂,我们就说我们是做搜索的;今天,我们说我们是做自然语言处理的,人们会问,你们具体是做那一块,很显然,认知层面发生了很大的改变”。
而对于AI近几年的过热、无序甚至失衡的泡沫现象,以及行业人才薪酬水涨船高,张超保持开放的态度,他认为,当前AI行业的人才本来就非常少,也还远没有到全民化,团队能不能吸引人才并不完全指望“泡沫”的破灭,是否具备足够的前景、团队实力以及创始人是否值得信赖。
“泡沫要中立来看,可能会浪费一部分资源,但就像驾驶一艘船出海一样,风大可能吹翻船只,但有风才能远航,这些都是客观存在的因素,并不是导致项目走不下去的理由”。