人工智能在专业医学领域全面战胜人类医生的例子还很少见。最近一项深层神经网络算法在诊断灰指甲方面,成功击败了42位皮肤科专家。灰指甲是一种常见的真菌感染,它会让指甲脱色和脆化,这种疾病每年困扰着大约3500万美国人。
?
这项成功很大程度依赖于一个韩国研究团队的努力,他们收集了大约5万张指甲/趾甲的图片。大量的训练数据,是深层神经网络成功识别灰指甲,战胜人类医学专家的关键所在。
韩国首尔的皮肤科医生、临床医生Seung Seog Han表示,“迄今为止,在很多研究——比如识别糖网、皮肤癌和阅读胸片等项目中,人工智能已经接近了人类专家的水平。但这项研究首次表明,人工智能已经超越了人类专家。”
过去人工智能和皮肤科医生之间的较量通常势均力敌。但在这项研究中,在一个特定场景下的三次实验里,只有一名皮肤科医生的表现全部略优于深度神经网络。而且,值得注意的是,对于简单病例,深层神经网络的优势更加明显。
这项研究成果发表在了2018年1月19日的PLOS ONE 杂志网络版上。参与这项研究的除了Seung Seog Han,还有韩国翰林大学的皮肤病学教授 Gyeong Hun Park,以及韩国蔚山大学的皮肤病学教授 Sung Eun Chang。
作为一名医生,Han在日常工作中接触到了各种各样的皮肤病。同时,他也学习了不少计算机编程语言方面的知识,比如C++++和Python。后来,AlphaGo击败世界围棋冠军李世乭,又激发了Han探索深度学习的兴趣。
人类往往难以把握大数据的规律,但深度学习算法在大数据的模式检测方面有着独到的优势。在这个案例中,韩国的研究人员发现可以用微软研究院开发的深度学习算法帮助医生从数字照片中识别可能的灰指甲感染病例。
但任何深度学习模型都需要基于大量的数据进行训练。收集灰指甲病例的图片给研究人员提出了巨大的挑战,因为这些图片通常没有标准和统一的格式。很多图片是从不同角度拍摄的,里面既有健康的指甲/趾甲,也有受到感染的指甲\趾甲。此外,受深度学习算法的技术限制,所有图像都要调整到224 x 224像素大小,这样一来很多图片就无法识别了。
韩和他的同事们训练了一种名为Faster R-CNN的目标检测算法,对图像进行识别和裁剪,使图片中只包含受感染的指甲/趾甲,然后再将图片放大,这样就得到了一个可以用于训练深层神经网络的数据集。数据集中的大部分图片都来自于一个Han 在 2007 年开发的、名为MedicalPhoto的皮肤病临床照片管理程序。
即便如此,Han还是要手动读取Faster R-CNN裁剪出来的10万张照片,并对每张照片进行两次标记,将不准确或不合适的指甲/趾甲照片剔除,以保证训练数据的准确性。即使Han平均每10秒钟能处理一张照片,且每天工作数小时,这项工作也需要耗费他大约550个小时,合计超过70天。
该数据集帮助训练了用于识别病症的卷积神经网络——微软的 ResNet-152 和牛津大学的 VGG-19 模型,以执行识别指甲真菌感染可能病例的工作。这种深度学习方法表现优于 42 位皮肤科专家组成的小组——其中包括 16 名教授、18 名临床医生和 8 名住院医师。
研究人员表示,在额外的测试中,深度学习算法的表现也通常优于5名最好的皮肤科医生。他们还发现,人工智能的诊断评估也比一般内科医生、医学生、护士和非医务人员的诊断结果要好。
该研究团队发布了他们深度学习算法的早期演示版本,任何人都可以通过网站或下载Android智能手机应用程序进行尝试。通过在网站和应用程序中收集数据,研究人员希望发现该人工智能算法在实际医疗实践中使用时可能会出现哪些问题。
Han和他的同事们也在尝试用深度学习诊断皮肤癌等其他皮肤疾病。相关的研究论文发表在了2018年2月8日的《Journal of InvesTIgaTIve Dermatology》网络版上。
这类研究表明,人工智能依赖于临床影像来诊断疾病,因此在远程医疗领域更有用武之地。人类皮肤科医生在做诊断时还是要结合病人的病史和其他临床信息,因为对于大多数人来说,仅凭影像就下诊断还是显得太过草率了。
Han和他的同事们认为,他们的研究对于全科医生尤其有用,因为病人们经常会向全科医生反馈自己的指甲和皮肤问题。Han说道:“人工智能的诊断要比普通临床诊断更为准确,我认为它对全科医生确定灰指甲的治疗方向有所帮助。”