在全球范围内,医生的工作量很大,人手短缺,但是机器学习可以帮助他们减少初级保健中的错误。AI症状检查器在向用户提供医疗信息和安全的分类建议方面非常有价值,但是,它们都无法像医生那样进行诊断。与医生不同,现有的症状检查人员仅根据相关性提供建议-相关性不是因果关系。巴比伦的研究人员第一次使用因果推理的原理来使AI能够诊断书面测试用例,这是我们所知道的第一次。
研究人员使用一种称为因果机器学习的新方法-在AI社区中获得越来越多的关注-充当一种“想象力”,以便AI可以考虑如果患者患病不同于该疾病,它将看到什么症状正在考虑。在《自然通讯》上发表的经过同行评审的研究表明,将因果关系解开可以使AI更加准确。
巴比伦科学家兼第一作者乔纳森·里根斯博士说:“我们采用了具有强大算法的人工智能,并赋予其想象替代现实的能力,并考虑'如果是另一种疾病会出现这种症状吗?”在这些笔试案例中,人工智能可以逗弄患者疾病的潜在原因,并获得超过70%的医生更高的评分。
巴比伦首席执行官兼创始人阿里·帕萨博士说:“整个世界几乎无法获得医疗保健。我们需要做得更好。因此,在测试案例中看到这些令人鼓舞的结果令人振奋。当机器取代医生时,这不应引起轰动。 ,因为真正令人鼓舞的是,我们最终将获得使我们能够扩大现有医疗保健系统的覆盖面和生产力的工具。人工智能将是帮助我们所有人消除医疗保健分布不均的不公正现象的重要工具,使地球上的每个人都更容易获得和负担得起。”
超过20个巴比伦全科医生创建了1,671个现实的书面医疗案例-其中包括350多种疾病的典型和非典型症状示例。每个病例都是由一位医生撰写的,然后由其他多位医生进行验证,以确保它代表了现实的诊断病例。然后,将另一组44名巴比伦GP分别给予至少50个书面案例(平均159个)进行评估。医生列出了他们认为最可能的疾病(每次诊断平均返回2.58种潜在疾病)。通过在诊断中包括真实疾病的病例比例来对它们进行准确性评估。巴比伦的AI进行了相同的测试,并使用了基于相关性的较旧算法(专门为此研究创建,而不是从我们的产品中获得)和较新的因果算法。
医生的平均得分为71.40%(±3.01%),范围为50-90%。较旧的相关算法执行效果与普通医生相当,达到72.52%(±2.97%)。新的因果算法得分为77.26%(±2.79%),高于32位医生,等于1和低于11。
巴比伦医学部副主任兼全科医生Tejal Patel博士说:“我很高兴有一天,这种AI可以帮助我和其他医生减少误诊,腾出时间并帮助我们专注于需要护理的患者。大多数。我期待这种工具成为标准工具,以帮助我们提高工作水平。”