大只500平台做什么的?夸大人工智能在诊断方面胜

- 编辑:大只500平台官网 -

大只500平台做什么的?夸大人工智能在诊断方面胜


 
大只500平台做什么的?夸大人工智能在诊断方面胜过医生的说法可能会损害病人的安全



许多研究表明,人工智能(AI)在解释图像和诊断医疗条件方面与医生做得一样好,甚至更好。然而,最近发表在《英国医学杂志》(BMJ)上的一项研究显示,这项研究的大部分都是有缺陷的,结果被夸大了。其结果可能是,采用人工智能作为患者护理的一部分的决定是基于错误的前提,损害了数百万人的患者护理质量。
 
人工智能
 
人工智能是一个先进的计算领域,有许多发现和成就值得赞扬。它的创新水平也令人瞩目。由于其灵活性和从过去经验中“学习”的能力,它被吹捧为帮助改善病人护理的解决方案,并从有太多事情要做的医疗专业人员的肩膀上卸下一些工作。特别是,深度机器学习是人工智能的一个领域,它被认为在正确解释医学图像方面非常有用。
 
关于在这一领域使用深度学习的研究越来越多。研究文章和媒体头条似乎经常暗示,在这项任务上,深度学习可以比医生做得更好,这有助于推动将深度学习引入日常临床实践的需求。然而,缺少的部分是对隐藏在这一声明背后的证据的公正审查,以及对将这类任务委托给机器的风险的评估。
 
这类研究的重点是卷积神经网络(CNN),该网络使用原始数据,然后开发自己的机制来识别数据中的模式。CNNs进行学习的特点是算法本身识别图像的特征,帮助将图像分类为正确的类别。这与传统编程不同,传统编程依靠人工输入来选择正确的特性。
 
根据研究人员的说法,在这个领域夸大的说法是有风险的。“危险在于,大只500登录中心公众和商业对医疗人工智能的兴趣,超过了支持这一相对年轻领域的严格证据基础的发展。”相反,他们指出首先需要开发和验证一种算法,包括演示它在预测所选条件方面的有效性。第二步是通过进行良好和透明的试验,评估其在检测疾病方面的现实应用。
 
这项研究
 
目前的研究重点是对过去十年发表的所有研究进行综述。主要目的是比较深度学习算法在医学成像和医学专家中的表现。
 
令人惊讶的是,只有两项随机对照试验和81项非随机研究符合研究标准。这些研究的目的是使用医学图像来将患者划分为是否患有疾病。
 
在后一组中,只有9个前瞻性试验,这些试验的数据是随着时间的推移通过跟踪个体参与者而收集的。其中,只有6例发生在实际的临床情况中。这使得比较临床医生和机器学习的表现变得很有挑战性。结果可能是一个无法接受的高假阳性率,这是不报告或迅速明显。此外,回顾性研究通常被引用作为批准申请的证据,尽管诊断不是后见之明。

在所有的研究中,机器被测试的那组人中平均只有4名人类专家。在目前的研究中,研究人员还发现,只有很少的原始数据或代码被发表,这限制了他们独立审查结果的能力。
 
他们还发现,在58/81的研究中,存在偏见的可能性很高。偏见意味着研究设计没有足够的精心设计来避免可能改变研究结果的问题。其次,他们发现这些研究往往没有遵循公认的报告标准。
 
在大约75%的试验中,得出的结论表明,人工智能的表现和人类专家一样好,甚至更好。相比之下,只有38%的研究表明需要以前瞻性研究或随机对照试验的形式进行更多的研究。本研究的作者评论道:“在研究和新闻发布中明智和负责任地使用语言,考虑到证据的强度和质量,将会有所帮助”——以实现对研究结果的适当解释。
 
影响
 
目前的研究有其局限性,如可能遗漏了一些相关的研究,只考察了人工智能在深度机器学习形式中的作用。因此,这些结论可能无法推广到其他类型的人工智能。
 
另一方面,他们说,在研究领域,有许多可能夸大的说法,声称机器学习的性能与临床专家相当,甚至更高。用他们的话来说,“许多关于与临床医生等价(或优于临床医生)的说法被夸大了,这在社会层面上给病人安全和人群健康带来了潜在的风险。”
 
换句话说,使用夸大的语言来呈现不那么有希望的结果可能会导致媒体和公众对他们的误解。结果,他们说,这可能导致“可能提供的不适当的护理,不一定符合病人的最佳利益。”
 
相反,研究人员说,“发展更高质量和更透明的报告证据基础将有助于避免炒作,大只500平台做什么的?减少研究浪费,并保护病人。”