Microsoft hat ein AI-fabschernes diagnostisches System entwickelt, den Microsoft AI Diagnostic Orchestrator (MAI-DXO), der komplexe medizinische Fälle mit einer Geschwindigkeit mehr als viermal höher als menschliche Ärzte diagnostiziert werden kann Neueres Experiment.
“In Kombination mit dem O3-Modell von OpenAI erreicht Mai-Dxo eine diagnostische Genauigkeit von 80%-vier Mal höher als der 20% Durchschnitt der Generalisten Ärzte. Mai-Dxo reduziert auch die diagnostischen Kosten um 20% im Vergleich zu Ärzten und 70% im Vergleich zu Off-the-Shelf O3”, schrieb die Studienautoren.
“Bei der maximalen Genauigkeit konfiguriert Mai-Dxo erreicht sie 85,5% Genauigkeit. Diese Leistungsgewinne mit Mai-Dxo verallgemeinern Modelle aus den Familien OpenAI, Gemini, Claude, Grok, Deek und Llama.”
Das Microsoft-Staff testete MAI-DXO gegen 304 Fallstudien der realen Welt aus dem Das New England Journal of Drugs und das KI -System diagnostizierten nicht nur 85,5% der Fälle, sondern verwendeten weniger Ressourcen als die Gruppe erfahrener Ärzte.
Die Forscher bewerteten 21 praktizierende Ärzte mit jeweils fünf bis 20 Jahren klinischer Erfahrung, sowohl in Großbritannien als auch in den USA. Die Ärzte erhielten alle die gleichen Aufgaben und erreichten in den abgeschlossenen Fällen eine durchschnittliche Genauigkeit von 20%.
Forscher gaben auch an, dass medizinische Spezialisten, obwohl sie Experten in einem bestimmten Bereich des Körpers oder an einer bestimmten Artwork von Krankheit sind, kein Arzt in jedem komplexen medizinischen Fall sein kann.
Das Microsoft -Staff gab an, dass KI diese Einschränkung nicht habe und gleichzeitig Wissen über verschiedene medizinische Bereiche hinweg erledigen kann, um über das hinauszugehen, was jeder einzelne Arzt tun kann.
“Der MAI-DX-Orchestrator verwandelt jedes Sprachmodell in ein virtuelles Klinikgruppe: Er kann Observe-up-Fragen stellen, Checks bestellen oder eine Diagnose liefern, dann eine Kostenprüfung durchführen und seine eigenen Argumentation überprüfen, bevor sie vorgehen”, schrieben die Autoren. “Diese Artwork von fortgeschrittenem Denken könnte die Artwork und Weise verändern, wie Gesundheitswesen funktioniert.”
Der größere Pattern
Die Forscher von Microsoft stellten in ihrem Experiment Einschränkungen fest, einschließlich eines unrealistischen Fallmix, da die untersuchten Benchmark-Fälle aus komplexen Fällen im NEJM lehrorientiert wurden und keine gesunden Personen oder Patienten mit leichten Erkrankungen umfassten.
Die Forscher sagten, es sei unklar, ob die KI auch in alltäglichen, routinemäßigen Fällen oder wie oft falsch optimistic Ergebnisse erzielen würde.
Der Check conflict ebenfalls begrenzt, da es keine realen Einschränkungen hatte, einschließlich Faktoren wie Beschwerden des Patienten, Wartezeiten, Versicherungsbeschränkungen, Verfügbarkeit von Checks und Verzögerungen bei den Erhaltsergebnissen.
Die Bewertung der Testkosten beruhte auf vereinfachten US -Durchschnittswerten und berücksichtigte keine Kostenunterschiede zwischen Zahler, Anbietern, Gesundheitssystemen oder Geographie.
Zuletzt verglich die Studie Microsofts KI nur mit internen Pflege Ärzten und Hausärzten, aber nicht mit Spezialisten. Darüber hinaus waren die Teilnehmer der beteiligten Ärzte durch die Verwendung von Internetressourcen beschränkt, während in Wirklichkeit die Ärzte während der Diagnose häufig Richtlinien, Kollegen und zahlreiche andere Instruments konsultieren.
“Während wir diese Einschränkungen anerkennen, weisen unsere Ergebnisse mögliche Genauigkeitsergebnisse an, insbesondere wenn Kliniker in abgelegenen und unterressernden Umgebungen arbeiten und uns auch ein Bild davon geben, wie LMS das medizinische Know-how erweitern kann, um die Gesundheitsergebnisse auch in intestine ernähren Umgebungen zu verbessern”, schrieb das Microsoft-Staff.
Discussion about this post