Gesund im Alter Mag
  • Home
  • Ernährung
  • Schlaf
  • Bewegung
  • Gesundheitstipps
  • Wohlbefinden
No Result
View All Result
  • Home
  • Ernährung
  • Schlaf
  • Bewegung
  • Gesundheitstipps
  • Wohlbefinden
No Result
View All Result
HealthNews
No Result
View All Result
Home Gesundheitstipps

OpenAI enthüllt HealthBench, um die Sicherheit der LLMs im Gesundheitswesen zu bewerten

admin by admin
May 17, 2025
in Gesundheitstipps
0
OpenAI enthüllt HealthBench, um die Sicherheit der LLMs im Gesundheitswesen zu bewerten
0
SHARES
0
VIEWS
Share on FacebookShare on Twitter



Openai hat die Einführung von HealthBench angekündigt, eine Benchmark zur Bewertung von KI-Modellen im Gesundheitswesen unter Verwendung realer Anwendbarkeit und ärztlicher Beurteilung.

“Die 5.000 Gespräche in HealthBench simulieren die Interaktionen zwischen KI -Modellen und einzelnen Benutzern oder Klinikern. Die Aufgabe für ein Modell besteht darin, die bestmögliche Antwort auf die letzte Nachricht des Benutzers zu geben”, sagte das Unternehmen in einer Erklärung.

OpenAI baute den Benchmark mit 262 Ärzten in 60 Ländern, die 49 Sprachen beherrschen und in 26 medizinischen Spezialitäten geschult sind.

HealthBench umfasst 5.000 Gesundheitsgespräche mit jeweils eine von Ärzten erstellte Rubrik, um die Modellantworten zu bewerten. Die Rubrikbewertung umfasst 48.562 einzigartige Rubrikkriterien.

Das Unternehmen sagte, die Gespräche seien durch “synthetische Era und menschliche kontroverse Check” erstellt worden, sind mehrsprachige und umfassen verschiedene medizinische Spezialitäten und Kontexte.

“Jede Modellantwort wird gegen eine Reihe von ärgerlich geschriebenen Rubrikkriterien bewertet, die für dieses Gespräch spezifisch sind”, sagte das Unternehmen.

“Jedes Kriterium beschreibt, was eine ideale Antwort umfassen oder vermeiden sollte (z. B. eine spezifische Tatsache, die oder unnötig technische Jargon zu vermeiden). Jedes Kriterium hat einen entsprechenden Punktwert, der so gewichtet wurde, dass das Urteil des Arztes über die Bedeutung dieses Kriteriums entspricht.”

Die Antworten des Modells werden unter Verwendung von GPT-4.1 bewertet, um festzustellen, ob jedes Rubrikkriterium erfüllt ist. Eine Gesamtbewertung, die auf den erfüllten Kriterien basiert, wird dem Benutzer angezeigt und mit der maximal möglichen Punktzahl verglichen.

HealthBench ist in sieben Themen unterteilt: übersegelte Kommunikation, Reaktionstiefe, Notfallüberweisungen, Gesundheitsdatenaufgaben, globale Gesundheit, Reaktion unter Unsicherheit und Kontext-Suche.

“Evaluierungen wie HealthBench sind Teil unserer fortlaufenden Bemühungen, das Modellverhalten in hohen Einstellungen zu verstehen und sicherzustellen, dass der Fortschritt auf echte Vorteile gerichtet ist”, sagte das Unternehmen.

“Unsere Ergebnisse zeigen, dass sich große Sprachmodelle im Laufe der Zeit erheblich verbessert haben und Experten bereits über die in unserem Benchmark getesteten Beispiele übertroffen haben. Selbst die fortschrittlichsten Systeme haben jedoch immer noch einen erheblichen Raum für Verbesserungen, insbesondere in der Suche nach dem erforderlichen Kontext für untergebrachte Abfragen und der Worst-Case-Zuverlässigkeit. Wir freuen uns auf die Vermittlung von untergebrachten Ergebnissen.

Die Instruments sind auf GitHub öffentlich verfügbar.

Der größere Pattern

Der CEO von OpenAI, Sam Altman, battle Anfang dieses Jahres Teil der Pressekonferenz von Präsident Donald Trump zu Ankündigung des Begins von Mission Stargate. Dieses 500 -Milliarden -Greenback -Projekt würde sich auf die Entwicklung der physischen und virtuellen Infrastruktur zur Strombau von KI konzentrieren, einschließlich KI, um die Gesundheitsergebnisse zu verbessern.

Die Accomplice, die auch enthielten Orakel Chief Know-how Officer, Larry Ellison und SoftbankDer CEO von Masayoshi, Sohn, beobachtete das Projekt als Sport Changer für die Gesundheitsversorgung.

Altman sagte während der Pressekonferenz, er sei begeistert, Teil von Stargate zu sein, und erwartet, dass Krankheiten mit beispielloser Geschwindigkeit geheilt werden.

Ellison fügte hinzu, dass ein Krebsimpfstoff eines der “aufregendsten” Dinge ist, an denen die Gruppe arbeitet, und die Werkzeuge, die Altman und Sohn anbieten, verwendet.

Anfang dieses Monats berichtete die Monetary Instances das Mission Stargate erwog internationale Growthmit seinem Prime -Land der Wahl in Großbritannien. Deutschland und Frankreich sind auch attraktive Kandidaten.

Allerdings diese Woche, Bloomberg berichtete dass das Projekt aufgrund der durch Trump und wirtschaftlichen Unsicherheit erhobenen Zölle Verzögerungen ausgesetzt ist.

Aufgrund der wirtschaftlichen Unsicherheit und der wachsenden Marktvolatilität sind Banken und institutionelle Anleger in Ansichten in Stargate vorsichtig, insbesondere da die Baukosten für Rechenzentrum aufgrund von US-Tarifen, insbesondere in Chips, Server-Racks und Kühlsystemen, ungewiss sind.

Darüber hinaus hat die SoftBank, die sich verpflichtet hat, innerhalb der nächsten vier Jahre eine sofortige 100 Milliarden US -Greenback im Projekt zu spenden, mit dem Ziel, 500 Milliarden US -Greenback zu werden, laut Bloomberg noch keine Finanzierungsvorlage oder Diskussionen mit potenziellen Unterstützern zu beginnen.

Tags: bewertenderDieenthülltGesundheitswesenHealthBenchLLMsOpenAISicherheit
Advertisement Banner
Previous Post

Wie 100 Kalorien verschiedener Nüsse aussehen

Next Post

Was ich über die mediterrane Diät in Griechenland gelernt habe

admin

admin

Next Post
Was ich über die mediterrane Diät in Griechenland gelernt habe

Was ich über die mediterrane Diät in Griechenland gelernt habe

Discussion about this post

Recommended

Griechischer Mizuna -Salat mit Sumac Spice French dressing

Griechischer Mizuna -Salat mit Sumac Spice French dressing

5 months ago
JM Monetary Assessment 2024 – Betrugshelfer

Investbridge Capital Evaluation 2024 – Betrugshelfer

1 year ago

Don't Miss

Verschrostung der Geheimnisse bis zu 100 bis 100

Verschrostung der Geheimnisse bis zu 100 bis 100

October 5, 2025
Offener Thread: Favorit One Hit Wunder

Offener Thread: Favorit One Hit Wunder

October 5, 2025
Einfache Mungbohnenbeweg mit braunem Reis braten

Einfache Mungbohnenbeweg mit braunem Reis braten

October 5, 2025
Versicherungsführer aus allen Staaten wollen eine schnelle Lösung im ACA -Abschaltkampf: Schüsse

Versicherungsführer aus allen Staaten wollen eine schnelle Lösung im ACA -Abschaltkampf: Schüsse

October 5, 2025

Über uns

Willkommen bei Gesundimaltermag!

Bei Healthy Imaltermag möchten wir Sie mit Leidenschaft dabei unterstützen, Ihr Leben so gesund und glücklich wie möglich zu leben. Unsere Mission ist es, Ihnen zuverlässige, aktuelle Informationen und praktische Tipps zu einer Vielzahl von Themen im Zusammenhang mit Gesundheit und Wohlbefinden zu bieten.

Folgen Sie uns

Neueste Nachrichten

Verschrostung der Geheimnisse bis zu 100 bis 100

Verschrostung der Geheimnisse bis zu 100 bis 100

October 5, 2025
Offener Thread: Favorit One Hit Wunder

Offener Thread: Favorit One Hit Wunder

October 5, 2025

Kategorien

  • Bewegung
  • Ernährung
  • Gesundheitstipps
  • Schlaf
  • Senioren
  • Uncategorized
  • Wohlbefinden

Stichworte

auf Aufnahmen bei Betrugshelfer das dem den der des Die Dollar ein eine einen für Gesundheit Health Ihre ist Living man mehr Millionen mit nach Neue NormaZager.com Planet Quest Review Rezept Schlaf Senior sich Sie sind Tipps und von vor Warum wie zum zur über
  • Über uns
  • Haftungsausschluss
  • Datenschutzrichtlinie
  • Kontaktiere uns
  • Impressum

© 2024- gesundimaltermag.de . All Rights Reserved

No Result
View All Result
  • Home
  • Ernährung
  • Schlaf
  • Bewegung
  • Gesundheitstipps
  • Wohlbefinden

© 2024- gesundimaltermag.de . All Rights Reserved