logo

OpenAI представила новый стандарт оценки мед ИИ

By: block-chain24|2025/05/14 12:15:08
0
Поделиться
copy
Компания представила HealthBench —открытый набор данных и оценочный инструмент, созданный для тестирования LLM на их способность обрабатывать медицинские диалоги. Он включает 5000 реалистичных медицинских разговоров, которые охватывают 26 медицинских специальностей, таких как нейрохирургия и офтальмология, и поддерживает 49 языков, включая ахмарский и непальский. Эти разговоры моделируют реальные сценарии взаимодействия между пациентами и врачами, что делает бенчмарк уникальным в своей реалистичности и масштабе. Основная цель HealthBench — оценить, насколько точно и безопасно ИИ-модели могут отвечать на запросы, связанные со здоровьем. Каждый ответ модели оценивается по специально разработанным рубрикам, созданным врачами, которые учитывают клиническую точность, полноту и соответствие медицинским стандартам. Рубрики содержат 48 562 уникальных критерия, что позволяет проводить глубокую и детализированную оценку. Запуск HealthBench вызвал интерес не только в медицинской и ИИ-сферах, но и в криптовалютном секторе. Некоторые аналитики предполагают, что стандартизация оценки медицинских ИИ-моделей может стимулировать спрос на блокчейн-решения в здравоохранении, особенно для управления медицинскими данными и обеспечения прозрачности. Несмотря на новаторский характер HealthBench, эксперты подчеркивают, что бенчмарк не является исчерпывающим. Реальная клиническая практика сложнее, чем смоделированные диалоги, и требует дополнительного тестирования в реальных условиях. Некоторые эксперты выражают скептицизм относительно заявлений, что ИИ в 4 раза превосходит врачей, указывая на необходимость критической оценки таких утверждений.

Вам также может понравиться

Учреждения, финансируемые Китаем, отказываются от стейблкоинов в Гонконге

Первый пакет лицензий на стейблкоины в Гонконге официально выдан: Учреждения, связанные с HSBC и Standard Chartered, получили единственные две лицензии, в то время как китайские учреждения были коллективно отсутствовали из-за влияния регуляторов материкового Китая.

Утренний обзор | На прошлой неделе компания Strategy инвестировала 1 млрд долларов в увеличение своих запасов биткойнов; Aave одобрила заявку на грант в размере 25 млн долларов; платформа Coinone была закрыта и оштрафована за нарушение обязательств по бор

Обзор важных событий на рынке 13 апреля

Обнаружил "мем-монету", которая взлетела за считанные дни. Есть ли какие-нибудь советы?

В китайском сообществе постепенно возник полноценный "Крипто-Оккультизм".

Эра "массового распределения монет" на публичных цепочках подходит к концу

Рынок становится все более разумным, и они отказываются от экосистем, которые полагаются исключительно на финансирование для поддержки ложной активности. Теперь вознаграждаются реальная пропускная способность, реальные пользователи и реальный доход.

TAO - это Илон Маск, который инвестировал в OpenAI, а Subnet - это Сэм Альтман

Большая часть капитала, вложенного в TAO, в конечном итоге будет субсидировать деятельность по разработке, которая не приносит пользы держателям токенов.

После блокады Ормузского пролива, когда закончится война?

США забрали у Ирана его самую важную карту, но также потеряли путь к окончанию войны

Популярные монеты

Последние новости криптовалют

Еще