Американцы просят ИИ о медицинской помощи. Больницы делают ставку на чат-ботов.

ии чат-боты здравоохранение Llm медицина arstechnica.com

Доверяете ли вы чат-ботам с ИИ для получения медицинских советов? А тому, что находится в вашем пациентском портале? Больницы внедряют собственные ИИ-помощники на фоне растущего использования LLM американцами. — arstechnica.com

Поскольку многие американцы обращаются к большим языковым моделям (LLM) за советами по вопросам здоровья, системы здравоохранения по всей стране рассматривают и даже внедряют собственные брендированные чат-боты в попытке использовать этот уже популярный инструмент и направить больше людей к своим услугам. Однако эта бурно развивающаяся тенденция немедленно вызывает вопросы и опасения относительно сложной и, как правило, неэффективной системы здравоохранения страны.

Руководители представляют новые предложения как удобство для пациентов, стремясь встретиться с людьми там, где они находятся, и предоставить услугу с цифровым равенством. Они также предполагают, что их чат-боты станут более безопасной альтернативой коммерческим версиям, которые люди используют сейчас.

«Мы находимся в переломном моменте в здравоохранении», — заявил Аллон Блох, генеральный директор компании клинического ИИ K Health. «Спрос растет, и пациенты уже используют ИИ для навигации в своей жизни».

K Health работает с партнером Hartford HealthCare в Коннектикуте над внедрением своего чат-бота PatientGPT для десятков тысяч своих существующих пациентов.

«Вопрос не в том, сформирует ли ИИ здравоохранение, а в том, как мы сделаем это безопасным, прозрачным способом, внутри системы здравоохранения, которая связана с вашими медицинскими записями и вашей командой по уходу. PatientGPT знаменует этот поворотный момент».

Однако некоторые эксперты с опаской относятся к внедрению, поднимая вопросы о том, готовы ли чат-боты к таким брендированным дебютам, будет ли достаточный мониторинг, как будет выглядеть ответственность, а также является ли это ответом на проблемы с оказанием помощи, которые на самом деле поднимают пациенты.

Пока эти риски и вопросы витают в воздухе, выгоды для пациентов остаются лишь гипотетическими. «Это заманчивая идея», — недавно сказал Stat News Адам Родман, исследователь клинического мышления и врач в Медицинском центре Бет-Израиль-Диконесс в Бостоне. Но пока нет доказательной базы, подтверждающей, что интеграция чат-ботов в системы здравоохранения улучшает результаты лечения пациентов. «Мы еще не достигли этого», — сказал он.

Ключевой контекст

Чтобы оценить потенциальную роль ИИ, полезно рассмотреть более широкий контекст здравоохранения США. Америка — одна из самых богатых стран мира, но ее система здравоохранения стабильно и значительно отстает от систем других стран с высоким уровнем дохода. У американцев более низкая продолжительность жизни, больше предотвратимых смертей, более высокий уровень материнской и младенческой смертности, а также более высокий уровень ожирения и хронических заболеваний. У американцев меньше доступа к медицинской помощи и худшие показатели здоровья. США являются исключением, поскольку не предоставляют всеобщего медицинского обслуживания. Отчет за 2023 год показал, что почти треть американцев — более 100 миллионов человек — не имеют врача первичной медико-санитарной помощи.

Теперь в эту смесь вошел искусственный интеллект. Любой, у кого есть доступ в Интернет, может получить доступ к успокаивающим, уверенно звучащим чат-ботам на базе LLM, и американцы массово обращаются к этим новым инструментам с вопросами о здоровье и медицине. Опрос KFF, проведенный в прошлом месяце, показал, что каждый третий взрослый использовал чат-бот с ИИ для получения информации о здоровье.

Среди тех, кто использовал ИИ, 41 процент сообщили, что загружали личную медицинскую информацию, например, результаты анализов, в этот инструмент. Когда их спрашивали о «главных» причинах обращения к ИИ, 19 процентов ответили, что это потому, что они не могли позволить себе лечение, а 18 процентов указали на отсутствие постоянного врача или невозможность записаться на прием. Между тем, 65 процентов заявили, что им просто нужен был быстрый ответ. В итоге многие сказали, что не продолжили общение с врачом после консультаций с ИИ, включая 58 процентов, которые спрашивали о психическом здоровье, и 42 процента, которые спрашивали о физическом здоровье.

Явные опасения

Поскольку так много американцев используют ИИ для восполнения пробелов в здравоохранении, теперь появляется все больше предостерегающих историй и ужасающих случаев. Эти примеры высвечивают подводные камни как в том, о чем спрашивают LLM, так и в информации, которую они поглощают.

В феврале в исследовании, опубликованном в Nature Medicine, с участием почти 1300 человек, была предпринята попытка оценить медицинскую точность LLM (в частности, GPT-4o, Llama 3 и Command R+) в реальных взаимодействиях. Когда исследователи предоставляли LLM текст конкретных медицинских сценариев, модели ИИ могли правильно определить медицинское состояние примерно в 95 процентах случаев и правильно определить следующие шаги — например, обращение в отделение неотложной помощи — примерно в 56 процентах случаев. Но когда участники использовали свои собственные запросы для вопросов о тех же медицинских сценариях, LLM смогли помочь правильно определить медицинское состояние лишь примерно в трети случаев. Модели ИИ направляли участников к соответствующему следующему шагу только в 43 процентах случаев.

Исследование, по сути, показывает, что «люди не знают, что именно они должны сообщать модели», — сказал NPR в прошлом месяце ведущий автор Эндрю Бин, исследователь ИИ из Оксфордского университета.

Старший автор Адам Махди добавил: «Разрыв между эталонными показателями и реальной производительностью должен стать тревожным сигналом для разработчиков и регуляторов ИИ».

Затем возникает озабоченность по поводу качества медицинской информации, которую могут извлекать LLM. Буквально на прошлой неделе Nature News сообщила, что LLM обсуждали с пользователями «биксономанию» — кожное заболевание, полностью выдуманное исследователями из Швеции. Команда разместила в Интернете две фальшивые статьи об этом заболевании, желая проверить, насколько легко медицинская дезинформация будет воспринята инструментами ИИ. Ответ был: слишком легко. Позже они удалили эти статьи.

Внедрение продолжается

Тем не менее, несколько систем здравоохранения продолжают внедрять собственные чат-боты. PatientGPT от Hartford HealthCare и K Health был запущен в бета-версии для избранных пациентов в прошлом месяце, и компания планирует расширить развертывание еще на десятки тысяч на этой неделе, по данным Stat.

Hartford опубликовала предварительный отчет (не прошедший рецензирование) с участием 75 участников, который предположил, что их итеративное стресс-тестирование (также известное как подход red teaming) со временем улучшило показатель отказов, особенно в «сценариях высокого риска». Тестирование снизило показатель отказов в сценариях высокого риска с 30 процентов до 8,5 процента. Но что это означает в реальных условиях, неясно — как и то, насколько серьезными могут быть эти 8,5 процента отказов.

Согласно Stat, PatientGPT работает в двух режимах: режим общего ответа на медицинские вопросы, который может включать информацию о пациенте; или режим «медицинского сбора анамнеза», в котором пациент начинает предоставлять информацию о симптомах, а чат-бот становится менее разговорчивым и начинает следовать клиническим блок-схемам. После того как агент ИИ соберет достаточно информации в режиме сбора анамнеза, он предоставит следующий шаг, включая назначение повторного приема у врача первичной помощи или обращение за неотложной или экстренной помощью. Если рекомендуется последнее, чат-бот прекращает отвечать на дальнейшие вопросы.

Hartford заявила, что продолжит отслеживать работу чат-бота на фоне более широкого развертывания. Во время пилотного проекта Hartford отслеживала каждое взаимодействие. Но теперь система перейдет к ручной проверке всего 20 взаимодействий в день, в то время как отдельный агент ИИ будет отслеживать остальные. Они также будут проводить пакетные исследования каждые 1000 разговоров.

«Наша миссия — стать самой клиентоориентированной системой здравоохранения в стране», — сказал в прошлом месяце Джефф Флакс, президент и генеральный директор Hartford HealthCare. «Так много в здравоохранении традиционно было организовано вокруг провайдера, но ясно, что мы должны встречаться с людьми там, где они находятся и где они хотят, чтобы с ними встречались. С PatientGPT мы представляем новый инструмент, который поддерживает ваше здоровье и обеспечивает доступ к команде по уходу 24/7, защищая при этом человеческие отношения, лежащие в основе ухода».

Более осторожный инструмент

Помимо PatientGPT, существует Emmie — чат-помощник на базе ИИ, выпускаемый Epic, гигантом в области электронных медицинских карт, стоящим за MyChart. Несколько систем здравоохранения медленно развертывают Emmie для пользователей через онлайн-портал, включая Sutter Health из Калифорнии и Reid Health из Индианы.

В своем обращении к руководству в прошлом году основатель и генеральный директор Epic, Джуди Фолкнер, описала Emmie как помощника, который может помочь пациентам подготовиться к приему, составляя повестки дня визитов, а после — помочь пациентам понять результаты анализов и ответить на последующие вопросы, согласно сообщению Becker’s Hospital Review.

В разделе часто задаваемых вопросов Sutter Health об Emmie отмечается, что чат-бот может «отвечать на общие вопросы о здоровье и находить или обобщать информацию, уже видимую в вашей карте — например, заметки, результаты, прошлые визиты или сообщения». Но подчеркивается, что он «не дает персонализированных медицинских советов и не принимает решений о лечении. Emmie не предназначен для использования при диагностике заболеваний или других состояний, а также для излечения, смягчения, лечения или профилактики заболеваний. Emmie также не предназначен для замены, изменения или подмены профессионального клинического суждения врача».

В настоящее время Emmie предлагается только небольшой части пациентов Sutter. Эти пациенты могут оставлять отзывы об ответах Emmie с помощью простых реакций «большой палец вверх» или «большой палец вниз».

Reid Health следует по стопам Sutter, став вторым пользователем Emmie. В интервью Becker’s на прошлой неделе Мухаммад Сиддики, ИТ-директор Reid Health, отметил, что система в основном обслуживает сельские общины и что компания рассматривает Emmie как способ расширить доступ и помочь пациентам ориентироваться в лечении.

«Пациенты хотят более четких ответов, более легкого доступа и большего руководства между визитами», — сказал Сиддики. «Если мы сможем предоставить это в рамках работы системы здравоохранения, способом, связанным с доверенными клиническими рабочими процессами, это гораздо лучший путь, чем оставлять людей наедине с общедоступными инструментами, которые могут быть или не быть точными».

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Похожие новости: