Non classé

L’outil d’IA peut concevoir des réponses précises aux requêtes DSE des patients

[ad_1]

Dans le cadre d’une tendance nationale apparue pendant la pandémie, de plus en plus de patients de NYU Langone Health ont commencé à utiliser les dossiers de santé électroniques (DSE) pour poser des questions à leur médecin, renouveler leurs ordonnances et vérifier les résultats des tests. Bon nombre de ces demandes numériques provenaient d’un outil de communication appelé In Basket, intégré au système EPIC DSE de NYU Langone.

Bien que les médecins aient toujours passé du temps à gérer les messages du DSE, ils ont constaté ces dernières années une augmentation annuelle du nombre de messages reçus chaque jour, selon un article de Paul A. Testa, MD, directeur de l’information médicale à NYU Langone, de plus de 30 pour cent. Dr. Testa a écrit qu’il n’est pas rare que les médecins reçoivent plus de 150 messages par jour. Les systèmes de santé n’étant pas conçus pour gérer ce type de trafic, les médecins ont comblé le vide en passant de longues heures après leur travail à examiner les informations. Ce stress est cité comme la raison pour laquelle la moitié des médecins signalent un épuisement professionnel.

Aujourd’hui, une nouvelle étude menée par des chercheurs de la NYU Grossman School of Medicine montre qu’un outil d’IA peut formuler des réponses aux requêtes de DSE des patients avec autant de précision que leurs professionnels de la santé et avec une plus grande « empathie ». Les résultats mettent en évidence le potentiel de ces outils pour réduire considérablement le fardeau des cliniciens à l’hôpital tout en améliorant leur communication avec les patients, à condition que les prestataires humains examinent les versions préliminaires de l’IA avant de les envoyer.

NYU Langone a testé les capacités de l’intelligence artificielle générative (genAI), dans laquelle des algorithmes informatiques développent des options probables pour le mot suivant dans chaque phrase en fonction de la manière dont les gens ont utilisé les mots dans leur contexte sur Internet. L’un des résultats de cette prédiction du mot suivant est que les chatbots GenAI peuvent répondre aux questions dans un langage convaincant et semblable à celui d’un humain. NYU Langone a autorisé en 2023 « une instance privée » de GPT-4, le dernier parent du célèbre chatbot chatGPT qui permet aux médecins d’expérimenter avec de vraies données de patients tout en respectant les réglementations en matière de confidentialité.

Publié en ligne le 16 juillet dans Ouverture du réseau JAMALa nouvelle étude a examiné les projets de réponses générés par GPT-4 aux demandes des patients et a demandé aux médecins de soins primaires de les comparer avec les réponses humaines réelles à ces messages.

Nos résultats suggèrent que les chatbots pourraient réduire la charge de travail des prestataires de soins de santé en permettant des réponses efficaces et empathiques aux préoccupations des patients. Nous avons constaté que les chatbots IA intégrés au DSE utilisant des données spécifiques au patient peuvent rédiger des messages de qualité similaire à ceux des prestataires humains.


William Small, MD, Auteur principal de l’étude, professeur adjoint de clinique au département de médecine de la NYU Grossman School of Medicine

Pour l’étude, 16 médecins de soins primaires ont évalué 344 paires de réponses IA et humaines assignées au hasard aux messages des patients en termes d’exactitude, de pertinence, d’exhaustivité et de ton et ont indiqué s’ils utiliseraient la réponse IA comme première ébauche ou s’ils devaient commencer par rayures lors de l’écriture du message du patient. Comme il s’agissait d’une étude à l’aveugle, les médecins ne savaient pas si les réponses qu’ils examinaient étaient générées par des humains ou par l’outil d’IA.

L’équipe de recherche a constaté que l’exactitude, l’exhaustivité et la pertinence des réponses des fournisseurs d’IA générative et humains n’étaient pas statistiquement différentes. Les réponses de l’IA générative ont surpassé les fournisseurs humains de 9,5 % en termes de compréhensibilité et de tonalité. De plus, les réponses de l’IA étaient plus de deux fois plus susceptibles d’être considérées comme empathiques (125 % plus élevées) et étaient 62 % plus susceptibles d’utiliser un langage qui transmettait la positivité (peut-être liée à l’espoir) et la relativité (« Nous sommes dans cette situation). ensemble ») transmises.

D’un autre côté, les réponses de l’IA étaient également 38 % plus longues et 31 % plus susceptibles d’utiliser un langage complexe, de sorte que l’outil a encore besoin d’une formation supplémentaire, selon les chercheurs. Alors que les humains répondaient aux questions des patients au niveau de la sixième année, l’IA écrivait au niveau de la huitième année, selon une mesure standard de lisibilité, le score de Flesch-Kincaid.

Les chercheurs ont fait valoir que l’utilisation par les chatbots d’informations privées sur les patients plutôt que d’informations générales sur Internet était mieux adaptée à l’utilisation réelle de cette technologie. De futures études seront nécessaires pour confirmer si les données privées améliorent spécifiquement les performances des outils d’IA.

“Ce travail démontre que l’outil d’IA peut produire des projets de réponses de haute qualité aux requêtes des patients”, a déclaré l’auteur correspondant Devin Mann, MD, directeur principal de l’innovation informatique au NYU Langone Medical Center Information Technology (MCIT). “Avec cette approbation médicale, la qualité des messages GenAI sera dans un avenir proche comparable aux réponses générées par l’homme en termes de qualité, de style de communication et de facilité d’utilisation”, a ajouté le Dr. Mann, qui est également professeur aux départements de santé des populations et de médecine.

Les auteurs de l’étude de NYU Langone étaient aux côtés du Dr. Petit et le Dr. mari Beatrix Brandfield-Harvey, BS; Zoé Jonassen, Ph.D. ; Soumik Mandal, Ph.D. ; Elizabeth R. Stevens, MPH, PhD ; Vincent J. Major, Ph.D. ; Erin Lostraglio ; Adam C. Szerencsy, DO ; Simon A. Jones, PhD ; Yindalon Aphinyanaphongs, MD, PhD ; et Stephen B. Johnson, PhD. Parmi les autres auteurs figuraient Oded Nov, MSc, PhD, de la NYU Tandon School of Engineering, et Batia Mishan Wiesenfeld, PhD, de la NYU Stern School of Business.

L’étude a été financée par les subventions 1928614 et 2129076 du Fonds national de la science et par les subventions P500PS_202955 et P5R5PS_217714 du Fonds national suisse de la science.

[ad_2]

Source