Les médecins ne sont pas aussi efficaces pour diagnostiquer les maladies de la peau en se basant uniquement sur des images de la peau d’un patient lorsque celui-ci a la peau plus foncée, selon une nouvelle étude menée par des chercheurs du MIT.

L’étude, qui a impliqué plus de 1 000 dermatologues et médecins généralistes, a révélé que les dermatologues ont caractérisé avec précision environ 38 pour cent des images qu’ils ont vues, mais seulement 34 pour cent des images montrant une peau plus foncée. Les médecins généralistes, qui étaient globalement moins précis, ont montré une baisse de précision similaire avec une peau plus foncée.

L’équipe de recherche a également découvert que l’aide d’un algorithme d’intelligence artificielle pourrait améliorer la précision des médecins, même si ces améliorations étaient plus importantes dans le diagnostic des patients à la peau plus claire.

Bien qu’il s’agisse de la première étude à montrer des différences de diagnostic entre médecins liées au teint, d’autres études ont révélé que les images utilisées dans les manuels de dermatologie et les supports de formation montrent principalement des tons chair plus clairs. Selon l’équipe du MIT, cela pourrait être un facteur contribuant à cet écart, ainsi que la possibilité que certains médecins aient moins d’expérience dans le traitement des patients à la peau plus foncée.

« Ce n’est probablement pas l’intention d’un médecin d’aggraver n’importe quel type de personne, mais c’est peut-être parce que vous n’avez pas toutes les connaissances et l’expérience et que vous pourriez donc avoir des résultats pires chez certains groupes de personnes », explique Matt Groh, PhD. 23 ans, professeur adjoint à la Kellogg School of Management de l’Université Northwestern. « C’est l’une de ces situations où vous avez besoin de preuves empiriques pour déterminer comment modifier les politiques de formation en dermatologie. »

Groh est l’auteur principal de l’étude, qui paraît aujourd’hui dans Médecine naturelle. Rosalind Picard, professeur d’arts et de sciences médiatiques au MIT, est l’auteur principal de l’article.

Écarts de diagnostic

Il y a quelques années, une étude du MIT dirigée par Joy Buolamwini PhD ’22 a révélé que les programmes d’analyse faciale présentaient des taux d’erreur beaucoup plus élevés lors de la prédiction du sexe des personnes à la peau foncée. Cette découverte a inspiré Groh, qui étudie la collaboration homme-IA, à rechercher si les modèles d’IA, et peut-être les médecins eux-mêmes, pourraient avoir des difficultés à diagnostiquer les maladies de la peau sur des tons de peau plus foncés – et si ces capacités de diagnostic pourraient être améliorées.

« Cela semblait être une excellente occasion de déterminer s’il existe un problème social et comment nous pourrions le résoudre, ainsi que de déterminer la meilleure façon d’intégrer le soutien de l’IA dans la prise de décision médicale », explique Groh. « Je suis très intéressé par la façon dont nous pouvons appliquer l’apprentissage automatique à des problèmes du monde réel, en particulier par la façon dont nous pouvons aider les experts à mieux faire leur travail. La médecine est un domaine dans lequel les gens prennent des décisions très importantes et se demandent si nous pourrions améliorer leurs décisions. Grâce à la fabrication, nous pourrions améliorer les résultats pour les patients.

Pour évaluer l’exactitude du diagnostic des médecins, les chercheurs ont compilé une série de 364 images provenant de manuels de dermatologie et d’autres sources illustrant 46 maladies de peau sur un large éventail de tons de peau.

La plupart de ces images montraient l’une des huit maladies inflammatoires de la peau, dont la dermatite atopique, la maladie de Lyme et la syphilis secondaire, ainsi qu’une forme rare de cancer, le lymphome cutané à cellules T (CTCL), qui peut ressembler à une maladie inflammatoire de la peau. Beaucoup de ces maladies, y compris la maladie de Lyme, peuvent apparaître différemment sur une peau foncée ou claire.

L’équipe de recherche a recruté des sujets pour l’étude via Sermo, un site de réseautage social destiné aux médecins. L’ensemble du groupe d’étude comprenait 389 dermatologues certifiés, 116 résidents en dermatologie, 459 médecins généralistes et 154 autres types de médecins.

Chaque participant à l’étude a vu 10 des images et a demandé ses trois principales prédictions sur la maladie que chaque image pourrait représenter. On leur a également demandé s’ils orienteraient le patient vers une biopsie. Il a également été demandé aux médecins généralistes s’ils orienteraient le patient vers un dermatologue.

« Ce n’est pas aussi complet que le triage en personne, où le médecin peut examiner la peau sous différents angles et contrôler l’éclairage », explique Picard. « Cependant, les images cutanées sont plus évolutives pour le triage en ligne et peuvent être facilement saisies dans un algorithme d’apprentissage automatique qui peut estimer rapidement les diagnostics probables. »

Sans surprise, les chercheurs ont constaté que les spécialistes en dermatologie avaient des taux de précision plus élevés : ils ont classé correctement 38 pour cent des images, contre 19 pour cent pour les médecins généralistes.

Les deux groupes ont perdu environ quatre points de pourcentage de précision en essayant de diagnostiquer des affections cutanées à partir d’images de peau plus foncée – une baisse statistiquement significative. Les dermatologues étaient également moins susceptibles de référer les types de peau CTCL plus foncés pour une biopsie, mais étaient plus susceptibles de les référer pour une biopsie pour des maladies cutanées bénignes.

Un coup de pouce de l’IA

Après que les chercheurs ont eux-mêmes évalué les performances des médecins, ils leur ont également fourni des images supplémentaires à analyser à l’aide d’un algorithme d’IA développé par les chercheurs. Les chercheurs ont formé cet algorithme sur environ 30 000 images et lui ont demandé de classer les images comme l’une des huit maladies représentées par la plupart des images, plus une neuvième catégorie « autres ».

Cet algorithme avait un taux de précision d’environ 47 pour cent. Les chercheurs ont également développé une autre version de l’algorithme avec un taux de réussite artificiellement gonflé de 84 pour cent. Cela leur a permis d’évaluer si l’exactitude du modèle influencerait la probabilité que les médecins suivent ses recommandations.

« Cela nous permet d’évaluer la prise en charge de l’IA avec des modèles qui sont actuellement les meilleurs que nous puissions créer, et avec une prise en charge de l’IA qui pourrait être plus précise dans cinq ans, avec de meilleures données et de meilleurs modèles », explique Groh.

Les deux classificateurs sont tout aussi précis sur les peaux claires et foncées. Les chercheurs ont découvert que l’utilisation de l’un de ces algorithmes d’IA améliorait la précision à la fois pour les dermatologues (jusqu’à 60 %) et les médecins généralistes (jusqu’à 47 %).

Ils ont également constaté que les médecins étaient plus susceptibles d’accepter les suggestions de l’algorithme avec une plus grande précision après avoir produit quelques réponses correctes, mais qu’ils prenaient rarement en compte les suggestions incorrectes de l’IA. Cela suggère que les médecins sont très doués pour exclure les maladies et n’accepteront pas les suggestions de l’IA pour une maladie qu’ils ont déjà exclue, dit Groh.

« Ils sont plutôt doués pour ne pas suivre les conseils de l’IA lorsque l’IA a tort et que les médecins ont raison. C’est quelque chose que vous devez savoir », dit-il.

Alors que les dermatologues utilisant l’IA ont montré une augmentation similaire de la précision lors de la visualisation d’images de peau claire ou foncée, les médecins généralistes ont montré une plus grande amélioration lors de la visualisation d’images de peau plus claire que d’images de peau plus foncée.

« Cette étude nous permet de voir non seulement l’impact du support de l’IA, mais également son impact sur tous les niveaux de compétences », explique Groh. « Ce qui se passe peut-être, c’est que les médecins de premier recours n’ont pas autant d’expérience et ne savent donc pas s’il faut exclure une maladie ou non, car ils n’approfondissent pas aussi profondément les détails des différentes maladies de la peau. ressembler à des tons de peau différents. »

Les chercheurs espèrent que leurs résultats contribueront à encourager les écoles de médecine et les manuels scolaires à proposer davantage de formation aux patients à la peau plus foncée. Les résultats pourraient également servir de guide pour l’utilisation des programmes de soutien à l’IA en dermatologie que de nombreuses entreprises développent actuellement.

La recherche a été financée par le MIT Media Lab Consortium et le Harold Horowitz Student Research Fund.



Source