Dans une étude récemment publiée dans la revue oncologie de précision npjdes chercheurs ont mené une revue systématique pour examiner l’exactitude de l’apprentissage profond (DL) dans le diagnostic du cancer du sein par échographie (États-Unis) par rapport aux lecteurs humains en milieu clinique.

Ils ont constaté qu’il n’y avait pas suffisamment de preuves pour déterminer si la DL était plus performante que les lecteurs humains ou augmentait la précision de l’échographie diagnostique du sein en milieu clinique.

Étude : Performance diagnostique de l'apprentissage profond dans le diagnostic échographique du cancer du sein : une revue systématique.  Source de l'image : Gorodenkoff/Shutterstock.comÉtude: Performance diagnostique de l’apprentissage profond dans le diagnostic échographique du cancer du sein : une revue systématique. Crédit photo : Gorodenkoff/Shutterstock.com

arrière-plan

Le cancer du sein, le cancer le plus répandu dans le monde, a causé 685 000 décès en 2020. Un diagnostic précoce et précis est crucial.

Les États-Unis constituent un outil de diagnostic peu coûteux, sans rayonnement et efficace, en particulier dans les cas de tissu mammaire dense ou de lésions occultes, et fournissent des conseils pour les procédures de biopsie. Cependant, c’est un diagnostic efficacité et la reproductibilité sont entravées par des facteurs dépendants de l’opérateur.

DL est une puissante technologie d’intelligence artificielle qui s’est avérée efficace dans les tâches liées à l’image et qui améliore l’efficacité et la précision des flux de travail d’imagerie médicale, en particulier dans le diagnostic de maladies telles que le cancer.

Des rapports récents suggèrent que l’analyse DL de l’examen échographique du sein pourrait être comparable ou supérieure à celle des radiologues humains, mais son application clinique reste controversée.

Par conséquent, dans la présente revue, les chercheurs se sont concentrés sur les performances diagnostiques globales de la DL dans l’échographie du sein en comparant les systèmes DL autonomes avec ceux des radiologues et en évaluant le rôle de soutien de la DL aux côtés des lecteurs humains.

À propos de l’étude

Dans la présente étude, une recherche dans la base de données suivie de l’application de critères stricts d’inclusion et d’exclusion a finalement donné lieu à 16 études portant sur 9 238 femmes de différents pays.

Ces études ont été sélectionnées sur la base du cadre PICO (abréviation de population, intervention, comparaison, résultat) et ont utilisé des réseaux neuronaux convolutifs DL, 14 d’entre elles utilisant des systèmes DL commerciaux.

La plupart des études incluses étaient de nature diagnostique et la pathologie servait de référence dans chacune d’entre elles. La qualité des études a été évaluée à l’aide de versions adaptées des outils Quality for Assessment of Diagnostic Studies-2 (QUADAS-2) et QUADAS-C.

DL pourrait être utilisé comme un outil autonome ou pour aider les radiologues dans le but d’améliorer leurs compétences en diagnostic.

Quatre études ont évalué le DL comme indépendant, deux comme favorable et dix ont examiné les deux rôles. Pour évaluer les performances de la DL, des lecteurs humains ayant une expérience clinique variable en échographie mammaire ont été recrutés.

Résultats et discussion

Dans 14 études dans lesquelles le DL a été examiné en tant que système autonome pour l’échographie du sein, des comparaisons avec des observateurs humains ont été effectuées. Alors qu’une étude a révélé que l’aire sous la courbe (AUC) de DL était inférieure à celle des lecteurs humains, deux ont montré une AUC équivalente et une a rapporté une AUC plus élevée pour DL.

Le DL présentait une ASC plus élevée que celle des lecteurs humains moins expérimentés, mais était comparable à celle des lecteurs expérimentés dans trois études. En termes de précision, DL a surpassé tous les lecteurs humains et les lecteurs moins expérimentés dans deux études, mais s’est avéré comparable aux lecteurs expérimentés dans une autre étude.

Le DL a montré une sensibilité inférieure à celle des lecteurs humains dans cinq études et une spécificité plus élevée dans cinq études, bien que les résultats variaient dans les autres études.

Dans 12 études évaluant les systèmes d’assistance DL pour l’échographie du sein, trois ont rapporté une amélioration de l’ASC en association avec des lecteurs humains. Une étude a révélé que l’AUC est comparable à celle des lecteurs humains. Pour les lecteurs humains moins expérimentés, les systèmes d’assistance DL présentaient une AUC plus élevée mais aucun effet positif sur les lecteurs expérimentés.

Lorsqu’ils ont été testés pour leur précision, les systèmes d’assistance DL ont démontré une précision supérieure à celle des lecteurs humains dans trois études. Cependant, aucune amélioration de la sensibilité globale n’a été observée lors de la combinaison du DL avec des lecteurs humains.

Dans sept études utilisant des systèmes d’assistance DL, une spécificité accrue a été observée chez les lecteurs humains, l’effet sur la spécificité différant entre les lecteurs expérimentés et moins expérimentés.

Lors de l’évaluation de la qualité, les études incluses dans la présente revue ont montré un risque élevé de biais dans divers domaines. La plupart des études ont montré un fort biais dans la sélection des patients en raison de la prévalence du cancer, qui était significativement plus élevée que les scénarios réels.

De plus, les conceptions des études ne reflétaient pas pleinement les flux de travail cliniques, car les systèmes DL étaient utilisés pour lire les images mais n’étaient pas intégrés dans les décisions cliniques finales. Les parcours des lecteurs humains n’avaient pas accès aux informations cliniques sur les patients et les normes de référence variaient d’une étude à l’autre.

Il convient de noter que certaines études comportaient une courte période de suivi pour les femmes dont les tests étaient négatifs, ce qui pourrait avoir affecté l’évaluation des cancers manqués et l’exactitude globale du diagnostic.

Diplôme

En conclusion, cette revue complète évaluant les performances diagnostiques des systèmes DL dans l’échographie du sein a révélé une variabilité significative dans les résultats.

Bien que les systèmes DL présentaient des avantages potentiels en termes de spécificité, il n’y avait pas de consensus sur l’ASC, la précision ou la sensibilité, qu’ils soient utilisés seuls ou comme aides à la lecture humaine.

Des préoccupations ont été soulevées concernant les biais, l’hétérogénéité des études et les limites de la généralisabilité, en particulier pour les études axées sur l’Asie. La revue souligne la nécessité de directives de recherche standardisées sur la DL, de références cohérentes et d’études multicentriques pour garantir la reproductibilité et l’applicabilité clinique.

Les preuves actuelles ne soutiennent pas de recommandations cliniques générales pour les systèmes DL dans l’échographie du sein et justifient des recherches et des développements supplémentaires dans ce domaine.



Source