Une nouvelle recherche présentée à l’ACR Convergence 2023, le congrès annuel de l’American College of Rheumatology (ACR), montre qu’un système d’apprentissage profond peut identifier et prédire avec précision le rétrécissement et les érosions de l’espace articulaire sur les radiographies des mains de patients atteints de polyarthrite rhumatoïde (PR) ( Résumé n° 0745).
Les rayons X sont la modalité d’imagerie la plus couramment utilisée pour détecter et surveiller la PR dans la main. Les radiologues utilisent souvent la méthode établie Sharp/van der Heidje (SvH) pour évaluer le rétrécissement et les érosions de l’espace articulaire en évaluant des emplacements spécifiques dans chaque main et poignet. Cependant, l’évaluation SvH prend du temps et nécessite une expertise qui n’est pas toujours disponible. Cela a conduit à une utilisation accrue de l’apprentissage profond (également appelé apprentissage automatique) pour analyser les données radiographiques des mains dans la PR.
Selon Carol Hitchon, MD, FRCPC, MSc, professeure agrégée à l’Université du Manitoba et chercheuse clinicienne en rhumatologie et co-auteure principale de l’étude : « L’apprentissage automatique offre une approche puissante et complémentaire aux méthodes traditionnelles de détection et de diagnostic de la PR. Il améliore la précision, l’efficacité et l’objectivité de l’évaluation radiographique de la PR, tout en offrant la possibilité de détecter précocement les dommages et d’obtenir des informations précieuses sur la maladie.
Pour la présente étude, Hitchon et ses collègues ont cherché à développer et à valider un système d’apprentissage profond pour détecter automatiquement les articulations et prédire les scores SvH dans les radiographies des mains de patients atteints de PR.
Ils ont utilisé un algorithme basé sur un réseau neuronal convolutif (CNN) appelé You Only Look Once (YOLO). CNN est un réseau neuronal d’apprentissage profond couramment utilisé dans les tâches de vision par ordinateur et de reconnaissance et a été utilisé avec succès dans la classification d’images médicales. YOLO est une sorte de modèle CNN spécialement conçu pour la détection d’objets en temps réel dans les images et les vidéos, et est connu pour sa rapidité et son efficacité dans le traitement des images. Hitchon et ses collègues ont utilisé une version récente de YOLOv516, qui, selon eux, pouvait détecter les poignets avec une précision supérieure à 90 %.
Le modèle YOLO a été formé pour détecter les articulations dans 240 radiographies de formation et 89 radiographies d’évaluation de mains pédiatriques de la base de données de la Radiologic Society of North America.
Les chercheurs ont encadré et étiqueté les différentes articulations d’intérêt : articulation interphalangienne proximale, articulation métacarpophalangienne, poignet, radius distal et cubitus distal. Le modèle de détection articulaire a été validé à l’aide de 54 radiographies étiquetées par des médecins provenant de quatre patients adultes atteints de PR suivis pendant plus d’une décennie.
Les chercheurs ont ensuite utilisé un modèle de transformateur de vision (VTM) pour prédire l’érosion et le rétrécissement de l’espace articulaire pour chaque articulation. Hitchon explique qu’un VTM est une architecture d’apprentissage en profondeur conçue pour traiter et comprendre efficacement des séquences de données.
Cela implique de diviser une image en petits patchs, de transformer ou d’aplatir les patchs en une séquence, de créer des intégrations linéaires de faible dimension à partir des patchs aplatis, d’ajouter les intégrations de position, puis d’introduire la séquence codée dans un encodeur de transformateur standard pour la tâche de prédiction restante. . «
Carol Hitchon, MD, FRCPC, MSc, professeure agrégée, Université du Manitoba
Le VTM a été validé à l’aide de plus de 2 200 radiographies des mains de 381 patients atteints de PR auxquels leur médecin a attribué un score SvH. Les patients appartenaient à la cohorte canadienne de l’arthrite précoce, une étude de recherche canadienne multicentrique. Ces radiographies évaluées ont été utilisées comme référence pour cette étude.
Le modèle de détection des articulations a été formé pour détecter l’ensemble du poignet, mais les chercheurs avaient des valeurs SvH pour des poignets individuels, ils ont donc formé un modèle distinct pour détecter le rétrécissement et l’érosion de l’espace articulaire dans chaque articulation.
Lorsqu’ils ont évalué la précision de leurs modèles, ils ont constaté que :
- Le modèle de détection des articulations a identifié avec précision les articulations cibles. Le score F1 pour les données pédiatriques était de 0,991 et le score F1 pour les adultes était de 0,812. (En apprentissage automatique, le score F1 est une mesure qui mesure la précision d’un modèle.)
- Les prédictions VTM du rétrécissement et de l’érosion de l’espace articulaire étaient extrêmement précises. L’erreur quadratique moyenne, qui évalue l’exactitude des prédictions, était respectivement de 0,91 et 0,93.
- Les modèles multitâches prédisaient l’érosion SvH et le rétrécissement de l’espace articulaire des poignets individuels avec une précision modérée (0,6 à 0,91).
Hitchon dit qu’ils n’ont pas été surpris par les performances de leur modèle.
« Les technologies d’IA que nous avons appliquées dans cette étude ont été utilisées avec succès et largement dans d’autres domaines, dont certains ont été commercialisés. Par rapport aux performances du modèle dans d’autres domaines, nos performances en matière de prédiction du score radiographique pour certains types d’articulations sont relativement médiocres, comme le poignet. (Cela) peut être dû à la taille relativement petite de l’échantillon de notre étude ou à la complexité de l’anatomie du poignet », note-t-elle.
Hitchon dit également que les performances du modèle pour les articulations telles que le poignet ne correspondent pas à celles des radiologues humains.
« Les modèles d’IA ne peuvent pas remplacer les radiologues humains pour le moment, mais ils constitueront d’excellents outils complémentaires qui peuvent améliorer la qualité et l’efficacité globales de l’analyse de l’évaluation radiographique lorsqu’ils sont utilisés conjointement avec l’évaluation du radiologue. De plus, (ces modèles) peuvent être applicables à l’interprétation de grandes quantités de rayons X dans les études cliniques.
L’étude présente deux limites principales : les radiographies ont été prises sur des cohortes composées presque entièrement de femmes blanches, et les résultats peuvent ne pas s’appliquer aux groupes raciaux et ethniques traditionnellement sous-représentés dans les études de recherche. Hitchon reconnaît que les résultats doivent être reproduits dans d’autres groupes. Le modèle est également incapable d’apprendre et de devenir plus précis avec les images ultérieures, bien que Hitchon affirme développer un nouveau cadre d’apprentissage en profondeur pour permettre au modèle d’apprendre continuellement à mesure que de nouvelles données deviennent disponibles.
Cette étude a été financée localement par la Health Science Centre Foundation, un organisme de bienfaisance hospitalier de Winnipeg, Manitoba, Canada. L’un des co-auteurs, Pingzhao Hu, est soutenu par le Programme des chaires de recherche du Canada. La cohorte canadienne de l’arthrite précoce, qui a fourni un ensemble de radiographies, est financée par de multiples sources.