Cancer de la prostate : réduire le temps de saisi des données grâce à l’intelligence artificielle

  • Nathalie Barrès
  • Actualités Médicales
L'accès à l'intégralité du contenu de ce site est reservé uniquement aux professionnels de santé disposant d'un compte. L'accès à l'intégralité du contenu de ce site est reservé uniquement aux professionnels de santé disposant d'un compte.

À retenir 

Une équipe française a développé un système informatique permettant de générer de manière automatique la collecte de données des cas incidents d’adénocarcinome prostatique dans le registre du cancer du Bas-Rhin. Sur les 800 cas environ apparaissant chaque année, ce procédé par « machine learning » a permis d’identifier de manière automatique environ 600 nouveaux cas de cancer de la prostate et de pré-remplir les données correspondantes. L’enregistrement automatique correcte d’environ 80% des cas prévus permet aux techniciens de se concentrer uniquement sur les cas pour lesquels il manque des informations et dont les dossiers médicaux doivent être consultés. Ces techniques d’intelligence artificielle permettent de réduire les retards de saisie des données et de laisser aux investigateurs plus de temps pour des travaux d’analyse plus complexes. Le temps nécessaire pour le traitement des données relatives au cancer de la prostate sur cette zone test a été diminué de moitié en 2016 grâce à ce procédé.

Pourquoi ces résultats sont intéressants ?

Les données enregistrées dans les registres du cancer augmentent d’année en année rendant leur saisie manuelle de plus en plus fastidieuse. Le registre le plus ancien est celui du département du Bas-Rhin, celui-ci recueille de manière exhaustive les données de tous les nouveaux cas de cancer déclarés sur le territoire. Jusqu’à présent des techniciens saisissaient manuellement les informations pertinentes sur les tumeurs (topographie, morphologie, classification des tumeurs, marqueurs biologiques…). Les cas enregistrés sont codés selon la classification internationale CIM-03. Sept personnes travaillent à plein temps pour traiter environ 70.000 notifications par an, dont 6.000 nouveaux cas de cancer.

Méthodologie

Les données provenant de différentes sources et incluses dans le registre du cancer du Bas-Rhin ont été utilisées pour l’étude. Celles-ci compilent les données pathologiques et diagnostiques (code CIM-10) à partir des données hospitalières et des caisses d’assurance maladie. Un système de « machine learning » a été utilisé pour prédire quelles données devaient être considérées ou non comme étant en lien avec un cas incident d’adénocarcinome prostatique. Pour cela l’algorithme a été basé sur des mots clés à sélectionner et en lien avec l’adénocarcinome prostatique.

Principaux résultats

Deux analyses successives ont été réalisées : une première sur la base de 982 cas étiquetés manuellement à partir des données de 2014. L’algorithme a prédit 663 nouveaux cas d’adénocarcinomes prostatiques en 2015, dont 660 cas réellement incidents (soit une précision de 99,5%). Quinze cas ont été mal classés. Parmi ces 663 cas incidents, 641 ont pu être enregistrés correctement de manière automatique (soit une précision de 97%). La procédure a été réitérée à partir de 2.089 cas étiquetés manuellement entre 2014 et 2015 afin de prédire l’enregistrement de 926 cas soumis en 2016. L’algorithme a identifié 610 nouveaux cas en 2016. Certains de ces cas étaient déjà associés à un autre cancer. L’algorithme a donc enregistré 531 nouveaux cas d’adénome prostatique en 2016 (soit une précision de 96%). Les enregistrements non corrects étaient dus à un lieu de résidence non identifié sur le territoire. La précision globale de l’algorithme était de 99% et les principaux indicateurs étaient les tests PSA, le score de Gleason, la date d’incidence.