DeepBreath : un simple stéthoscope électronique pour poser trois diagnostics pédiatriques

  • Caroline Guignot
  • Résumé d’article
L'accès à l'intégralité du contenu de ce site est reservé uniquement aux professionnels de santé disposant d'un compte. L'accès à l'intégralité du contenu de ce site est reservé uniquement aux professionnels de santé disposant d'un compte.

À retenir

  • Une équipe suisse a développé un algorithme d’apprentissage automatique capable de discriminer trois diagnostics respiratoires chez l’enfant à partir de l’enregistrement de la respiration par un stéthoscope électronique : la bronchiolite, la pneumonie et les pathologies sifflantes (bronchite et asthme).
  • Les performances de l’outil, baptisé DeepBreath, permettent de discriminer ces maladies avec une performance de près de 90% (aire sous la courbe).
  • Il pourrait être utilisé dans des contextes où les examens cliniques sont mal interprétés ou le recours à un médecin expert est compliqué ou impossible.

Pourquoi est-ce important ?

Les troubles respiratoires liés aux différentes pathologies pulmonaires sont détectables par stéthoscope mais la capacité à poser un diagnostic étiologique différentiel à leur simple écoute reste limitée pour l’oreille humaine. Cette limitation peut être dépassée grâce à l'apprentissage automatique (deep learning), qui a le potentiel de discriminer finement des signaux audio quasiment similaires. Plus précisément, les réseaux de neurones convolutifs, qui ont été développés dans la reconnaissance d’images par apprentissage automatique ont été plus récemment adaptés au champ des signaux auditifs.

Dans cette approche, la prédiction diagnostique est faite a priori à partir des enregistrements acquis à plusieurs endroits anatomiques chez chaque patient. Par ailleurs, l’algorithme développé dans un premier temps sur des données collectées de manière indépendante a été validé via une cohorte externe afin d’assurer l'interprétabilité et la robustesse prédictive du modèle, ce qui n’a pu être réalisé pour les outils préalablement développés. Cette étude a dans cet objectif inclut une cohorte de patients dont les diagnostics, âge et répartition géographique étaient variés.

Méthodologie

Une cohorte observationnelle multicentrique internationale (5 pays participants) a été constituée en recrutant 572 patients de moins de 16 ans accueillis en consultation externe au sein d’un service hospitalier pédiatrique constitués de cas (71%) ayant une pneumonie, une bronchiolite ou une respiration sifflante (asthme ou bronchite obstructive) ou de témoins (29%). Ceux qui avaient une maladie chronique respiratoire ou cardiaque connue étaient exclus. Chacun a fait l’objet d'enregistrements digitaux (durée moyenne 28,4 secondes) de leur respiration sur 8 sites anatomiques via un stéthoscope électronique. Les enregistrements étaient classés dans l'une des quatre catégories de diagnostic clinique (contrôle, pneumonie, sifflement et bronchiolite) après évaluation médicale complète réalisée par un pédiatre expert. Le modèle final intégrait aussi plusieurs variables cliniques (âge, fréquence respiratoire). Les deux cohortes les plus nombreuses parmi les 5 pays ont été utilisées pour la phase de développement de l’algorithme et celles recrutées par les trois autres ont été utilisées pour la validation externe.

DeepBreath a été entraîné pour discriminer de façon binaire chaque type de diagnostic par rapport aux trois autres considérés comme un tout. Les prédictions ont été obtenues pour chaque patient en combinant les prédictions de chacun des 8 sites anatomiques.

Principaux résultats

DeepBreath est apte à discriminer les patients sains des patients malades avec une aire sous la courbe (AUROC) interne de 0,931 et de 0,887, selon la validation externe. Les valeurs AUROC internes et externes associées à la capacité prédictive de la pneumonie étaient de 0,75 et 0,89 respectivement, ainsi que 0,91 et 0,74 pour les pathologies sifflantes et 0,94 et 0,87 pour la bronchiolite.

Les performances de DeepBreath étaient maintenues lorsque le nombre d’enregistrements et leur durée étaient réduits à 4 positions anatomiques et 5-10 secondes respectivement.