Une étude présentée lors du 30e congrès de l’European Academy of Dermatology and Venereology (EADV) a mis en évidence les limites importantes d’une application destinée au grand public, dont l’objectif est de détecter les cancers cutanés. Cette application classait en effet comme à faible risque des cancers tels que le carcinome à cellules de Merkel (MCC) et le mélanome amélanotique.
Les chercheurs britanniques à l’origine de cette étude se sont focalisés sur les 2 types de cancers précités, qui sont rares mais particulièrement agressifs et exigent une prise en charge précoce. Ils ont créé une banque d’images de 116 images de ces cancers et de lésions bénignes (kératose séborrhéique et hémangiomes) et les ont évaluées dans deux modèles d’apprentissage automatique.
Le premier, un dispositif médical certifié vendu via l’App store, est présenté comme étant capable de diagnostiquer 95% des cancers cutanés. Le second est un outil de recherche et est utilisé ici comme référence.
Les résultats de l’étude montrent que le premier modèle classe comme à faible risque 17,9% des MCC et 22,9% des mélanomes amélanotiques. Mais 62,2% de lésions bénignes sont classées à haut risque. La sensibilité et la spécificité de ce modèle pour détecter une lésion maligne sont respectivement de 79,4% (IC 95% :69,3%-89,4%) et de 37,7% (IC 95% 24,7-50,8%). Avec le second modèle, les MCC ne font pas partie du top 5 des diagnostics pour les 28 images de ce cancer qui lui étaient proposées, ce qui fait penser qu’il est possible que ce modèle n’ait pas été entraîné à détecter l’existence de cette pathologie.
Ces résultats interpellent et interrogent : que dire des conséquences négatives possibles sur un plan personnel et de société du taux élevé de faux positifs observés avec le premier modèle ? Quelle est la sécurité d’utilisation des modèles d’intelligence artificielle disponibles sur le marché pour détecter un cancer cutané ?
Cette étude démontre la nécessité de plus de transparence sur la sécurité et l’efficacité des applications utilisées pour détecter les cancers cutanés. En effet, ces appareils ne peuvent détecter que ce qu’on leur a appris à analyser. Un élément crucial pour obtenir des taux de performance élevés avec des appareils basés sur l’apprentissage automatique est donc de combler le fossé existant entre la réalité des cancers cutanés et les banques d’images disponibles. Une collaboration étroite entre les groupes de chercheurs et les hôpitaux est une piste.
Ne négligeons pas non plus le fait que ces modèles ne procèdent à une analyse de toute la surface cutanée. In fine, pour un diagnostic fin et précis, rien ne remplace l’œil expérimenté d’un/une dermatologue.
Lire aussi: Télé-expertise : nomenclature en préparation