Cargando…

Création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le COVID long

INTRODUCTION: La pandémie de COVID-19 a entrainé une masse d'informations sur les réseaux sociaux et forums provenant de multiples acteurs : gouvernements, journalistes ou encore citoyens. Parmi ces messages, de nombreux patients se sont saisis de ces outils pour partager leurs symptômes et se...

Descripción completa

Detalles Bibliográficos
Autores principales: Talmatkadi, M., Foulquié, P., Déguilhem, A., Renner, S., Châteauneuf, L., Mebarki, A., Texier, N., Schuck, S.
Formato: Online Artículo Texto
Lenguaje:English
Publicado: Published by Elsevier Masson SAS 2022
Materias:
Pc3
Acceso en línea:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9634426/
http://dx.doi.org/10.1016/j.respe.2022.09.045
_version_ 1784824490281140224
author Talmatkadi, M.
Foulquié, P.
Déguilhem, A.
Renner, S.
Châteauneuf, L.
Mebarki, A.
Texier, N.
Schuck, S.
author_facet Talmatkadi, M.
Foulquié, P.
Déguilhem, A.
Renner, S.
Châteauneuf, L.
Mebarki, A.
Texier, N.
Schuck, S.
author_sort Talmatkadi, M.
collection PubMed
description INTRODUCTION: La pandémie de COVID-19 a entrainé une masse d'informations sur les réseaux sociaux et forums provenant de multiples acteurs : gouvernements, journalistes ou encore citoyens. Parmi ces messages, de nombreux patients se sont saisis de ces outils pour partager leurs symptômes et se regrouper en communauté, comme c'est le cas des patients atteints de COVID long avec le hashtag #aprèsJ20. Un algorithme de traitement automatique du langage naturel capable d'identifier les messages constituant des expériences de santé vécues par des patients ou des proches permettrait d'exploiter ces données de vie réelle dans un objectif de santé publique. MÉTHODES: A partir de différentes sources, 12 430 messages issus de forums et réseaux sociaux (Twitter, Facebook) ont été extraits sur différentes pathologies : cancer (sans précision d'une localisation), diabète, maladie de Fabry, COVID-19, sevrage tabagique. Ces messages ont été manuellement analysées et codifiées en trois catégories selon la nature de l'internaute : patient/aidant ou proche/répondant. Sur la base de ce « gold standard », un modèle de « machine learning » a été créé et entrainé, couplé avec des champs lexicaux marqueurs d'expériences vécues (par exemple, la présence d'un récit à la première personne ou du champ lexical de la famille). Deux modèles Xgboost ont été choisis permettant de déterminer en premier lieu si l'internaute est un proche de malade ou non, puis dans un second temps, si c'est un patient ou non. Pour être validé, ce modèle a été appliqué sur des messages spécifiques au COVID long. Une sélection aléatoire de ces messages couplée à une annotation par trois annotateurs a permis de mesurer les performances du modèle. RÉSULTATS: Après application de l'algorithme d'identification d'expériences vécues par des patients ou des proches, 700 messages ont été revus et annotés sur le COVID long. Les catégories patients et aidants ont été regroupées en raison des nombreux cas de formes familiales de COVID long rapportés sur les réseaux sociaux. Les performances du modèle ont permis de mesurer une sensibilité de 96 %, une spécificité de 76 %, une « accuracy » à 87 % et une précision de 84 %. CONCLUSION: Un algorithme identifiant les expériences vécues par des patients ou des proches au sein des messages issus des réseaux sociaux facilite leur utilisation comme données de vie réelle. Les bonnes performances de l'algorithme, notamment sur les formes longues de COVID-19, permettent un suivi prospectif de ces patients dans un objectif de santé publique. Une future version du modèle devra intégrer la possibilité d'identifier au sein d'un même message la présence d'expériences à la fois de patients et de proches, notamment en cas de formes familiales (”mon fils et moi avons un covid long ”). DÉCLARATION DE LIENS D'INTÉRÊTS: Les auteurs n'ont pas précisé leurs éventuels liens d'intérêts.
format Online
Article
Text
id pubmed-9634426
institution National Center for Biotechnology Information
language English
publishDate 2022
publisher Published by Elsevier Masson SAS
record_format MEDLINE/PubMed
spelling pubmed-96344262022-11-04 Création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le COVID long Talmatkadi, M. Foulquié, P. Déguilhem, A. Renner, S. Châteauneuf, L. Mebarki, A. Texier, N. Schuck, S. Rev Epidemiol Sante Publique Pc3 INTRODUCTION: La pandémie de COVID-19 a entrainé une masse d'informations sur les réseaux sociaux et forums provenant de multiples acteurs : gouvernements, journalistes ou encore citoyens. Parmi ces messages, de nombreux patients se sont saisis de ces outils pour partager leurs symptômes et se regrouper en communauté, comme c'est le cas des patients atteints de COVID long avec le hashtag #aprèsJ20. Un algorithme de traitement automatique du langage naturel capable d'identifier les messages constituant des expériences de santé vécues par des patients ou des proches permettrait d'exploiter ces données de vie réelle dans un objectif de santé publique. MÉTHODES: A partir de différentes sources, 12 430 messages issus de forums et réseaux sociaux (Twitter, Facebook) ont été extraits sur différentes pathologies : cancer (sans précision d'une localisation), diabète, maladie de Fabry, COVID-19, sevrage tabagique. Ces messages ont été manuellement analysées et codifiées en trois catégories selon la nature de l'internaute : patient/aidant ou proche/répondant. Sur la base de ce « gold standard », un modèle de « machine learning » a été créé et entrainé, couplé avec des champs lexicaux marqueurs d'expériences vécues (par exemple, la présence d'un récit à la première personne ou du champ lexical de la famille). Deux modèles Xgboost ont été choisis permettant de déterminer en premier lieu si l'internaute est un proche de malade ou non, puis dans un second temps, si c'est un patient ou non. Pour être validé, ce modèle a été appliqué sur des messages spécifiques au COVID long. Une sélection aléatoire de ces messages couplée à une annotation par trois annotateurs a permis de mesurer les performances du modèle. RÉSULTATS: Après application de l'algorithme d'identification d'expériences vécues par des patients ou des proches, 700 messages ont été revus et annotés sur le COVID long. Les catégories patients et aidants ont été regroupées en raison des nombreux cas de formes familiales de COVID long rapportés sur les réseaux sociaux. Les performances du modèle ont permis de mesurer une sensibilité de 96 %, une spécificité de 76 %, une « accuracy » à 87 % et une précision de 84 %. CONCLUSION: Un algorithme identifiant les expériences vécues par des patients ou des proches au sein des messages issus des réseaux sociaux facilite leur utilisation comme données de vie réelle. Les bonnes performances de l'algorithme, notamment sur les formes longues de COVID-19, permettent un suivi prospectif de ces patients dans un objectif de santé publique. Une future version du modèle devra intégrer la possibilité d'identifier au sein d'un même message la présence d'expériences à la fois de patients et de proches, notamment en cas de formes familiales (”mon fils et moi avons un covid long ”). DÉCLARATION DE LIENS D'INTÉRÊTS: Les auteurs n'ont pas précisé leurs éventuels liens d'intérêts. Published by Elsevier Masson SAS 2022-11 2022-11-04 /pmc/articles/PMC9634426/ http://dx.doi.org/10.1016/j.respe.2022.09.045 Text en Copyright © 2022 Published by Elsevier Masson SAS. Since January 2020 Elsevier has created a COVID-19 resource centre with free information in English and Mandarin on the novel coronavirus COVID-19. The COVID-19 resource centre is hosted on Elsevier Connect, the company's public news and information website. Elsevier hereby grants permission to make all its COVID-19-related research that is available on the COVID-19 resource centre - including this research content - immediately available in PubMed Central and other publicly funded repositories, such as the WHO COVID database with rights for unrestricted research re-use and analyses in any form or by any means with acknowledgement of the original source. These permissions are granted for free by Elsevier for as long as the COVID-19 resource centre remains active.
spellingShingle Pc3
Talmatkadi, M.
Foulquié, P.
Déguilhem, A.
Renner, S.
Châteauneuf, L.
Mebarki, A.
Texier, N.
Schuck, S.
Création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le COVID long
title Création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le COVID long
title_full Création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le COVID long
title_fullStr Création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le COVID long
title_full_unstemmed Création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le COVID long
title_short Création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le COVID long
title_sort création d'un algorithme d'identification d'expériences vécues par des patients ou leurs proches à partir de messages issus des réseaux sociaux : un cas d'usage sur le covid long
topic Pc3
url https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9634426/
http://dx.doi.org/10.1016/j.respe.2022.09.045
work_keys_str_mv AT talmatkadim creationdunalgorithmedidentificationdexperiencesvecuespardespatientsouleursprochesapartirdemessagesissusdesreseauxsociauxuncasdusagesurlecovidlong
AT foulquiep creationdunalgorithmedidentificationdexperiencesvecuespardespatientsouleursprochesapartirdemessagesissusdesreseauxsociauxuncasdusagesurlecovidlong
AT deguilhema creationdunalgorithmedidentificationdexperiencesvecuespardespatientsouleursprochesapartirdemessagesissusdesreseauxsociauxuncasdusagesurlecovidlong
AT renners creationdunalgorithmedidentificationdexperiencesvecuespardespatientsouleursprochesapartirdemessagesissusdesreseauxsociauxuncasdusagesurlecovidlong
AT chateauneufl creationdunalgorithmedidentificationdexperiencesvecuespardespatientsouleursprochesapartirdemessagesissusdesreseauxsociauxuncasdusagesurlecovidlong
AT mebarkia creationdunalgorithmedidentificationdexperiencesvecuespardespatientsouleursprochesapartirdemessagesissusdesreseauxsociauxuncasdusagesurlecovidlong
AT texiern creationdunalgorithmedidentificationdexperiencesvecuespardespatientsouleursprochesapartirdemessagesissusdesreseauxsociauxuncasdusagesurlecovidlong
AT schucks creationdunalgorithmedidentificationdexperiencesvecuespardespatientsouleursprochesapartirdemessagesissusdesreseauxsociauxuncasdusagesurlecovidlong