Les scientifiques identifient des caractéristiques pour mieux définir le long COVID

Communiqué de presse

lundi 16 mai 2022

À l’aide de l’apprentissage automatique, les chercheurs trouvent des modèles dans les données des dossiers de santé électroniques afin de mieux identifier les personnes susceptibles d’être atteintes de la maladie.

Une équipe de recherche soutenue par les National Institutes of Health a identifié les caractéristiques des personnes atteintes de long COVID et celles susceptibles de l’avoir. Les scientifiques, à l’aide de techniques d’apprentissage automatique, ont analysé une collection sans précédent de dossiers de santé électroniques (DSE) disponibles pour la recherche sur le COVID-19 afin de mieux identifier qui a un long COVID. En explorant les données dépersonnalisées du DSE dans le National COVID Cohort Collaborative (N3C), une base de données publique nationale centralisée dirigée par le National Center for Advancing Translational Sciences (NCATS) des NIH, l’équipe a utilisé les données pour trouver plus de 100 000 cas de COVID probablement longs comme d’octobre 2021 (en mai 2022, le nombre est supérieur à 200 000). Les découvertes apparaissent dans La santé numérique The Lancet.

Le long COVID est marqué par de nombreux symptômes, notamment l’essoufflement, la fatigue, la fièvre, les maux de tête, le « brouillard cérébral » et d’autres problèmes neurologiques. Ces symptômes peuvent durer plusieurs mois ou plus après un diagnostic initial de COVID-19. L’une des raisons pour lesquelles le COVID est difficile à identifier depuis longtemps est que bon nombre de ses symptômes sont similaires à ceux d’autres maladies et affections. Une meilleure caractérisation des COVID longs pourrait conduire à de meilleurs diagnostics et à de nouvelles approches thérapeutiques.

“Il était logique de tirer parti des outils modernes d’analyse de données et d’une ressource unique de mégadonnées comme N3C, où de nombreuses caractéristiques de la longue COVID peuvent être représentées”, a déclaré la co-auteure Emily Pfaff, Ph.D., informaticienne clinique à l’Université. de Caroline du Nord à Chapel Hill.

L’enclave de données N3C comprend actuellement des informations représentant plus de 13 millions de personnes dans tout le pays, dont près de 5 millions de cas positifs au COVID-19. La ressource permet une recherche rapide sur les questions émergentes concernant les vaccins, les thérapies, les facteurs de risque et les résultats pour la santé contre la COVID-19.

La nouvelle recherche fait partie d’une initiative trans-NIH connexe plus vaste, Researching COVID to Enhance Recovery (RECOVER), qui vise à améliorer la compréhension des effets à long terme du COVID-19, appelés séquelles post-aiguës du SRAS-CoV -2 infections (PASC). RECOVER identifiera avec précision les personnes atteintes du PASC et développera des approches pour sa prévention et son traitement. Le programme répondra également à des questions de recherche critiques sur les effets à long terme du COVID par le biais d’essais cliniques, d’études d’observation longitudinales, etc.

Dans le Lancette étude, Pfaff, Melissa Haendel, Ph.D., du campus médical d’Anschutz de l’Université du Colorado, et leurs collègues ont examiné les données démographiques des patients, l’utilisation des soins de santé, les diagnostics et les médicaments dans les dossiers de santé de 97 995 patients adultes COVID-19 du N3C. Ils ont utilisé ces informations, ainsi que des données sur près de 600 patients COVID longs de trois cliniques COVID longues, pour créer trois modèles d’apprentissage automatique pour identifier les patients COVID longs.

Dans l’apprentissage automatique, les scientifiques “entraînent” des méthodes de calcul pour passer rapidement au crible de grandes quantités de données afin de révéler de nouvelles informations – dans ce cas, sur le long COVID. Les modèles ont recherché des modèles dans les données qui pourraient aider les chercheurs à la fois à comprendre les caractéristiques des patients et à mieux identifier les personnes atteintes de la maladie.

Les modèles se sont concentrés sur l’identification de patients COVID longs potentiels parmi trois groupes de la base de données N3C : tous les patients COVID-19, les patients hospitalisés avec COVID-19 et les patients qui avaient COVID-19 mais n’ont pas été hospitalisés. Les modèles se sont avérés exacts, car les personnes identifiées comme à risque de COVID long étaient similaires aux patients vus dans les cliniques COVID longues. Les systèmes d’apprentissage automatique ont classé environ 100 000 patients dans la base de données N3C dont les profils correspondaient étroitement à ceux avec un long COVID.

“Une fois que vous êtes en mesure de déterminer qui a un long COVID dans une grande base de données de personnes, vous pouvez commencer à poser des questions sur ces personnes”, a déclaré Josh Fessel, MD, Ph.D., conseiller clinique principal au NCATS et un programme scientifique. mener dans RECOVER. « Y avait-il quelque chose de différent chez ces personnes avant qu’elles ne développent un long COVID ? Avaient-ils certains facteurs de risque ? Y a-t-il quelque chose dans la façon dont ils ont été traités pendant le COVID aigu qui aurait pu augmenter ou diminuer leur risque de COVID long ? »

Les modèles ont recherché des caractéristiques communes, y compris de nouveaux médicaments, des visites chez le médecin et de nouveaux symptômes, chez les patients avec un diagnostic COVID positif qui étaient à au moins 90 jours de leur infection aiguë. Les modèles ont identifié les patients comme ayant un COVID long s’ils se rendaient dans une longue clinique COVID ou présentaient de longs symptômes COVID et souffraient probablement de la maladie mais n’avaient pas été diagnostiqués.

“Nous voulons incorporer les nouveaux modèles que nous voyons avec le code de diagnostic pour COVID et les inclure dans nos modèles pour essayer d’améliorer leurs performances”, a déclaré Haendel de l’Université du Colorado. « Les modèles peuvent apprendre d’une plus grande variété de patients et devenir plus précis. Nous espérons que nous pourrons utiliser notre long classificateur de patients COVID pour le recrutement d’essais cliniques.

Cette étude a été financée par le NCATS, qui a contribué à la conception, à la maintenance et à la sécurité de l’enclave N3C, et la NIH RECOVER Initiative, soutenue par le NIH OT2HL161847. RECOVER coordonne, entre autres, le protocole de recrutement des participants auquel ce travail contribue. Les analyses ont été menées avec des données et des outils accessibles via l’enclave de données NCATS N3C et pris en charge par NCATS U24TR002306.

À propos du Centre national pour l’avancement des sciences translationnelles (NCATS) : Le NCATS mène et soutient des recherches sur la science et le fonctionnement de la traduction – le processus par lequel les interventions visant à améliorer la santé sont développées et mises en œuvre – pour permettre à davantage de traitements d’atteindre plus rapidement plus de patients. Pour plus d’informations sur la façon dont le NCATS aide à raccourcir le parcours de l’observation scientifique à l’intervention clinique, visitez https://ncats.nih.gov.

À propos des Instituts nationaux de la santé (NIH) :Le NIH, l’agence de recherche médicale du pays, comprend 27 instituts et centres et fait partie du département américain de la santé et des services sociaux. Le NIH est la principale agence fédérale qui mène et soutient la recherche médicale fondamentale, clinique et translationnelle, et étudie les causes, les traitements et les remèdes pour les maladies courantes et rares. Pour plus d’informations sur le NIH et ses programmes, visitez www.nih.gov.

NIH… Transformer la découverte en santé®

###

.

Add Comment