·

Documentation clinique

Soins primaires

TI de la santé / CIO

Notes en texte libre et données de santé publique dans les cabinets de médecine générale

Comment les comptes rendus médicaux non structurés compromettent les registres de maladies, les rapports QOF et l'allocation des ressources en soins primaires – et comment l'IA peut combler cette lacune

Médecin examinant notes cliniques texte libre et données santé population

La documentation médicale en médecine générale a toujours impliqué un compromis. Le compte rendu narratif saisit l’incertitude, le contexte et les nuances dans les propres mots du clinicien. Mais, alors que les cabinets de médecins généralistes font face à une pression croissante pour fournir des données codées précises aux registres nationaux, aux Quality and Outcomes Frameworks (QOF) et aux tableaux de bord des systèmes de soins intégrés (ICS), ce même compte rendu narratif compromet discrètement la qualité des données de santé de la population à grande échelle. L’écart entre la façon dont les cliniciens documentent les soins et ce que les systèmes de reporting peuvent réellement lire n’est pas un simple inconvénient technique. Il s’agit d’un problème structurel aux conséquences mesurables pour les registres de maladies, l’allocation des ressources et l’équité en santé.

Ce que signifie la documentation non structurée en texte libre en pratique

Dans le contexte des consultations de médecine générale, les notes en texte libre sont des entrées narratives rédigées directement dans le système de dossiers médicaux, dans le langage propre au clinicien. Elles s’opposent aux champs codés structurés qui attribuent des identifiants normalisés aux diagnostics, symptômes, médicaments et résultats. Un médecin généraliste peut saisir « le patient signale un moral bas, un sommeil perturbé, un appétit réduit, probablement une dépression, discuté d’une surveillance attentive » dans un champ de notes. Cette entrée est cliniquement significative. Pour un système de reporting, elle est invisible.

Le texte libre reste le mode dominant de documentation médicale en soins primaires pour des raisons compréhensibles. C’est plus rapide que de naviguer dans des modèles structurés pendant une consultation de dix minutes. Cela permet de prendre en compte l’incertitude clinique : des conditions suspectées mais non confirmées, des symptômes qui ne correspondent pas encore à une catégorie diagnostique, ou des expériences rapportées par les patients qui échappent aux étiquettes normalisées.

Il préserve la dimension relationnelle d’une consultation d’une manière qu’un menu déroulant ne peut pas offrir. Plus de 80 % des données de santé numériques sont non structurées, et les soins primaires ne font pas exception.

Comment fonctionne le reporting de santé de la population dans les cabinets de médecins généralistes

Le reporting de santé de la population en médecine générale dépend presque entièrement de données structurées et lisibles par machine. Lorsqu’un clinicien attribue un code SNOMED CT (Systematized Nomenclature of Medicine Clinical Terms, une nomenclature systématisée de termes médicaux) à un diagnostic ou à une observation clinique pendant ou après une consultation, ce code est enregistré dans le système de dossiers médicaux d’une manière qui peut être extraite, agrégée et rapportée.

Les registres de maladies, pour des pathologies telles que le diabète, l’hypertension, la bronchopneumopathie chronique obstructive et les maladies mentales graves, sont construits à partir de ces entrées codées. Les indicateurs QOF sont calculés à partir de ces mêmes données. Les tableaux de bord ICS et les outils de planification des integrated care boards (ICB, conseils de soins intégrés) s’en servent également.

Les programmes d’audit nationaux, y compris le National Diabetes Audit et les indicateurs du tableau de bord du Primary Care Network (PCN, réseau de soins primaires) utilisés par le NHS England, reposent sur la même couche de données structurées. Il en va de même pour les outils de stratification des risques que les ICB utilisent pour identifier les cohortes à besoins élevés et orienter les ressources vers les populations mal desservies. Aucun de ces systèmes ne peut interroger un récit en texte libre. Les notes médicales rédigées en texte libre ne peuvent pas être facilement traduites en champs de données structurées, ce qui entraîne des informations manquantes sur les symptômes, les expositions et les résultats.

Où les notes en texte libre rompent la chaîne de reporting

Les points de défaillance sont spécifiques et bien documentés. Lorsqu’un clinicien enregistre un nouveau diagnostic dans une note de consultation sans attribuer un code SNOMED CT correspondant, ce diagnostic n’apparaît pas dans le registre de maladies. Lorsqu’un facteur de risque tel que le statut tabagique, la consommation d’alcool ou les antécédents familiaux de maladies cardiovasculaires est documenté uniquement dans un texte narratif, il n’est pas comptabilisé dans les champs structurés qui alimentent les indicateurs QOF ou les scores de risque.

Lorsqu’un résultat tel qu’une décision d’orientation ou un changement de traitement est décrit en texte libre plutôt que codé, il est perdu pour tout reporting en aval.

Une étude portant sur 2,9 millions de dossiers de patients issus d’une base de données de médecins généralistes néerlandais a démontré quantitativement que les codes structurés et les notes médicales non structurées sont hautement complémentaires plutôt que redondants. La plupart des concepts enregistrés dans un type de données n’apparaissent pas dans l’autre. Les consultations pour dépression se sont révélées fortement dépendantes des données non structurées, avec relativement peu de concepts capturés uniquement par des codes structurés. Cela signifie que, pour des domaines cliniques entiers, les données alimentant les rapports de santé de la population peuvent être systématiquement incomplètes.

Une revue systématique de 43 études britanniques utilisant du texte libre médical a révélé que les études incluant des données en texte libre montraient une précision supérieure à celles s’appuyant uniquement sur des codes structurés. Elle a également constaté que les données en texte libre sont systématiquement supprimées avant que les dossiers ne soient rendus disponibles pour la recherche, laissant inexploitée une source substantielle d’informations sur la santé de la population. La revue a souligné que les notes de consultation des médecins généralistes britanniques et les dossiers de santé mentale reposent particulièrement sur des récits en texte libre.

Le problème s’étend à la façon dont les nouveaux diagnostics sont intégrés au dossier. Les nouveaux diagnostics sont souvent enregistrés uniquement dans des courriers classés sous des codes administratifs tels que « lettre du spécialiste », plutôt que sous le code diagnostique pertinent. L’information clinique est présente dans le système de dossiers médicaux, mais elle est stockée dans un emplacement et un format auxquels les systèmes de reporting n’ont pas accès.

Une étude comparant les codes diagnostiques à l’analyse par traitement du langage naturel (NLP, natural language processing, une technique d’intelligence artificielle qui analyse le langage humain) des notes médicales en texte libre en soins primaires a mis en évidence des estimations de prévalence substantiellement différentes selon la source de données utilisée. Les données codées sous-estimaient systématiquement les cas. Appliqué à un contexte de santé de la population, cela signifie que les registres de maladies construits uniquement à partir de codes structurés sous-estimeront systématiquement la prévalence réelle. Le degré de sous-estimation variera selon la pathologie, le clinicien et le cabinet.

Les conséquences réelles pour les cabinets de médecins généralistes et les ICB

Les effets en aval se manifestent simultanément à plusieurs niveaux. Au niveau du cabinet, des registres de maladies incomplets réduisent la population éligible pour la réalisation du QOF, ce qui peut diminuer les scores de performance globaux et les revenus associés. Si les patients présentant un diagnostic pertinent sont enregistrés uniquement en texte libre plutôt que dans le registre de maladies, ils échappent au dénominateur utilisé pour calculer la performance QOF, même si les soins cliniques ont été délivrés de manière appropriée.

Au niveau de l’ICB, les conséquences sont plus diffuses mais potentiellement plus importantes. Les outils de stratification des risques qui attribuent les patients à des catégories de besoins élevés, moyens ou faibles dépendent de l’exhaustivité des données codées. Des données structurées biaisées ou incomplètes conduisent à une stratification des risques de population inexacte et, par extension, à des décisions d’allocation de ressources qui ne reflètent pas les besoins réels de la population.

Les cohortes qui devraient être priorisées pour des interventions ciblées, y compris les personnes atteintes de maladies chroniques non diagnostiquées, celles présentant des comorbidités multiples, ou issues de communautés avec des taux historiquement plus faibles de diagnostic codé, peuvent ne pas apparaître du tout dans les données.

Les déterminants sociaux de la santé et les mesures de qualité de vie sont rarement capturés dans les champs structurés des systèmes de dossiers médicaux. Ils sont plutôt documentés, le cas échéant, dans des notes en texte libre. Cela pose un problème particulier pour la surveillance des inégalités de santé. Si les données utilisées pour identifier les populations mal desservies sont concentrées dans un format que les systèmes de reporting ne peuvent pas lire, ces populations restent invisibles aux processus de planification, aggravant l’inégalité existante au lieu de la corriger.

Les registres de maladies et les évaluations de la qualité des soins utilisant des dossiers médicaux seront trompeurs si les informations en texte libre ne sont pas prises en compte, une constatation reproduite dans plusieurs domaines cliniques, notamment les syndromes gériatriques et les résultats post-chirurgicaux documentés presque exclusivement dans des notes narratives.

Pourquoi les cliniciens privilégient le texte libre

La prévalence de la documentation en texte libre n’est pas principalement un problème de comportement. C’est un problème de conception des systèmes.

Les modèles structurés et les interfaces de codage dans la plupart des systèmes de dossiers médicaux ne sont pas conçus autour du rythme et des exigences cognitives d’une consultation de médecine générale. Naviguer dans les menus déroulants, rechercher le bon code SNOMED CT et remplir les champs structurés prend un temps qui n’est pas disponible lors d’un rendez-vous standard. L’incertitude clinique, la stigmatisation, la pression temporelle et la formation insuffisante des cliniciens au codage sont autant de raisons documentées pour lesquelles les champs structurés restent incomplets, même lorsque les cliniciens comprennent leur importance.

La charge administrative documentaire en soins primaires est réelle et bien documentée. Demander aux cliniciens de choisir entre accorder toute leur attention au patient devant eux et s’assurer que leurs notes sont correctement codées n’est pas une demande raisonnable. Les systèmes qui présentent cela comme un problème de conformité plutôt que comme un problème de conception des flux de travail sont peu susceptibles d’apporter une amélioration durable.

Le codage manuel des données cliniques en texte libre est à la fois chronophage et coûteux. La charge mentale d’un codage médical précis pendant ou immédiatement après une consultation est importante. Le texte libre n’est pas une solution de facilité. Pour de nombreux cliniciens, c’est la seule option réaliste compte tenu des outils disponibles.

Comment la technologie vocale ambiante et les assistants IA changent la donne

La tension structurelle entre la rapidité de la documentation et la qualité des données n’est pas inévitable. La technologie vocale ambiante (AVT, ambient voice technology), qui utilise l’intelligence artificielle (IA, artificial intelligence, une technologie informatique qui simule certaines capacités cognitives humaines) pour écouter une consultation en temps réel et générer simultanément des notes narratives et des données cliniques structurées, change les termes du compromis.

Plutôt que d’exiger que le clinicien choisisse entre rédiger une note complète et attribuer le bon code, un assistant médical IA utilisant l’AVT peut faire les deux en arrière-plan. Le clinicien mène la consultation comme il le ferait normalement. L’assistant écoute, génère un brouillon de note médicale et propose des codes SNOMED CT suggérés pour validation. Le clinicien examine et confirme, un processus qui prend quelques secondes plutôt que plusieurs minutes et n’interrompt pas la consultation elle-même.

Cette approche s’attaque à la cause profonde de la dépendance excessive au texte libre : le fait que la documentation structurée nécessite actuellement plus de temps et d’effort cognitif que la documentation narrative. Des méthodes innovantes pour améliorer la capture structurée des données cliniques sont nécessaires pour faciliter l’utilisation des données cliniques collectées en routine pour le phénotypage des patients et le reporting de santé de la population. Les assistants IA basés sur l’AVT représentent l’une des mises en œuvre les plus pratiques de ce principe en soins primaires.

La classification automatisée des données de soins primaires non structurées en texte libre pour l’estimation de la prévalence des maladies est techniquement faisable, mais l’appliquer rétrospectivement aux dossiers existants est très coûteux en ressources. L’intervention la plus efficace consiste à empêcher l’écart de données de se former dès le départ, en favorisant la capture structurée au moment de la consultation.

À quoi ressemble une bonne documentation : des notes structurées sans ralentir les soins

Un flux de travail de documentation qui soutient véritablement le reporting de santé de la population présente plusieurs caractéristiques identifiables :

  • Suggestions de codes automatiques proposées après la consultation, basées sur ce qui a été dit pendant le rendez-vous, sans exiger que le clinicien recherche manuellement des codes pendant ou après la rencontre

  • Données structurées capturées en arrière-plan, de sorte que les entrées de registre de maladies, les indicateurs pertinents pour le QOF et les décisions d’orientation sont enregistrés dans un format lisible par machine sans saisie supplémentaire du clinicien

  • Modèles remplis sans saisie manuelle de données, s’appuyant sur la transcription de la consultation pour pré-remplir les champs structurés qui seraient autrement laissés vides ou complétés en texte libre

  • Intégration du système de dossiers médicaux au niveau de la couche de données, de sorte que les sorties structurées s’intègrent directement dans les champs pertinents du système clinique plutôt que de nécessiter une étape de documentation séparée

La distinction entre cette approche et les outils de codage complémentaires traditionnels est significative. Les outils d’aide au codage antérieurs exigeaient que les cliniciens utilisent une interface séparée, recherchent manuellement des codes ou examinent de longues listes de suggestions générées à partir de données de facturation plutôt que de contenu clinique. Les approches natives IA, qui s’appuient sur la transcription de la consultation et proposent un petit nombre de suggestions de codes à forte pertinence contextuelle, sont fondamentalement différentes en termes d’impact sur le flux de travail.

La combinaison de données de dossiers médicaux structurées et non structurées permet systématiquement une identification des patients et des informations sur la santé de la population plus précises que l’un ou l’autre type de données seul. L’objectif de la documentation assistée par IA n’est pas d’éliminer les notes en texte libre, qui ont une véritable valeur clinique, mais de s’assurer que la couche de données structurées est remplie de manière cohérente et précise à leurs côtés.

Considérations clés lors de l’évaluation des outils de documentation IA pour les cabinets de médecins généralistes

Pour les décideurs en santé évaluant les outils de documentation IA dans le contexte du reporting de santé de la population, plusieurs critères sont particulièrement pertinents.

Précision des suggestions de codes SNOMED CT. La valeur clinique d’un assistant IA dépend de la précision et de la spécificité de ses suggestions de codage. Les outils doivent être évalués à partir de véritables données de consultation de soins primaires, avec une transparence sur les taux de faux positifs et de faux négatifs pour les codes cliniquement significatifs.

Profondeur d’intégration du système de dossiers médicaux. Un outil qui génère des sorties structurées dans un format propriétaire plutôt que d’écrire directement dans les champs structurés pertinents du système de dossiers médicaux du cabinet ne résout pas le problème du reporting de santé de la population. L’intégration au niveau de la couche de données, et non seulement au niveau de l’interface, est la norme pertinente.

Sécurité et confidentialité des données. Les données de consultation de médecin généraliste figurent parmi les données personnelles les plus sensibles traitées dans n’importe quel secteur. Les outils doivent se conformer au RGPD (GDPR, General Data Protection Regulation, règlement général sur la protection des données) britannique, avec une documentation claire de l’hébergement des données au sein de l’UE, des accords de traitement et des contrôles d’accès. La certification ISO 27001 (la norme internationale pour la gestion de la sécurité de l’information) est une exigence de base.

Classification de dispositif médical. Les outils IA qui influencent les décisions de documentation médicale et de codage peuvent être classés comme dispositifs médicaux en vertu du UK Medical Device Regulation (MDR, règlement britannique sur les dispositifs médicaux). Les cabinets et les ICB doivent confirmer le statut réglementaire de tout outil en cours d’évaluation et comprendre quelles obligations de sécurité clinique cette classification implique.

Preuve de performance en conditions réelles en soins primaires. Des preuves évaluées par des pairs, ou au minimum des données de performance validées de manière indépendante issues de contextes de soins primaires britanniques, devraient être disponibles avant tout déploiement à grande échelle. La performance en soins secondaires ou dans des systèmes de santé américains ne prédit pas de manière fiable la performance en médecine générale britannique.

La qualité de la documentation est un enjeu de santé de la population

La qualité des données de santé de la population est indissociable de la façon dont les cliniciens individuels documentent les consultations. Chaque entrée en texte libre qui contient une observation cliniquement significative, telle qu’un nouveau diagnostic, un facteur de risque non contrôlé ou une maladie chronique qui s’aggrave, mais qui n’est pas accompagnée d’un code structuré, représente un écart dans les données qui alimentent les registres de maladies, les calculs QOF et les outils de planification des ICB.

Ce n’est pas un problème qui peut être résolu en demandant aux cliniciens de coder plus soigneusement. La charge administrative en soins primaires est déjà conséquente. L’alourdir davantage n’est ni durable ni efficace. La voie pragmatique consiste à changer la relation entre consultation et documentation, en utilisant l’assistance IA pour s’assurer que la capture de données structurées se fait comme un sous-produit des soins cliniques, et non comme une tâche supplémentaire imposée.

Les modèles prédictifs utilisant à la fois des données structurées et des notes narratives non structurées surpassent systématiquement ceux utilisant l’un ou l’autre type de données seul. Le même principe s’applique au reporting de santé de la population : l’image la plus précise et la plus complète de la santé de la population émerge lorsque les données structurées et non structurées sont capturées ensemble, de manière cohérente, au moment des soins. Réaliser cela, à grande échelle, dans un cabinet de médecin généraliste ou un ICB, est l’une des décisions d’infrastructure les plus importantes à la disposition des décideurs en santé aujourd’hui.

Foire aux questions

▶ Pourquoi la documentation médicale en texte libre pose-t-elle des problèmes pour le reporting de santé de la population ?

Le reporting de santé de la population dépend de données structurées et lisibles par machine. Lorsqu’un clinicien enregistre un diagnostic ou un facteur de risque dans une note narrative sans attribuer un code SNOMED CT (Systematized Nomenclature of Medicine Clinical Terms, une nomenclature systématisée de termes médicaux) correspondant, cette information est invisible pour les registres de maladies, les calculs du Quality and Outcomes Framework et les tableaux de bord des systèmes de soins intégrés. Le détail clinique est présent dans le dossier, mais les systèmes de reporting ne peuvent pas le lire.

▶ Quelle proportion des données cliniques en soins primaires est non structurée ?

La recherche suggère que plus de 80 % des données de santé numériques sont non structurées, et les soins primaires ne font pas exception. Les notes narratives en texte libre constituent le mode dominant de documentation médicale en médecine générale, ce qui signifie qu’une proportion significative d’informations cliniquement pertinentes n’entre jamais dans la couche de données structurées qui alimente les systèmes de reporting.

▶ Quelles sont les conséquences pratiques pour les cabinets de médecins généralistes lorsque la documentation est incomplète ?

Au niveau du cabinet, des registres de maladies incomplets se traduisent par des points Quality and Outcomes Framework manqués et des revenus perdus. Si un diagnostic est enregistré uniquement en texte libre, le patient n’apparaîtra pas dans le registre pertinent, et le cabinet ne peut pas réclamer les paiements associés, même si les soins cliniques ont été prodigués.

Au niveau de l’integrated care board (conseil de soins intégrés), des données structurées biaisées conduisent à une stratification des risques inexacte et à des décisions d’allocation de ressources qui ne reflètent pas les besoins réels de la population.

▶ Pourquoi les cliniciens privilégient-ils les notes en texte libre plutôt que le codage structuré ?

La prévalence de la documentation en texte libre est un problème de conception des systèmes, non de comportement. Naviguer dans les menus déroulants et rechercher le bon code SNOMED CT prend un temps qui n’est pas disponible lors d’une consultation standard de dix minutes. L’incertitude clinique, la stigmatisation, la pression temporelle et la formation limitée au codage sont autant de raisons documentées pour lesquelles les champs structurés restent incomplets. Pour de nombreux cliniciens, le texte libre est la seule option réaliste compte tenu des outils disponibles.

▶ Quels domaines cliniques sont les plus affectés par la dépendance à la documentation en texte libre ?

Une étude portant sur 2,9 millions de dossiers de patients issus d’une base de données de médecins généralistes néerlandais a révélé que les consultations pour dépression reposent presque exclusivement sur des données non structurées. Une revue systématique de 43 études britanniques a constaté que les notes de consultation des médecins généralistes britanniques et les dossiers de santé mentale s’appuient particulièrement sur des récits en texte libre. Les déterminants sociaux de la santé et les mesures de qualité de vie sont également rarement capturés dans les champs structurés, ce qui pose des problèmes spécifiques pour la surveillance des inégalités de santé.

▶ Comment la technologie vocale ambiante aide-t-elle à la documentation médicale structurée ?

La technologie vocale ambiante (AVT, ambient voice technology) utilise l’intelligence artificielle (IA, artificial intelligence, une technologie informatique qui simule certaines capacités cognitives humaines) pour écouter une consultation en temps réel et générer simultanément une note narrative et des codes SNOMED CT suggérés. Le clinicien mène la consultation normalement. L’assistant IA rédige la note et propose des suggestions de codes pour validation, un processus qui prend quelques secondes et n’interrompt pas le rendez-vous. Cela permet la capture de données structurées parallèlement à la consultation, plutôt que comme une tâche distincte a posteriori.

▶ L’utilisation de l’assistance IA signifie-t-elle supprimer les notes en texte libre des dossiers médicaux ?

Non. L’objectif de la documentation assistée par IA n’est pas d’éliminer les notes en texte libre, qui ont une véritable valeur clinique. La recherche montre systématiquement que la combinaison de données structurées et non structurées permet une identification des patients et une information sur la santé de la population plus précises que l’un ou l’autre type de données seul. L’objectif est de s’assurer que la couche de données structurées est remplie de manière cohérente et précise aux côtés des notes narratives, et non de remplacer l’une par l’autre.

▶ Que devraient rechercher les cabinets de médecins généralistes et les integrated care boards lors de l’évaluation des outils de documentation IA ?

Les critères clés incluent la précision des suggestions de codes SNOMED CT, la profondeur d’intégration avec le système de dossiers médicaux du cabinet, et la conformité au RGPD (GDPR, General Data Protection Regulation, règlement général sur la protection des données) britannique, y compris un hébergement des données au sein de l’UE et des contrôles d’accès clairs. La certification ISO 27001 (la norme internationale pour la gestion de la sécurité de l’information) est une exigence de base.

Les cabinets doivent également vérifier si un outil est classé comme dispositif médical en vertu du UK Medical Device Regulation (MDR, règlement britannique sur les dispositifs médicaux), et rechercher des données de performance validées de manière indépendante provenant spécifiquement de contextes de soins primaires britanniques.

▶ Comment les données structurées incomplètes affectent-elles l’équité en santé ?

Les outils de stratification des risques qui identifient les cohortes à besoins élevés dépendent de données codées complètes. Lorsque des informations cliniquement significatives ne se trouvent que dans des notes en texte libre, les communautés avec des taux historiquement plus faibles de diagnostic codé peuvent ne pas apparaître du tout dans les données de planification. Les déterminants sociaux de la santé sont rarement capturés dans les champs structurés, de sorte que les populations qui ont le plus besoin d’interventions ciblées peuvent rester invisibles aux processus conçus pour les atteindre.

▶ Le codage automatisé des dossiers en texte libre existants est-il une solution pratique ?

La classification automatisée des données en texte libre non structurées utilisant le traitement du langage naturel (NLP, natural language processing, une technique d’intelligence artificielle qui analyse le langage humain) est techniquement possible, mais l’appliquer rétrospectivement aux dossiers existants est très coûteux en ressources. La recherche montre également que les données en texte libre sont systématiquement supprimées avant que les dossiers ne soient mis à disposition pour l’analyse, limitant l’accès des outils rétrospectifs. L’approche la plus efficace consiste à empêcher l’écart de données de se former dès le départ, en favorisant la capture structurée au moment de la consultation.

Commencez avec Tandem dès aujourd’hui

Rejoignez les milliers de soignants pour qui nous automatisons les tâches administratives

Commencez avec Tandem dès aujourd’hui

Rejoignez les milliers de soignants pour qui nous automatisons les tâches administratives

Commencez avec Tandem dès aujourd’hui

Rejoignez les milliers de soignants pour qui nous automatisons les tâches administratives