·
Sicurezza dell'IA nell'assistenza sanitaria
Assistenza primaria
IT sanitario / CIO
Validare il supporto decisionale clinico nell'assistenza primaria europea
Come valutare gli strumenti di supporto decisionale clinico prima dell'implementazione nell'assistenza primaria. Cosa significa validazione, requisiti normativi e domande chiave per i fornitori

Uno strumento di supporto decisionale clinico (un sistema software che analizza i dati dei pazienti per generare raccomandazioni cliniche) può superare tutti i test di qualità del software eseguiti da un fornitore e risultare comunque non sicuro per i pazienti che un medico di base visita un lunedì mattina. La logica può essere eseguita senza errori. L'interfaccia può essere reattiva e intuitiva. La pipeline di dati può essere completamente operativa. Tuttavia, se il modello sottostante è stato addestrato su pazienti ospedalizzati, validato in un sistema sanitario non europeo o mai testato rispetto alle presentazioni indifferenziate che caratterizzano la medicina generale, lo strumento può produrre raccomandazioni sistematicamente fuorvianti nel contesto in cui viene effettivamente utilizzato. Per i decisori sanitari che valutano questi strumenti, sia a livello di studio, di rete o di commissione, comprendere cosa significhi una validazione rigorosa è ora una responsabilità fondamentale di governance.
Perché la validazione non è la stessa cosa del test del software
Il test del software conferma che un sistema si comporta come previsto dai suoi sviluppatori. La validazione clinica pone una domanda diversa: il comportamento previsto del sistema produce risultati sicuri ed efficaci per pazienti reali in un ambiente clinico reale?
La distinzione è importante perché uno strumento può essere tecnicamente corretto e clinicamente dannoso allo stesso tempo. Un algoritmo che calcola accuratamente un punteggio di rischio derivato da un dataset di pazienti ospedalieri nordamericani può sottostimare o sovrastimare sistematicamente il rischio in una popolazione europea di assistenza primaria con caratteristiche demografiche, pattern di comorbilità e comportamenti di ricerca di cure diversi. Uno strumento di supporto decisionale per la prescrizione validato in un contesto di assistenza specialistica può generare avvisi calibrati per pazienti gestiti da specialisti, ma produrre affaticamento da avvisi o segnali mancati quando distribuito nella medicina generale.
Una revisione sistematica degli approcci di progettazione dei sistemi di supporto decisionale clinico pubblicata sul Journal of Medical Internet Research identifica la fiducia dei clinici e la spiegabilità come sfide centrali per l'adozione. Questi sono problemi che derivano da fallimenti di validazione, non da errori del software. Quando le raccomandazioni di uno strumento non corrispondono alla realtà clinica che un medico di base osserva, la fiducia si erode indipendentemente dal fatto che il software funzioni tecnicamente in modo corretto.
La validazione clinica richiede prove che uno strumento produca output accurati, sicuri e clinicamente appropriati per la popolazione e il contesto specifici in cui verrà utilizzato, non solo prove che produca output in generale.
Il panorama normativo: dove il Regolamento sui dispositivi medici traccia il confine
Non tutti gli strumenti di supporto decisionale clinico sono dispositivi medici ai sensi del Regolamento UE sui dispositivi medici (MDR) 2017/745, ma un numero significativo e crescente lo è. La distinzione normativa fondamentale è tra strumenti che forniscono informazioni cliniche generali e strumenti che guidano o influenzano direttamente una decisione clinica per un singolo paziente.
Ai sensi del Regolamento sui dispositivi medici (MDR), uno strumento software che analizza dati specifici del paziente per generare raccomandazioni per diagnosi, trattamento, stratificazione del rischio o prescrizione è probabile che soddisfi la definizione di dispositivo medico. Una volta classificato come tale, deve portare la marcatura CE, che richiede al produttore di dimostrare prove cliniche di sicurezza e prestazioni prima di immettere lo strumento sul mercato europeo.
Dal 2026 in poi, i produttori di dispositivi medici abilitati all'intelligenza artificiale (IA, un sistema informatico che esegue compiti che normalmente richiedono l'intelligenza umana) dovranno affrontare una doppia conformità sia al MDR che all'AI Act dell'UE. L'AI Act classifica automaticamente i sistemi di supporto decisionale clinico basati sull'IA come ad alto rischio, attivando valutazioni di conformità obbligatorie, monitoraggio dei bias, obblighi di trasparenza e requisiti di supervisione umana che vanno oltre quanto richiesto dal solo MDR. Il quadro di conformità MyHealth@EU aggiunge un ulteriore livello per gli strumenti che operano tra gli Stati membri dell'UE, richiedendo che metadati specifici per l'IA e documentazione di provenienza siano incorporati nei messaggi di scambio di dati clinici.
La marcatura CE non è una garanzia di idoneità allo scopo in un contesto clinico specifico. È una dichiarazione del produttore che il dispositivo soddisfa i requisiti normativi applicabili. La marcatura CE è una condizione necessaria per la distribuzione legale in Europa, ma non una condizione sufficiente per l'adozione clinica in un particolare contesto.
Un'analisi peer-reviewed pubblicata su npj Health Systems identifica lacune significative negli attuali standard MDR dell'UE per i sistemi di IA basati sui dati e adattivi. Queste lacune significano che alcuni strumenti possono raggiungere la conformità normativa pur mancando della validazione clinica rigorosa che la distribuzione nell'assistenza primaria richiede.
Cosa comporta effettivamente la validazione clinica
La validazione clinica è un processo strutturato per dimostrare che uno strumento funziona come previsto su una popolazione di pazienti definita. Per gli strumenti di supporto decisionale clinico, i componenti principali includono:
Prove di accuratezza clinica: Prestazioni dimostrate rispetto a uno standard di riferimento, ad esempio confronto di punteggi di rischio con algoritmi validati indipendentemente, o confronto di raccomandazioni con revisione clinica esperta. Un esempio precoce di questa metodologia appare in una valutazione a metodi misti di un sistema di supporto decisionale clinico cardiovascolare nell'assistenza primaria, dove l'algoritmo di valutazione del rischio dello strumento è stato confrontato con una versione programmata indipendentemente, raggiungendo un coefficiente di correlazione intraclasse di 0,999, e i consigli di gestione sono stati rivisti rispetto alle raccomandazioni dei medici derivanti dalla revisione manuale delle linee guida.
Dati di popolazione rappresentativi: Prove che il dataset di validazione rifletta le caratteristiche demografiche, cliniche e socioeconomiche della popolazione in cui lo strumento verrà utilizzato. La validazione su un dataset ristretto o non rappresentativo limita la generalizzabilità delle dichiarazioni di prestazione.
Revisione indipendente: La validazione interna da parte del produttore è necessaria ma non sufficiente. La pubblicazione peer-reviewed, l'audit indipendente o la valutazione di terze parti forniscono un controllo sulla qualità metodologica e sull'integrità delle dichiarazioni di prestazione.
Studi prospettici o retrospettivi nel contesto target: L'analisi retrospettiva di dati esistenti può stabilire prestazioni di base, ma gli studi prospettici, idealmente nel contesto di cura effettivo, forniscono prove più solide di utilità clinica nel mondo reale.
La validazione condotta in un paese o contesto di cura non si trasferisce automaticamente. Una revisione di scoping sull'implementazione di sistemi di supporto decisionale clinico per l'asma nell'assistenza primaria, che copre 18 studi in contesti tra cui Regno Unito e Spagna, illustra come i risultati dell'implementazione varino significativamente tra i sistemi sanitari, anche all'interno dell'Europa, a seconda dell'integrazione nel flusso di lavoro, delle caratteristiche della popolazione di pazienti e delle linee guida cliniche locali.
Come l'assistenza primaria introduce sfide di validazione specifiche
La medicina generale presenta condizioni che differiscono strutturalmente dai contesti ospedalieri e specialistici in cui molti strumenti di supporto decisionale clinico vengono inizialmente sviluppati e validati. Queste differenze influenzano se le prestazioni di uno strumento in un contesto predicono le sue prestazioni in un altro.
Le caratteristiche dell'assistenza primaria che complicano il trasferimento della validazione includono:
Presentazioni indifferenziate: I medici di base incontrano pazienti prima che sia stata stabilita una diagnosi. Uno strumento validato su diagnosi codificate da sistemi di cartelle cliniche di assistenza specialistica può funzionare male quando applicato alle presentazioni ambigue, a livello di sintomi, che arrivano in uno studio medico.
Pressione temporale e carico cognitivo: L'elevata domanda di cure e le strutture frammentate sono caratteristiche riconosciute dei sistemi di assistenza primaria in tutta Europa. Uno strumento che richiede un'immissione di dati significativa o interrompe il flusso clinico può generare soluzioni alternative che minano la sua funzione prevista e le sue prestazioni validate.
Caratteristiche demografiche diverse e non selezionate: Le popolazioni di validazione ospedaliera sono selezionate da percorsi di riferimento e criteri di ammissione. Le popolazioni dei medici di base non lo sono. Età, multimorbilità, alfabetizzazione sanitaria e diversità socioeconomica nell'assistenza primaria possono differire sostanzialmente dalle coorti ospedaliere, influenzando sia la prevalenza delle condizioni che i tassi di base su cui si basano gli algoritmi predittivi.
Integrazione con i sistemi esistenti: Uno studio qualitativo di un prototipo di sistema di supporto decisionale clinico nell'assistenza primaria tedesca, il progetto SATURN, ha rilevato che lo sviluppo iterativo con i medici di base e i test di usabilità erano essenziali per identificare le barriere di implementazione che non sarebbero state visibili in uno studio di validazione controllato. Le prestazioni tecniche e l'usabilità clinica sono dimensioni correlate ma distinte della validazione.
Una revisione di scoping dei sistemi di supporto decisionale clinico per la prescrizione nell'assistenza primaria pubblicata all'inizio del 2025 mappa le lacune di evidenza in quest'area, rilevando che i dati sull'impatto dell'implementazione per gli strumenti di prescrizione nell'assistenza primaria rimangono limitati e che i disegni degli studi variano considerevolmente in rigore, rendendo difficile il confronto diretto delle dichiarazioni di validazione dei fornitori.
Il ruolo delle prove del mondo reale dopo la distribuzione
La validazione pre-distribuzione stabilisce una linea di base delle prestazioni in condizioni controllate o semi-controllate. Non può anticipare ogni scenario clinico, cambiamento di popolazione o modifica delle linee guida che si verificherà una volta che uno strumento è in uso attivo. Per questo motivo il follow-up clinico post-commercializzazione (PMCF, un processo obbligatorio di raccolta e revisione sistematica delle prove del mondo reale delle prestazioni di un dispositivo medico dopo la distribuzione) è un obbligo vincolante ai sensi del MDR per il software di dispositivi medici, non un'attività opzionale di miglioramento della qualità.
Il PMCF richiede ai produttori di raccogliere e rivedere sistematicamente le prove del mondo reale delle prestazioni del dispositivo dopo la distribuzione. Per gli strumenti di supporto decisionale clinico, questo significa:
Monitoraggio continuo dell'accuratezza delle raccomandazioni e dei tassi di avviso nell'uso clinico reale
Sorveglianza per segnali di sicurezza emergenti, inclusi pattern di override del clinico o mancato utilizzo che possono indicare errori sistematici
Rivalutazione periodica delle prestazioni man mano che le popolazioni di pazienti cambiano o le linee guida cliniche vengono aggiornate
Documentazione dei risultati e, ove necessario, azione correttiva
I requisiti dell'AI Act dell'UE per la valutazione continua del rischio post-commercializzazione rafforzano ed estendono questi obblighi per gli strumenti classificati come IA, richiedendo il monitoraggio degli incidenti e l'allineamento con l'emergente infrastruttura europea dei dati sanitari.
I decisori sanitari dovrebbero chiedere ai fornitori non solo quale validazione pre-distribuzione sia stata condotta, ma anche quale infrastruttura di follow-up clinico post-commercializzazione sia in atto e come i risultati vengano comunicati alle organizzazioni che distribuiscono. Un fornitore senza un chiaro piano di monitoraggio post-distribuzione rappresenta un rischio di governance oltre che clinico.
La raccolta di prove del mondo reale nell'assistenza primaria è strutturalmente difficile. L'elevato volume di pazienti, la qualità variabile dei dati nei sistemi di cartelle cliniche e l'assenza di misurazione standardizzata dei risultati rendono genuinamente difficile rilevare un sottile degrado delle prestazioni nei sistemi di supporto decisionale clinico distribuiti. Questo non riduce l'obbligo di raccogliere tali prove. Significa che la qualità dei piani di follow-up clinico post-commercializzazione varia considerevolmente e dovrebbe essere esaminata di conseguenza.
Requisiti dei dati: GDPR, residenza dei dati e trasparenza dei dati di addestramento
La qualità di uno strumento di supporto decisionale clinico è inseparabile dalla qualità, provenienza e rappresentatività dei dati su cui è stato addestrato e testato. Per i decisori sanitari europei, tre domande relative ai dati sono particolarmente importanti.
Conformità al Regolamento generale sulla protezione dei dati e uso lecito dei dati: I dati di addestramento per l'IA clinica devono essere stati ottenuti legalmente. Ai sensi del Regolamento generale sulla protezione dei dati (GDPR), questo richiede tipicamente o il consenso esplicito del paziente, una base giuridica legittima per il trattamento dei dati sanitari, o l'uso di dati che siano stati adeguatamente anonimizzati. I fornitori dovrebbero essere in grado di dimostrare, non semplicemente affermare, che i loro dati di addestramento sono stati ottenuti in conformità con la legge applicabile sulla protezione dei dati. Il quadro della Commissione europea per l'IA nella sanità posiziona lo Spazio europeo dei dati sanitari (EHDS, un'infrastruttura europea per lo scambio e l'uso secondario dei dati sanitari), con il Regolamento EHDS entrato in vigore nel 2025 e l'implementazione graduale negli Stati membri negli anni successivi, come meccanismo primario per consentire l'uso lecito dei dati sanitari per l'addestramento e la valutazione dell'IA negli Stati membri.
Residenza dei dati nell'UE: Dove vengono elaborati i dati dei pazienti durante l'inferenza, cioè quando lo strumento analizza i dati di un paziente reale per generare una raccomandazione, è importante per la conformità al GDPR. I dati elaborati al di fuori dell'UE o dello Spazio economico europeo sono soggetti a restrizioni di trasferimento a meno che non siano in atto garanzie adeguate. I decisori sanitari dovrebbero confermare che l'infrastruttura di elaborazione di un fornitore soddisfi i requisiti di residenza dei dati dell'UE, non solo che il fornitore affermi la conformità al GDPR in termini generali.
Rappresentatività dei dati di addestramento e bias: Uno strumento addestrato prevalentemente su dati di un gruppo demografico, un sistema sanitario o un contesto di prevalenza di malattie può funzionare diversamente, e meno in sicurezza, quando applicato a una popolazione diversa. Le linee guida per la doppia conformità per i dispositivi medici IA ai sensi del MDR e dell'AI Act ora richiedono ai produttori di documentare il monitoraggio dei bias e di dimostrare che i dati di addestramento erano rappresentativi della popolazione di uso prevista. I decisori dovrebbero chiedere ai fornitori di fornire questa documentazione piuttosto che accettare assicurazioni generali.
Cosa chiedere a un fornitore prima di adottare uno strumento di supporto decisionale clinico
Le seguenti domande forniscono un quadro di valutazione pratico per medici di base, responsabili di studio e responsabili clinici che valutano uno strumento di supporto decisionale clinico prima dell'adozione. Coprono le dimensioni più probabili per rivelare lacune tra le affermazioni di un fornitore e il rigore della loro base di evidenza.
Stato normativo:
Questo strumento è classificato come dispositivo medico ai sensi del MDR UE 2017/745? In caso affermativo, qual è la sua classificazione (Classe I, IIa, IIb o III)?
Porta la marcatura CE e può fornire la Dichiarazione di conformità?
È stato valutato ai sensi della classificazione ad alto rischio dell'AI Act dell'UE? In caso affermativo, quale valutazione di conformità è stata completata?
Prove cliniche:
Quali studi di validazione clinica sono stati condotti e sono pubblicati su riviste peer-reviewed?
Gli studi di validazione sono stati condotti in contesti di assistenza primaria europea o in altri contesti di cura?
Quali erano le caratteristiche della popolazione di validazione, inclusi età, profilo di comorbilità, etnia e sistema sanitario?
Prestazioni e trasparenza:
Quali metriche di prestazione sono riportate (sensibilità, specificità, valore predittivo positivo, tassi di avviso)?
Lo strumento può spiegare le sue raccomandazioni in termini che un clinico può valutare? La logica del modello è trasparente o una scatola nera?
Come si comporta lo strumento tra i sottogruppi demografici?
Post-distribuzione:
Quale piano di follow-up clinico post-commercializzazione è in atto e come vengono riportati i risultati alle organizzazioni che distribuiscono?
Come vengono gestiti gli aggiornamenti del modello e la rivalidazione avviene prima che gli aggiornamenti vengano distribuiti?
Dati e integrazione:
Dove vengono elaborati i dati dei pazienti e questo soddisfa i requisiti di residenza dei dati dell'UE?
Lo strumento può integrarsi con il nostro sistema di cartelle cliniche esistente senza richiedere un'immissione di dati aggiuntiva significativa?
Qual è la certificazione di sicurezza delle informazioni del fornitore (ad esempio, ISO 27001)?
Segnali d'allarme: quando le affermazioni di validazione di un fornitore dovrebbero essere esaminate
Alcune affermazioni di validazione sono tecnicamente accurate ma praticamente fuorvianti. I seguenti pattern dovrebbero richiedere un esame più attento da parte dei decisori sanitari.
Validazione condotta esclusivamente al di fuori dell'Europa. Uno strumento validato negli Stati Uniti, in Australia o in un altro sistema sanitario non europeo potrebbe essere stato testato su popolazioni con prevalenza di malattie, percorsi di cura e pratiche di codifica clinica diverse. Questo non squalifica automaticamente le prove, ma richiede al fornitore di dimostrare perché i risultati sono trasferibili, non semplicemente affermare che lo sono. Le prove dall'implementazione di sistemi di supporto decisionale clinico per l'asma nei contesti di assistenza primaria europea mostrano che i risultati variano anche all'interno dell'Europa, rendendo la validazione non europea una limitazione significativa.
Validazione solo su popolazioni di assistenza specialistica o ospedaliera. I pazienti ospedalizzati e i pazienti specialistici riferiti non sono rappresentativi della popolazione indifferenziata che si presenta nella medicina generale. Uno strumento validato esclusivamente in questi contesti non è stato testato sui pazienti per cui un medico di base lo utilizzerà effettivamente.
Assenza di revisione indipendente tra pari. I rapporti di validazione interni prodotti dal produttore non sono equivalenti alla pubblicazione peer-reviewed o all'audit indipendente. Se un fornitore non può indicare prove esaminate esternamente, la base di validazione dovrebbe essere trattata come preliminare.
Logica del modello opaca. Se un fornitore non può o non vuole spiegare come lo strumento raggiunge le sue raccomandazioni, i clinici non possono valutare in modo significativo se una raccomandazione è appropriata per un paziente specifico. L'IA spiegabile è identificata nella letteratura sulla progettazione di sistemi di supporto decisionale clinico come prerequisito per la fiducia dei clinici e l'adozione sicura, non una caratteristica desiderabile ma un requisito funzionale.
Nessun chiaro piano di follow-up clinico post-commercializzazione. Un fornitore che non può descrivere come monitorerà le prestazioni del mondo reale dopo la distribuzione non ha completato i suoi obblighi di evidenza clinica ai sensi del MDR. Questa è una lacuna normativa oltre che un rischio clinico.
Affermazioni di conformità all'AI Act senza specifiche. Dato che i requisiti di valutazione della conformità dell'AI Act per i sistemi ad alto rischio includono il monitoraggio dei bias, la documentazione della trasparenza e i meccanismi di supervisione umana, un'affermazione generale di conformità senza documentazione di supporto dovrebbe essere trattata come non verificata.
Il livello di approvvigionamento e governance: chi altro deve essere coinvolto
L'adozione di uno strumento di supporto decisionale clinico non è una decisione che può o dovrebbe ricadere su un singolo medico di base o responsabile di studio. Coinvolge dimensioni cliniche, legali, di governance delle informazioni e di rischio organizzativo che richiedono input da più ruoli.
La ricerca sull'implementazione di sistemi di supporto decisionale clinico nell'assistenza primaria olandese identifica il coinvolgimento di più stakeholder come uno dei due meccanismi fondamentali che supportano la distribuzione di successo, insieme allo sviluppo iterativo. Lo studio ha rilevato che coinvolgere stakeholder multilivello, innovativi e influenti fin dall'inizio, e mantenere l'allineamento attraverso un attore orchestrante, erano prerequisiti pratici per un'implementazione sostenibile. Le decisioni prese senza questa ampiezza di input tendevano a far emergere problemi successivamente, a costi maggiori.
Nei sistemi sanitari europei, i ruoli di governance tipicamente coinvolti nell'approvvigionamento di sistemi di supporto decisionale clinico includono:
Responsabili della sicurezza clinica: Responsabili della valutazione del rischio clinico e della garanzia che la distribuzione di uno strumento non introduca pericoli per la sicurezza del paziente. In Inghilterra, questa funzione è formalizzata nello standard di gestione del rischio clinico DCB0160. Quadri equivalenti esistono negli Stati membri dell'UE.
Responsabili della governance delle informazioni: Responsabili della valutazione della conformità al GDPR, degli accordi di trattamento dei dati e della residenza dei dati. Gli accordi di trattamento dei dati dei fornitori dovrebbero essere esaminati da questa funzione prima che qualsiasi dato del paziente venga condiviso con uno strumento.
Organismi di commissione e acquirenti del sistema sanitario: Nei sistemi sanitari europei finanziati pubblicamente, l'approvvigionamento di software clinico coinvolge tipicamente processi di gara formali, panel di valutazione clinica e valutazioni dell'impatto sul budget. Le prove di validazione dovrebbero essere presentate come parte di questi processi, non trattate come una considerazione post-contrattuale.
Team di informatica clinica e sistemi di cartelle cliniche: L'integrazione con i sistemi di cartelle cliniche esistenti è una questione di governance tecnica e clinica. Uno strumento che non può accedere in modo affidabile ai dati di cui ha bisogno, o che introduce nuovi oneri di immissione dati, non funzionerà come validato.
Il quadro di valutazione pre-distribuzione proposto nel modello RISED per i sistemi di supporto decisionale IA ad alto rischio nella sanità raccomanda di trattare la valutazione della conformità, la revisione della trasparenza e la progettazione della supervisione umana come componenti integrati di un unico processo pre-distribuzione, non passaggi sequenziali gestiti da team separati. Per i decisori sanitari, questo significa costruire un processo di valutazione interfunzionale prima che venga presa una decisione di approvvigionamento, non dopo che un contratto è stato firmato.
Le prove di validazione, in questo contesto, non sono un documento da archiviare. Sono il fondamento su cui si basano la governance clinica, la sicurezza del paziente e la responsabilità organizzativa.
Domande frequenti
Qual è la differenza tra test del software e validazione clinica per uno strumento di supporto decisionale clinico
Il test del software conferma che un sistema si comporta come previsto dai suoi sviluppatori. La validazione clinica chiede se quel comportamento previsto produce risultati sicuri ed efficaci per pazienti reali in un ambiente clinico reale. Uno strumento può essere tecnicamente corretto e clinicamente dannoso allo stesso tempo. Ad esempio, un algoritmo che calcola accuratamente un punteggio di rischio derivato da dati ospedalieri nordamericani può sottostimare o sovrastimare sistematicamente il rischio in una popolazione europea di assistenza primaria con caratteristiche demografiche e comportamenti di ricerca di cure diversi.
Quando uno strumento di supporto decisionale clinico si qualifica come dispositivo medico ai sensi delle normative dell'UE
Ai sensi del Regolamento UE sui dispositivi medici (MDR) 2017/745, uno strumento software che analizza dati specifici del paziente per generare raccomandazioni per diagnosi, trattamento, stratificazione del rischio o prescrizione è probabile che soddisfi la definizione di dispositivo medico. Una volta classificato come tale, deve portare la marcatura CE, che richiede al produttore di dimostrare prove cliniche di sicurezza e prestazioni prima di immettere lo strumento sul mercato europeo. Dal 2026, i dispositivi medici abilitati all'intelligenza artificiale affrontano anche una doppia conformità sia al MDR che all'AI Act dell'UE.
La marcatura CE garantisce che uno strumento di supporto decisionale clinico sia sicuro da usare nel mio studio
No. La marcatura CE è una dichiarazione del produttore che il dispositivo soddisfa i requisiti normativi applicabili. È una condizione necessaria per la distribuzione legale in Europa, ma non una condizione sufficiente per l'adozione clinica in un particolare contesto. Un'analisi peer-reviewed pubblicata su npj Health Systems identifica lacune significative negli attuali standard MDR dell'UE per i sistemi di IA basati sui dati e adattivi, il che significa che alcuni strumenti possono raggiungere la conformità normativa pur mancando della validazione clinica rigorosa che la distribuzione nell'assistenza primaria richiede.
Perché la validazione di uno strumento di supporto decisionale clinico per la medicina generale è particolarmente impegnativa
La medicina generale presenta condizioni che differiscono strutturalmente dai contesti ospedalieri e specialistici in cui molti strumenti vengono inizialmente sviluppati. I medici di base incontrano pazienti prima che sia stata stabilita una diagnosi, quindi uno strumento validato su diagnosi codificate da sistemi di cartelle cliniche di assistenza specialistica può funzionare male rispetto alle presentazioni ambigue, a livello di sintomi, che arrivano in uno studio medico. Le popolazioni di assistenza primaria sono anche più diverse per età, multimorbilità e background socioeconomico rispetto alle coorti ospedaliere, il che influisce sui tassi di base su cui si basano gli algoritmi predittivi.
Cosa significa il follow-up clinico post-commercializzazione per gli strumenti di supporto decisionale clinico e perché è importante
Il follow-up clinico post-commercializzazione (PMCF) è un obbligo vincolante ai sensi del MDR per il software di dispositivi medici. Richiede ai produttori di raccogliere e rivedere sistematicamente le prove del mondo reale delle prestazioni del dispositivo dopo la distribuzione. Per gli strumenti di supporto decisionale clinico, questo include il monitoraggio continuo dell'accuratezza delle raccomandazioni e dei tassi di avviso, la sorveglianza per pattern di override del clinico che possono indicare errori sistematici e la rivalutazione periodica man mano che le popolazioni di pazienti cambiano o le linee guida cliniche vengono aggiornate. Un fornitore senza un chiaro piano di monitoraggio post-distribuzione rappresenta un rischio di governance oltre che clinico.
Quali domande relative ai dati dovrebbero porre i decisori sanitari prima di adottare uno strumento di supporto decisionale clinico
Tre domande sono particolarmente importanti. Primo, i dati di addestramento sono stati ottenuti legalmente ai sensi del Regolamento generale sulla protezione dei dati (GDPR), che richiede o il consenso esplicito del paziente, una base giuridica legittima o un'anonimizzazione appropriata? Secondo, dove vengono elaborati i dati dei pazienti durante l'inferenza e questo soddisfa i requisiti di residenza dei dati dell'UE? Terzo, il fornitore fornisce documentazione che dimostra che i dati di addestramento erano rappresentativi della popolazione di uso prevista e che è in atto il monitoraggio dei bias? Le assicurazioni generali di conformità al GDPR non sono un sostituto per risposte specifiche a ciascuna di queste domande.
Quali sono i segnali d'allarme che dovrebbero richiedere un esame più attento delle affermazioni di validazione di un fornitore
Diversi pattern dovrebbero richiedere un esame più attento. La validazione condotta esclusivamente al di fuori dell'Europa potrebbe non trasferirsi alle popolazioni di assistenza primaria europea. La validazione solo su popolazioni di assistenza specialistica o ospedaliera significa che lo strumento non è stato testato sui pazienti indifferenziati per cui un medico di base lo utilizzerà effettivamente. L'assenza di revisione indipendente tra pari significa che la base di evidenza dovrebbe essere trattata come preliminare. La logica del modello opaca impedisce ai clinici di valutare se una raccomandazione è appropriata per un paziente specifico. E un fornitore che non può descrivere il proprio piano di follow-up clinico post-commercializzazione non ha completato i propri obblighi di evidenza clinica ai sensi del MDR.
Chi dovrebbe essere coinvolto nella decisione di adottare uno strumento di supporto decisionale clinico
L'adozione di uno strumento di supporto decisionale clinico non è una decisione che può ricadere su un singolo medico di base o responsabile di studio. Coinvolge dimensioni cliniche, legali, di governance delle informazioni e di rischio organizzativo. I ruoli di governance tipicamente coinvolti includono responsabili della sicurezza clinica, responsabili della governance delle informazioni, organismi di commissione e team di informatica clinica responsabili dell'integrazione del sistema di cartelle cliniche. La ricerca sull'implementazione di sistemi di supporto decisionale clinico nell'assistenza primaria olandese identifica il coinvolgimento di più stakeholder come uno dei due meccanismi fondamentali che supportano la distribuzione di successo, insieme allo sviluppo iterativo.
Quali prove cliniche dovrebbe essere in grado di fornire un fornitore prima che uno strumento venga adottato
I fornitori dovrebbero essere in grado di fornire la pubblicazione peer-reviewed di studi di validazione clinica, dettagli della popolazione di validazione inclusi età, profilo di comorbilità, etnia e sistema sanitario, e metriche di prestazione come sensibilità, specificità e valore predittivo positivo. Gli studi condotti in contesti di assistenza primaria europea hanno più peso di quelli condotti in altri contesti di cura. I rapporti di validazione interni prodotti dal produttore non sono equivalenti a prove esaminate indipendentemente e dovrebbero essere trattati come preliminari se non è disponibile alcuna revisione esterna.
Come cambia l'AI Act dell'UE i requisiti di conformità per gli strumenti di supporto decisionale clinico
L'AI Act dell'UE classifica automaticamente i sistemi di supporto decisionale clinico basati sull'IA come ad alto rischio. Questo attiva valutazioni di conformità obbligatorie, monitoraggio dei bias, obblighi di trasparenza e requisiti di supervisione umana che vanno oltre quanto richiesto dal solo MDR. Dal 2026, i produttori di dispositivi medici abilitati all'IA affrontano una doppia conformità sia al MDR che all'AI Act. Un'affermazione generale di conformità all'AI Act senza documentazione di supporto dovrebbe essere trattata come non verificata, dato che i requisiti di valutazione della conformità includono il monitoraggio dei bias, la documentazione della trasparenza e i meccanismi di supervisione umana.