I numeri dicono sempre la verità?

19 Novembre 2020 di Luca De Fiore (Pensiero Scientifico Editore)

Non siamo solo noi italiani a essere sommersi dai dati. Anche se questa volta non conviene consolarsi col proverbio “mal comune, mezzo gaudio”, possiamo almeno trovare conforto nella risposta che persone di altri Paesi cercano di dare alla sollecitazione di un’epidemia di informazioni (infodemia, l’ha definita l’Organizzazione Mondiale della Sanità) che non sembra diminuire. Un articolo molto acuto uscito su una delle riviste di medicina più conosciute del mondo – il BMJ, rivista ufficiale della associazione dei medici britannici, vale a dire la British Medical Association – raccomanda di essere molto diffidenti nei confronti di chi si mostra troppo sicuro di sé parlando di Covid-19: “Quanto più una persona ostenta sicurezza, tanto meno dovrai aver fiducia in lei” [1].

Nella comunità scientifica che si interessa di Covid-19 – spiegano gli autori – “le certezze sembrano essere ovunque. I commentatori, da qualsiasi parte provengano (accademici, professionisti, antichi quotidiani o nuovi media), sembra sappiano esattamente cosa sta succedendo e cosa fare al riguardo. Non stiamo parlando di coloro che insistono sul fatto che l’idrossiclorochina ci salverà tutti o che chiamano le mascherine chirurgiche ‘museruole’ o ‘pannolini per il viso’ o che dichiarano che molti casi di Covid-19 rilevati sono falsi positivi. Possiamo anche lasciare da parte coloro che eludono la realtà per suggerire che avremo un mondo libero dal Covid-19 entro pochi mesi se seguiamo semplicemente i loro consigli. Piuttosto, stiamo pensando alle molte persone razionali con una credibilità scientifica che fanno dichiarazioni pubbliche molto convinte su Covid-19, al punto che sembrano suggerire che non possono esserci motivi legittimi per essere in disaccordo con loro” [1]. Quasi sempre questo tipo di dichiarazione è accompagnato da numeri, come se fosse sufficiente esporre qualche cifra per garantirsi credibilità. Non è così semplice, in verità, perché i numeri possono ingannare: anzi, talvolta sono presentati proprio per imbrogliare l’interlocutore [2].

Questa certezza apparentemente incrollabile è stata criticata anche da un documento preparato da alcuni ricercatori della Società Italiana di Statistica Medica ed Epidemiologica Clinica (SISMEC): “Chi ha il difficile compito di prendere decisioni deve imparare, introiettare, che la scienza non trasmette verità o certezze, ma è un processo spesso lungo e non lineare che prosegue nel tentativo di ridurre l’incertezza. La responsabilità della decisione comporta anche questo, andare nella direzione che minimizza l’incertezza degli esiti e quindi massimizza la probabilità che la decisione sia consistente con gli obiettivi” [3].

Dottore, allora non sono l’unico che non riesce a orientarsi tra i numeri forniti sulla pandemia?

Assolutamente no. Molti medici, pazienti, giornalisti e politici hanno problemi a interpretare le statistiche sulla salute o traggono conclusioni sbagliate senza accorgersene. Al punto che si parla di “analfabetismo statistico collettivo”, intendendo con questa espressione la diffusa incapacità di comprendere il significato dei numeri [4].

Nelle diverse Regioni e aree italiane, i dati sono raccolti nello stesso modo?

Questo è un punto importante perché in realtà i sistemi di raccolta dei dati (solitamente sono chiamati sistemi informativi) non sono tutti uguali. Sono stati attivati in tempi diversi, con obiettivi e coperture territoriali differenti. Questa disomogeneità può creare delle difficoltà nell’accessibilità e utilizzo dei dati per produrre in tempo reale, o quasi, le informazioni necessarie a contrastare l’emergenza [3]. Ma, soprattutto, può rendere più difficile confrontare i dati di una Regione con quelli di un’altra.

Una cosa che mi colpisce tanto sono le previsioni sui decessi che potranno avvenire a causa della pandemia…

In effetti, già a partire dalle prime settimane di epidemia – forse ancor prima che l’Organizzazione Mondiale della Sanità dichiarasse che ci trovavamo di fronte a una pandemia – sono state diffuse molte informazioni spesso allarmanti e tra loro discordanti. Una previsione elaborata da uno dei centri di ricerca epidemiologica più apprezzati del mondo – l’Imperial College di Londra – aveva previsto “approssimativamente 510 mila morti” causati da una pandemia qualora l’impatto non fosse stato mitigato da contromisure adeguate [5]. Allo stesso tempo, un centro studi statunitense molto conosciuto – lo Health Metrics and Evaluation, curatore del rapporto sul Global Burden of Diseases [6] – aveva elaborato una previsione di una curva dei contagi molto meno drammatica di quella che poi si sarebbe verificata: grande soddisfazione da parte del Presidente Trump e gran brutta figura per i ricercatori [7].
Si tratta di previsioni elaborate in base a modelli matematici e statistici (modelli predittivi) con l’obiettivo di quantificare la diffusione della malattia, di stimare il numero di persone contagiate, malate, decedute o progressivamente guarite. Nonché di analizzare il persistere dell’immunità, di prevedere l’evoluzione dell’epidemia. Come spiegano i ricercatori della SISMEC, “la solidità dei risultati dell’applicazione dei suddetti modelli è strettamente associata alla qualità e alla completezza delle informazioni necessarie alla costruzione del modello” [3].

A cosa è dovuto il forte aumento del numero dei casi?

Sicuramente al contagio conseguente una maggiore esposizione delle persone già contagiate. Inoltre, va considerato che nella prima fase dell’epidemia i tamponi venivano fatti solo sui soggetti sintomatici perché il nostro sistema sanitario non era così pronto a fronteggiare un’epidemia di queste dimensioni, ha ricordato Annarita Vestri, professoressa alla Sapienza di Roma e presidente della SISMEC. “Non vi erano abbastanza risorse, sia umane sia materiali, e i dati dei test diagnostici, in quel momento, erano quindi riferiti ai casi clinici con sintomi o con pochi sintomi e ai contatti a rischio familiari e/o residenziali. In questa fase attuale, che possiamo definire di sorveglianza e prevenzione, si cerca di eseguire un buon numero di tamponi, che ricordo è l’unico strumento per poter avere la diagnosi, anche se non vi è mai la certezza assoluta (ci sono percentuali sia di falsi positivi che di falsi negativi), quindi l’aumento dei casi che oscilla giornalmente è dovuto principalmente all’aumento del numero dei tamponi eseguiti, che variano di giorno in giorno e anche rispetto alle diverse realtà territoriali” [8].

Allora l’incremento dei casi totali comunicato dal Ministero della Salute indica con precisione il numero delle nuove persone contagiate…

Si può dire che il numero assoluto dei casi positivi – e quindi il numero dei nuovi casi desunto come differenza tra quelli registrati e quelli del giorno precedente – è indicativo dell’andamento dell’epidemia, ma è fondamentale metterlo in relazione al numero delle persone effettivamente testate, per valutare la variazione del rapporto tra il numero di casi positivi e quello dei risultati negativi. Altro aspetto importante: dal momento che è spesso necessario eseguire due tamponi per ogni persona (uno per effettuare la diagnosi e l’altro per verificare la guarigione), che siano stati effettuati 100 mila test in un giorno non indica che siano stati sottoposti al test centomila nuovi cittadini [9]. Quindi sarebbe necessario conoscere il rapporto tra nuovi casi e tamponi diagnostici eseguiti.
“Occorre una lettura integrata di più indicatori”, spiega Annarita Vestri, “[cosa] non sempre facile per il cittadino. Il Ministero della Salute e l’Istituto Superiore di Sanità pubblicano i dati del monitoraggio ogni settimana disaggregato per Regione. Uno degli indicatori è l’incidenza a 7 o 14 giorni su 100.000 abitanti; questa misura indica il numero dei nuovi casi che si verificano in quel periodo di tempo ed espressi per 100.000 abitanti, in tal modo il dato non risente del variare della dimensione della popolazione. Viene espresso in unità di tempo (7 o 14 giorni) e viene definito tasso poiché esprime la variazione del numero dei nuovi casi al variare del tempo”. I dati più oggettivi sono quelli riferiti ai pazienti ricoverati in terapia intensiva e in regime ordinario per Covid-19, conclude Vestri [8].

Quindi se vogliamo avere una fotografia dobbiamo guardare ai ricoveri nelle Unità di terapia intensiva?

Può essere un indicatore utile ma il ricovero in terapia intensiva può essere anche guidato da fattori almeno in certa misura soggettivi o legati al contesto. Possiamo facilmente immaginare che in una situazione di minore pressione sul sistema sanitario le équipe mediche possano scegliere un approccio meno selettivo nel triage dei pazienti, decidendo di monitorare più attentamente anche i casi gravi, pur se non critici. Diversamente, in un momento di grande sollecitazione – caratterizzato da una forte domanda di assistenza ospedaliera – la selezione dei pazienti da ricoverare in Terapia intensiva può essere più stringente.
Altro aspetto da tenere in grande considerazione è che i ricoveri in terapia intensiva sono in ultima analisi condizionati dalla disponibilità di letti. Nel leggere i numeri che vengono proposti, occorre fare attenzione perché nel rapporto tra il numero di pazienti ricoverati e posti letto può essere modificato il modo di calcolare il denominatore: da un giorno all’altro, si può passare da “letti disponibili in terapia intensiva” a “letti attivabili in terapia intensiva”. Mettere a confronto dati non ottenuti in maniera omogenea porta a conclusioni sbagliate.

covid coronavirus icon

Come facciamo a sapere a quanti nuovi casi dà origine ogni persona contagiata ?

È necessario definire quante altre persone può infettare in media chi contrae il virus. Questo valore è noto come “numero di riproduzione effettivo”, che a livello internazionale viene indicato con l’acronimo Re (erre con e), stando la lettera “e” a indicare il termine “effettivo”. In italiano, è talvolta indicato con l’acronimo Rt (erre con ti), con la lettera “t” a indicare la variabile “tempo”.
Il valore Re (o Rt) indica dunque la diffusione in tempo reale dell’epidemia, quando la popolazione non è più considerata “vergine”; è quindi un valore influenzabile dall’intervento umano (10).
Re (o Rt) è diverso da quello che possiamo considerare il parametro di base, R0 (o R-zero). R0 corrisponde alla media delle infezioni secondarie previste per ogni caso primario in una popolazione cosiddetta sensibile, che non è quindi mai entrata in contatto prima di allora con il virus. R0 valuta la capacità in assoluto – quindi potremmo dire in linea teorica – di un agente patogeno di avviare un’epidemia e il grado con cui questo diventa contagioso in assenza di azioni messe in atto per controllarlo.
Infine, un’ultima precisazione a proposito di un’espressione che vediamo utilizzata nelle ultime settimane: lo Rt puntuale. Si riferisce al numero dei casi sintomatici rilevati localmente in un determinato giorno (t). Invece lo R su 14 giorni è il valore medio a un dato giorno rilevato nelle due settimane precedenti.

A quali numeri dobbiamo guardare per sapere quanto è pericolosa Covid-19?

Gli epidemiologi quantificano la letalità dei virus in due modi principali. Il “tasso di letalità plausibile” (IFR) è dato dalla percentuale di decessi in rapporto al numero di contagi. Il “tasso di letalità apparente” (CFR) è dato dalla percentuale di decessi in relazione al numero totale delle diagnosi confermate. Calcolare una stima dell’IFR e del CFR è stato molto difficile nei primi mesi dell’epidemia. Questo è ciò che accade sempre, per diverse ragioni, all’esordio di una nuova epidemia. Distinguere il reale denominatore – tra persone contagiate e persone con sintomi – è molto complicato. Prima di ogni cosa, la carenza di tamponi, soprattutto all’inizio, rende difficile individuare chi è infetto, soprattutto se asintomatico. Inoltre, molte delle persone contagiate non si rivolgono ai medici, soprattutto se i sintomi sono lievi. O, al contrario, alcuni potrebbero non avere abbastanza tempo per chiedere aiuto, arrivando alla morte molto velocemente. L’impossibilità di conoscere l’esatta percentuale di persone che, pur essendo state contagiate, restano asintomatiche, rende difficile determinare quante persone sono infette [10].

Cosa sono quei grafici che mostrano le morti in eccesso verificatesi in un dato periodo rispetto agli anni precedenti?

Si tratta di un modo alternativo per valutare l’impatto complessivo della pandemia sulla nostra salute. Dobbiamo considerare infatti che il virus uccide alcune persone direttamente – attraverso il contagio – e altre in maniera indiretta. Pensiamo per esempio a chi è spinto a rimandare il proprio ricovero in ospedale per altre condizioni di salute, morendo così più precocemente, o – in un ambito diverso ma ugualmente importante – pensiamo all’aumento del numero di suicidi a causa della depressione dovuta alla perdita del lavoro o all’isolamento sociale. Ma la pandemia potrebbe anche salvare alcune vite; per esempio, il numero di vittime per incidenti stradali si è ridotto durante l’inverno e la primavera del 2020, poiché c’era meno gente in strada; sono diminuiti i decessi dovuti a complicazioni per interventi di routine, dal momento che gli ospedali hanno annullato quelli meno urgenti per lasciare spazio ai pazienti malati di Covid-19; inoltre, la riduzione dell’inquinamento atmosferico dovuta alla chiusura delle fabbriche ha salvato vite che altrimenti avremmo perso a causa di problemi respiratori [10].

Dottore, ho sentito dire che nel complesso e considerato l’alto numero delle persone contagiate e asintomatiche, Covid-19 non è poi così tanto grave?

Occorre essere prudenti: se facciamo un paragone con la Sars-1, nonostante Covid-19 sia meno letale della valutando il singolo caso, ciò non significa che nel complesso sia meno pericolosa. Immaginiamo una popolazione di 1.000 persone con un agente patogeno che ne infetta 20, facendole gravemente ammalare di polmonite e uccidendone due: il CFR è del 10%. Ora immaginiamo un altro agente patogeno che faccia la stessa cosa facendo ammalare gravemente 20 individui e uccidendone due, ma infettandone altri 180, con sintomi lievi o moderati, senza però portarli alla morte. Il CFR, considerando due decessi su 200 pazienti, sarà pari all’1,0%, rendendo questa seconda malattia all’apparenza più innocua. Ma in realtà, nel complesso, è invece una malattia più seria. Nessuno preferirebbe trovarsi nel secondo gruppo di 1.000 persone anziché nel primo [10].
In conclusione, per saper leggere correttamente i dati nel corso di una pandemia come quella che stiamo attraversando occorre prudenza. L’impegno, però, dev’essere reciproco. Da una parte quello del cittadino o del giornalista chiamati a valutare scrupolosamente le informazioni offerte, dall’altra quello delle istituzioni che devono fornire dati tempestivi, confrontabili, onesti e trasparenti.

covid numeri dicono sempre la verità card

Argomenti correlati:

Coronavirus

Autore Luca De Fiore (Pensiero Scientifico Editore)

Luca De Fiore è stato presidente della Associazione Alessandro Liberati – Network italiano Cochrane, rete internazionale di ricercatori che lavora alla produzione di revisioni sistematiche e di sintesi della letteratura scientifica, utili per prendere decisioni cliniche e di politica sanitaria (www.associali.it). È direttore del Pensiero Scientifico Editore. Dirige la rivista mensile Recenti progressi in medicina, indicizzata su Medline, Scopus, Embase, e svolge attività di revisore per il BMJ sui temi di suo maggiore interesse: conflitti di interesse, frode e cattiva condotta nel campo della comunicazione scientifica. Non ha incarichi di consulenza né di collaborazione – né retribuita né a titolo volontario – con industrie farmaceutiche o alimentari, di dispositivi medici, produttrici di vaccini, compagnie assicurative o istituti bancari.
Tutti gli articoli di Luca De Fiore (Pensiero Scientifico Editore)