La statistica del Contagio

di Irene Rocchetti [1] e Gabriele Sene [2]

Le opinioni e le previsioni presenti in questo articolo sono esclusivamente espressione del pensiero dell’autore, e non rappresentano nè la posizione e nè le previsioni ufficiali della Banca d’Italia.

La diffusione della SARS-CoV-2 (Sindrome Respiratoria Severa Acuta da Corona Virus), o Covid19, è divenuta in poche settimane una pandemia, che ha coinvolto l’Italia, il Paese a oggi più colpito dopo la Cina, e molti altri Paesi europei.

Osservando l’andamento dei casi accertati giornalmente in Italia, si nota che la percentuale di nuovi casi è molto più alta in Italia rispetto al valore atteso sulla base di quanto avvenuto in Cina, nonostante le misure di contenimento adottate.

La differenza nella velocità di contagio tra Italia e Cina può essere spiegata da una parte dal ritardo nell’avvio delle misure di contenimento, dall’altra dal fatto che tali misure non sono state tanto restrittive quanto quelle cinesi, almeno nella fase iniziale della diffusione del virus.

A queste si aggiunge la diversa percezione della pericolosità del contagio registrata a livello regionale e nelle varie fasce di età della popolazione e, pertanto, il diverso livello di rispetto delle norme governative.

Queste motivazioni, insieme alla velocità di trasmissione propria di questo virus, ha portato alla rapida creazione di un bacino di “portatori sani”, classificabili nel sommerso da Covid19.

Molti ricercatori hanno studiato in questi giorni l’andamento della curva epidemica italiana per Covid19, cercando di effettuare previsioni riguardo al picco di contagi possibili e al suo momento di manifestazione, tenendo conto delle misure contenitive e del tempo di manifestazione dell’infezione dal contagio (pari a 5 giorni dall’esordio dei sintomi secondo stime dell’Istituto Superiore di Sanità), nonché delle differenze regionali e del confronto con la curva della Cina.

Rimane tuttavia da considerare il fatto che la previsione rimane circondata da un ampio margine di incertezza, a causa di molti fattori inosservabili, come ad esempio il numero di asintomatici e il diverso rischio di contagio per età e per altre caratteristiche, che influiscono sull’eventuale aumento della probabilità di contrarre e trasmettere il virus, fattori il cui effetto, in ogni caso, andrà sempre più ad affievolirsi con il mantenimento delle misure di contenimento adottate.

Infatti, le misure di lockdown prese dal governo quali le quarantene, la chiusura di scuole, teatri e musei, la predilezione del lavoro agile, servono a far abbassare l’indice noto come R0, che indica il numero medio di individui che possono essere contagiati dal contatto con un individuo affetto, in questo caso da Coronavirus.

Tale indice, calcolato sulla base del modello matematico SIR (Soggetti a rischio, Infetti e Rimossi perché deceduti o guariti), deve scendere al di sotto dell’unità e deve essere mantenuto tale affinché la pandemia si arresti.

Il valore naturale dell’R0 per Covid19 in assenza di misure di contenimento è stato stimato all’inizio della pandemia intorno ai valori 2,5‑2,8 e corrisponde a una diffusione esponenziale del fenomeno, quella che abbiamo visto fino a pochi giorni fa. Attualmente, sulla base dei dati osservati, si stima un R0 moltopiù basso (<1,5), che si sta quindi avvicinando sempre di più all’unità.

In generale la riduzione dell’indice R0porta ad un ritardo del picco endemico nonché a un minore numero di contagi, e di conseguenza di deceduti, di ricoveri in terapia intensiva; complessivamente a una minore gravità del contagio.

La gravità della diffusione del contagio

Un possibile indicatore della “gravità” della diffusione del Coronavirus può considerarsi il tasso di letalità, calcolato come il numero di morti sul totale dei casi accertati ad una certa data: in Italia il 23 marzo era pari a 9% circa, essendo aumentato in sei giorni di circa due punti percentuali, e aveva raggiunto livelli apparentemente più alti della Cina nello stesso periodo di tempo dall’inizio dell’epidemia.

Il Grafico 1 mostra l’andamento del tasso di letalità e del tasso di guarigione (percentuale di guariti sul totale dei casi accertati) per l’Italia: il trend risulta crescente per entrambi ma, nonostante la distanza tra le due curve si riduca con il passare del tempo, il numero di dimessi guariti è ancora maggiore del numero di morti per Covid19.

Grafico 1: Tasso di letalità e tasso di guarigione in Italia dal 24 febbraio al 23 Marzo.

Tasso di letalità e tasso di guarigione in Italia dal 24 febbraio al 23 Marzo.

Uno studio dell’Istituto Superiore di Sanità aggiornato al 22 marzo, evidenzia una letalità più elevata nei soggetti di sesso maschile in tutte le fasce di età. Tra i soggetti deceduti, inoltre, complessivamente è stata segnalata almeno una co-morbidità nel 68,9% dei casi (patologie cardiovascolari, patologie respiratorie, diabete, deficit immunitari, patologie metaboliche, patologie oncologiche, obesità, patologie renali o altre patologie croniche). Ovviamente è difficile allo stato attuale sapere se la co‑morbidità agisca come prima o seconda causa di morte rispetto al Covid19, si dovranno aspettare i risultati dell’indagine sulle cause di morte condotta dall’Istat.

Altri indicatori di gravità calcolabili sono il numero di nuovi decessi sulle terapie intensive, oggi pari al 18% circa e le terapie intensive sui ricoveri, oggi pari al 15% circa, in diminuzione dal 24 febbraio. Tali indici possono essere letti nella loro dinamicità, anche come proxy del livello di risposta organizzativa del Paese alla diffusione improvvisa dell’epidemia. Infatti l’organizzazione governativa è impegnata in questa fase ad intervenire prima che la malattia sia già ad uno stadio avanzato, ovvero all’esordio dei primi sintomi, non essendoci ancora vaccini né farmaci disponibili che permettono la guarigione dal Covid19 nel 100% dei casi.

Nella misurazione della gravità della diffusione del Covid19 e, pertanto, della letalità nonché della percentuale di ospedalizzazioni e di pazienti in terapia intensiva in Italia, in particolare nelle singole regioni, un aspetto importante da considerare è, come accennato in precedenza, il sommerso.

Nello specifico, molti individui hanno contratto il virus ma ne sono inconsapevoli perché asintomatici o perché non hanno ancora ricevuto il risultato del tampone (i tempi dei risultati dei tamponi variano da una regione all’altra). Qualora si tenesse conto di tutti gli individui affetti realmente da Covid19 il numero di casi aumenterebbe e diminuirebbe di conseguenza il tasso di letalità, nonché il tasso di ospedalizzazione e di pazienti in terapia intensiva, i nostri indici risulterebbero probabilmente più vicini a quelli cinesi.

Il modo più comunemente utilizzato nella letteratura internazionale per la stima del numero di individui non osservati, perché appartenenti a popolazioni elusive, cioè che sfuggono al controllo e alla registrazione (ad esempio tossicodipendenti, persone vittime di abuso che non effettuano denunce o appunto persone con Covid19 asintomatiche, etc..) è quello che afferisce alle tecniche cosiddette Cattura-Ricattura.

Tali metodi permettono di stimare, sulla base di distribuzioni sul numero di individui affetti da Covid19 e registrati esattamente un certo numero di volte, la quantità di individui non diagnosticati per i possibili motivi sopra esposti. La disponibilità di dati individuali tuttavia non è così tempestiva ed è pertanto possibile allo stato attuale fare solodei ragionamenti e delle ipotesi su larga scala.

Secondo uno studio pubblicato pochi giorni fa sulla rivista Science, condotto da ricercatori dell’Imperial College di Londra, sulla base dei dati cinesi relativi ai mesi di dicembre e gennaio, quando ancora in Cina non erano state implementate misure di controllo, per ogni caso confermato di Coronavirus era molto plausibile l’esistenza di altri 5-10 casi non individuati.

Ciò significherebbe che ad oggi in Italia si avrebbe un numero di casi positivi non registrati pari almeno a 300.000 unità.

Applicando il tasso di infezione, calcolato come il numero di casi accertati sul totale dei tamponi effettuati, pari a oggi al 23% circa, al totale della popolazione italiana, sarebbe inoltre possibile approssimare il numero massimo di individui che potrebbero essere portatori sani di Covid19 (individui asintomatici). Ciò significherebbe che, se tutti avessero la stessa probabilità di contrarre il virus, potrebbe esserci in Italia un numero di contagi elusivi molto maggiore di quello indicato dallo studio inglese. Tale calcolo tuttavia avrebbe senso qualora i tamponi venissero fatti non solo sulla popolazione esposta al rischio di contrarre l’infezione (individui in contatto con soggetti positivi o soggetti con sintomi) ma su una fetta più ampia della stessa. Bisognerebbe inoltre stratificare almeno a livello regionale e per genere ed età, per poter avere una stima del sommerso per Covid19 significativa: sono tanti infatti i fattori latenti che possono influire sulla probabilità di contagio a partire dai diversi tempi di attuazione delle misure di contenimento da parte delle regioni italiane e dalla diversa composizione delle relative sottopopolazioni regionali.

Conoscendo il numero esatto di contagiati o avendo una stima di essi si potrebbe poi fornire un valore verosimile del tasso di letalità,  ad oggi sovrastimato a causa della mancata rilevazione del numero “reale” di contagiati totali.

Previsioni a medio-lungo termine

E’ un principio generale che la crescita di una popolazione possa seguire un andamento esponenziale quando le risorse, necessarie alla riproduzione degli individui che la compongono,  siano illimitate.  In tal caso il numero di componenti della popolazione segue una traiettoria “esplosiva”, ogni giorno il numero di nuovi individui sarà superiore a quello del giorno precedente, e si osserverà un forte aumento numerico della popolazione in breve tempo. Lo stesso tipo di ragionamento vale nel caso in cui gli individui in considerazione siano dei virus,  che cercano di moltiplicarsi, avviando una epidemia.

Tuttavia, nel caso di un’epidemia in un Paese avanzato come l’Italia, sarebbe lecito ipotizzare che le Autorità, sulla scorta di quanto avvenuto in Cina, dove lo stesso evento si era verificato un mese prima, mettano in atto misure di contenimento simili ai provvedimenti emanati dal governo cinese per contrastare la diffusione del virus, limitando di conseguenza le risorse a sua disposizione per moltiplicarsi.

In un contesto di risorse limitate la crescita di una popolazione è ben descritta da una curva logistica (modello di Verhulst). L’utilizzo di questa funzione per studiare il contagio da Coronavirus tiene implicitamente conto del fatto che le misure di contenimento riducono le risorse a disposizione del virus, e può inoltre fornire indicazioni, soggette ai margini di incertezza propri di una stima complessa, sul periodo in cui si verificherà un rallentamento dei contagi.

Infatti la logistica (o curva sigmoidale) “prevede” sia che si raggiunga un giorno a partire dal quale i nuovi contagi saranno meno di quelli del giorno precedente, sia l’esistenza di un limite massimo al quale tenderà il totale dei contagi. La crescita in tale modello non è “esplosiva”.

Anche in questo caso alcune particolarità a livello regionale, come ad esempio il giorno in cui si è registrato il primo contagio e alcune variabili socio-demografiche, andrebbero prese in considerazione nella stima di modelli “locali”.

Nel Grafico 2 si riporta l’andamento del numero di contagi totali da Covid19 per l’Italia e per la regione di Hubei in Cina: per quest’ultima, che si trova in una fase molto più avanzata dell’epidemia, è evidente l’andamento “a S” caratteristico della curva logistica.

Il Grafico 3 presenta le previsioni sulla possibile evoluzione del numero di contagiati in Italia ottenute stimando due specificazioni del modello logistico, sulla base dei dati disponibili al 22 marzo: secondo le stime, nei prossimi giorni si osserverebbe un rallentamento del numero dei contagi totali, più marcato nella prima settimana di aprile, e si dovrebbero registrare meno di 1.000 nuovi contagi al giorno a partire dalla seconda del mese prossimo. La principale differenza tra le due previsioni riguarda il numero totale dei contagi alla fine dell’epidemia, tra i 180.000 e i 200.000, a seconda del modello scelto.

Grafico 2: Curva epidemica nella regione di Hubei e in Italia
Fonte: Lab24 ilSole24ore
Grafico 3: Curva epidemica in Italia e previsioni
Fonte: elaborazioni su dati del Dip. della Protezione Civile

Le previsioni effettuate, come accennato in precedenza, lasciano comunque dei margini di errore legati sia all’impossibilità di tenere sotto controllo tutti i parametri che possono intervenire, sia alla presenza di fattori latenti (quale ad esempio il sommerso), nonché all’imprevedibilità legata alle misure che potrebbero ancora essere prese a livello governativo e all’eventuale auspicabile scoperta e introduzione di farmaci e/o vaccini che possano facilitare ancora di più la discesa dell’R0.


[1] Consiglio Superiore della Magistratura, Ufficio statistico; i.rocchetti@cosmag.it.

[2] Banca d‘Italia, Dipartimento Circolazione monetaria e pagamenti al dettaglio, Divisione Analisi della circolazione; gabriele.sene@bancaditalia.it.