Riassunto prima della fase 2: i dati italiani spiegati semplicemente

Lunedì cambieranno le misure di restrizione dei movimenti e questo sembra il momento migliore per fare il punto su cosa ci hanno detto i dati ufficiali finora e cosa ci interessa monitorare nel prossimo futuro, con il solito terrificante ritardo, per capire come si modificherà la dinamica del contagio.

Dal punto di vista dei dati ufficiali sull'epidemia di COVID-19 in Italia nelle ultime settimane non è successo granché, in parte a causa della lentezza con cui calano i numeri giornalieri e in parte a causa dei ritardi dell'ISTAT nel pubblicare i dati disaggregati che saprebbero dare maggiori informazioni.

Il grafico in scala semi-logaritmica dei tre parametri principali distribuiti dalla Protezione Civile una volta raggiunto il picco a fine Marzo è diventato sempre meno informativo.

Tutti i numero scendono, ma terribilmente lentamente.

L'unico aggiornamento interessante è aggiungere il dato parziale sulle morti per tutte le cause distribuito dall'ISTAT a metà aprile, che però contiene dati affidabili solo fino al 28 Marzo e ha una serie di caveat descritti in un articolo precedente.

In figura ho aggiunto il numero di decessi giornalieri per tutte le cause in surplus rispetto alla media dal 1 Gennaio al 20 Febbraio 2020. Il dato non può essere confrontato direttamente con quello della Protezione Civile perché da una parte è parziale, ossia mancano i dati di numerosi comuni che non partecipano alla raccolta dati dell'ISTAT e dall'altra contiene le morti per tutte le cause e quindi anche decessi avvenuti a causa dell'emergenza sanitaria, ma non riconducibili direttamente alla malattia. Un gruppo di fisici ha proposto un metodo particolarmente brillante per correggere i dati e separare i due effetti sfruttando l'asimmetria nella mortalità tra uomini e donne.

Nel seguito quindi dei dati ISTAT è interessante la forma, ma non l'altezza relativa ai dati della Protezione Civile.

Il grafico che, a mio parere, comunica meglio l'andamento dell'epidemia a valle del picco è quello in scala lineare con i dati sanitari divisi per un numero che serve a posizionarli nella stessa zone del grafico. I numeri che uso, 35 per i ricoveri e 6 per le terapie intensive, sono abbastanza arbitrari e li ho scelti in modo che la fase di crescita esponenziale sia più o meno sovrapposta per le tre curve della Protezione Civile.

E considerando che i decessi giornalieri hanno fluttuazioni piuttosto forti nei grafici che intendo usare nei futuri aggiornamenti userò la media mobile di 7 giorni.

Ribadisco che il surplus di decessi rilevati dall'ISTAT, la linea verde a puntini, non è immediatamente confrontabile con i decessi per COVID-19 riportati dalla Protezione Civile, linea verde continua, da una parte perché il dato ISTAT include anche decessi per altre cause, e dall'altra perché mancano i dati di molti comuni. L'ISTAT ha promesso di rilasciare un dataset più completo domani.

In estrema sintesi leggiamo il grafico sopra.

I dati sanitari ci dicono che l'epidemia finora ha avuto tre fasi:

  • la fase iniziale in cui il virus è stato libero di circolare tra la popolazione senza praticamente nessun contenimento e i contagi sono cresciuti esponenzialmente raddoppiando ogni 2 o 3 giorni. Fino al lockdown dell'intera Lombardia dell'8 Marzo l'istituzione delle varie zone rosse era stato sistematicamente troppo poco e soprattutto troppo tardi.
  • l'istituzione del lockdown nel nord Italia, insieme alla comprensione del rischio da parte della popolazione, ha bloccato la diffusione del virus tramite contatti sociali nelle aree più colpite e l'estensione a tutta Italia ha permesso di evitare l'esplosione di altri focolai incontrollati. In questa fase tutti i dati sanitari raggiungono un picco molto largo tra il 22 Marzo e i primi giorni di Aprile. Come previsto, il picco arriva con due/tre settimane di ritardo rispetto all'adozione delle misure di contenimento perché questi sono i tempi della malattia: circa 5 giorni di incubazione, più circa 5 giorni prima della manifestazione dei sintomi gravi che portano al ricovero, più circa 5 giorni tra il ricovero e il decesso. In questa fase come nella precedente i dati della Protezione Civile sembrano sottostimare sistematicamente la mortalità legata all'epidemia e forse contendono anche dei ritardi nella registrazione. Il picco nel numero di decessi giornalieri è probabilmente significativamente più alto di quanto appare.
  • nonostante il lockdown la diminuzione di tutte le curve dei dati sanitari e soprattutto il numero di decessi giornalieri è diminuito molto, molto lentamente e questo ha colto un po' tutti di sorpresa finché non ci si è resi conto che il virus stava continuando a sfruttare i canali secondari di infezione in ambienti chiusi. Da una parte la strategia dell'isolamento domiciliare per le persone con sintomi non gravi ha lasciato aperto il canale di contagio familiare. Dall'altra strutture sanitarie come RSA e ospedali hanno continuato ad esporre al virus proprio i segmenti di popolazione più a rischio. Questo degli ambienti chiusi e affollati è stato un problema in tutto il mondo e altri focolai sono stati strutture religiose e carceri. È probabile che passata l'emergenza ospedaliera i dati della Protezione Civile rispecchino meglio la realtà, ma lo sapremo con certezza solo tra qualche settimana quando l'ISTAT pubblicherà i dati consolidati.

E da domani inizierà una nuova fase.

Prevedere cosa succederà è impossibile perché praticamente non ci sono, e non si prevede di acquisire, dati utili a capire quali siano i canali attivi per la diffusione del virus. Il lockdown interrompe moltissimi canali sociali come lavoro, mezzi pubblici, gli amici, palestre e sport, mangiare fuori, eventi di aggregazione di massa, etc, ma non sappiamo quali siano nella realtà i canali che permettono all'epidemia di diffondersi tra un ambiente chiuso e l'altro.

Da domani si apriranno ufficialmente alcuni canali di possibile contagio per chi torna a lavoro: le relazioni lavorative, il transito sui trasporti pubblici e la necessità di mangiare almeno un pasto fuori da casa. Inoltre i contatti con i "congiunti", anche se non diventasse l'escamotage per il "liberi tutti", attiverebbe un secondo canale di possibile contagio tra famiglie conviventi. Ovviamente tutti i canali sociali saranno comunque meno attivi che a Febbraio perché ci sarà un certo livello di attenzione.

Il rischio naturalmente è una ripresa della crescita esponenziale dei contagi e soprattutto l'accorgercene tardi a causa delle famose due settimane di ritardo nella manifestazione degli effetti gravi della malattia e del fatto che tutt'ora abbiamo un livello alto di contagio in ambienti chiusi che rischia di mascherare l'accendersi di nuovi focolai.

Anche io nel mio piccolo tornerò a monitorare con più attenzione i dati cercando di cogliere gli eventuali segnali, ma è un vero peccato che molti dati siano raccolti in maniera da non essere utilizzabili per identificare condizioni di allarme.

Alcuni dati utili sarebbero facili da raccogliere. Ad esempio:

  1. numero di tamponi eseguiti su sospetti casi COVID-19 e percentuale dei positivi (al momento servono almeno tre tamponi per malato, uno solo viene eseguito quando il caso è sospetto, mentre almeno due per stabilirne la guarigione, falsando le statistiche che usano il numero di tamponi)
  2. numero di tamponi eseguiti su sospetti casi COVID-19 e percentuale dei positivi di soggetti non riconducibili a ambienti o attività a rischio (ospedali, RSA, personale che esegue interventi domiciliari, medici di famiglia, etc)
  3. il numero di "ingressi" in ospedale, non solo la variazione del numero di ospedalizzati (alcuni pazienti sono guariti, altri sono passati in terapia intensiva e altri sono deceduti)

Molti altri dati sarebbero utili per stabilire quali attività sono ad alto rischio nella vita reale e quali invece sono a rischio basso o trascurabile in modo da poter tornare più vicini alla normalità.

Ma certo bisogna affrontare l'emergenza con lo spirito di voler trovare soluzioni. Non con l'idea di fare il proprio burocratico mestiere.


Se hai trovato interessante questo articolo ti consiglio: Cosa ci dicono i dati ISTAT in più rispetto a quelli della Protezione Civile?

Per chi volesse rispondo ai commenti su Facebook qui. Chi fosse interessato ai prossimi aggiornamenti può seguirmi su Facebook.

Area per i data nerd

I dati non sono banalissimi da trattare e ho fatto una serie di assunzioni, per chi fosse interessato ai dettagli tutto il codice e i notebook riguardo al COVID-19 sono disponibili su GitHub.