Cosa ci dicono i dati ISTAT in più rispetto a quelli della Protezione Civile?

A partire da Aprile l'ISTAT ha iniziato a pubblicare con cadenza settimanale i dati di "mortalità per tutte le cause" suddivisi per comune e classe di età, che permettono di capire molto meglio l'evoluzione dell'epidemia di COVID-19.

I dati sono davvero molto interessanti, ma presentano dei caveat:

  • non sono proprio "freschissimi", visto che hanno quasi tre settimane di ritardo,
  • e non sono proprio "completi", poiché includono solo circa 1700 degli oltre 8000 comuni italiani, in compenso sono presenti una buona parte dei comuni più colpiti in Lombardia, Emilia Romagna e Piemonte,
  • [come mi è stato fatto notare nei commenti su Facebook] hanno un errore sistematico dovuto al metodo di selezione dei comuni di cui andrebbe tenuto conto. Dovrò fare un articolo per spiegare che l'effetto è piccolo e non inficia l'analisi qualitativa fatta sotto.

I morti per COVID-19 per classi d'età

Iniziamo con l'analizzare il numero di decessi per tutte le cause divisi per fasce d'età registrati nei 1689 che stanno partecipando alla raccolta.

Fino alla fine di febbraio vediamo quella che è la normalità della mortalità in Italia. La fascia di età che registra più decessi è quella tra 80 e 89 anni, con circa 250 al giorno, in quanto più popolosa di quella degli ultra 90enni (poco meno di 200 decessi). Segue la fascia 70-79 con un po' più di 100 decessi al giorni e come è naturale la mortalità delle fasce di popolazione sotto ai 69 anni sono molto più basse. Le curve per gli anni dal 2015 al 2019 sono piuttosto simili, ma in genere un po' più alte probabilmente perché l'influenza stagionale quest'anno sembra essere stata particolarmente lieve.

Tutto cambia a Marzo di questo tormentato 2020 quando la mortalità si impenna e sembra indicare un surplus rispetto alla normalità di almeno 20.000 morti.

Noto qui che l'ultimo aggiornamento del dataset dell'ISTAT ha dati fino al 4 Aprile in teoria, ma storicamente i dati dell'ultima settimana sono parziali e le curve non affidabili. In tutti i grafici indico in grigio l'area con dati incompleti, quindi in particolare la discesa molto rapida nell'area grigia è un artefatto.

Al fine di diminuire l'effetto a zig-zag che rende i grafici più confusi da qui in poi mostrerò sempre delle medie mobili su 5 giorni, che rendono le curve più dolci. La figura sotto mostra gli stessi dati della figura sopra, ma alcune caratteristiche saltano molto più all'occhio.

La cosa più importante è che i dati ISTAT dicono in maniera molto chiara che in quasi tutte le fasce di età il picco dei decessi è avvenuto intorno al 20-22 Marzo, e quindi circa due settimane dopo al blocco della Lombardia del 8 Marzo che è il ritardo compatibile con l'evoluzione del COVID-19.

Molte altre informazioni si può dedurre dalla "forma" dei picchi, ma per poterle vedere dobbiamo eseguire una piccola elaborazione.

Nella figura sotto mostro le stesse curve della figura sopra dopo averle divise per il valore medio di gennaio e febbraio. In questa maniere ottengo un indice dei decessi che oscilla intorno a 1 nella condizione normale e indica di quanto il numero di decessi è superiore alla "norma". Quando la curva raggiunge 2 significa che ci sono il doppio di decessi rispetto alla norma per quella classe di età e così via.

La cosa che salta all'occhio è che la fascia di età per la quale il COVID-19 ha portato a una anomalia maggiore è quella dei 70enni.

Il numero di decessi della classe di età 70-79 è stato fino a tre volte superiore al livello normale e il surplus di morti nel solo Marzo 2020 a di circa 4.800. Il picco sale molto rapidamente e sembra ridiscendere altrettanto rapidamente (ma rimane sempre il dubbio della completezza dei dati ISTAT, col prossimo aggiornamento dovremmo avere certezza).

Il fatto che i settantenni abbiano subito un assalto iniziale più feroce rispetto a quello subito dalle fasce di eta più anziane, e dunque più deboli fisicamente, può sembrare sorprendente, ma si spiega facilmente con la maggiore autonomia e attività sociale dei settantenni rispetto agli ottanta-novantenni. Questo ha portato le persone in questa fascia d'età ad essere esposte più spesso e con più continuità al virus che stava circolando a livello sociale.

Anche al discesa piuttosto ripida sposa bene con l'ipotesi di una brusca diminuzione dei contatti sociali seguita al lockdown e la martellante comunicazione sui rischi del contagio per le persone anziane.

Le due classi di età intermedie, 50-59 e 60-69, anche mostrano un picco pronunciato suggestivo che gli effetti del lockdown si siano fatti sentire già a fine Marzo.

Nella fascia 50-59 durante il picco piuttosto stretto, si registrano fino al doppio dei decessi giornalieri e circa 450 morti in più della norma in tutto Marzo.

Il numero di decessi per i 60-69 invece è stato due volte e mezzo il livello normale per oltre una settimana portando a un surplus di morti a Marzo a circa 1.400.

Le curve sembrano spostate rispetto a quella dei 70enni e questo lo interpreto come un decorso della malattia più lungo per persone che sono state contagiate nelle stesse condizioni e durante gli stessi tempi dei 70enni.

Ora probabilmente vi state chiedendo: "Ma se il lockdown ha funzionato così bene, da dove arriva il plateau dei decessi che continua fino a oltre metà Aprile?"

Le fasce di età 80-89 e 90+ sono quelle più colpite in termini assoluti, con 8.500, 4.300 decessi in più a Marzo e probabilmente molti di più ad Aprile. Perché entrambe le curve presentano due caratteristiche anomale, partono in ritardo rispetto a quella dei 70enni e soprattutto non mostrano di calare significativamente.

La mia interpretazione è che un buona parte degli 80enni e il grosso dei 90enni non sono stati contagiati duranti le interazioni sociali, ma come contagi indiretti all'interno delle strutture chiuse in cui i contatti non sono stati tagliati dal lockdown, le famiglie da una parte, ma soprattutto le Residenze Sanitarie Assistenziali (RSA) e gli ospedali. In particolare per la fascia 90+ sembra avere una salita molto ritardata, che sembra indicare contagi indiretti, un plateau vero e proprio.

Tutte ipotesi che gli osservatori informati fanno da tempo, ma che ora sono appoggiate dai dati.

Infine passiamo ai "giovani".

Uno dei leitmotiv della comunicazione ufficiale è che la mortalità del COVID-19 è concentrata nella fasce più anziane della popolazione, e in effetti i dati ISTAT lo confermano, ma anche nella fascia 0-49 si registrano fino al 30% in più di decessi giornalieri, che corrispondono a circa 100 morti in più della media, che non sono proprio a nessuno.

Naturalmente ci sono ancora moltissimi dettagli che si possono analizzare sull'andamento nelle varie regioni, province o addirittura a livello di singolo comune.

Tanto per dare un assaggio di cosa si può vedere nelle zone più colpite quelli che seguono sono i dati della provincia di Bergamo, dove il numero di decessi per i 70enni e per gli 80enni ha raggiunto picchi di 12 e 10 volte più del normale, ma anche la mortalità tra i giovani 0-49 è stata 4 volte superiore alla media.

E l'indice dei decessi.

È importante capire che la provincia di Bergamo non ha avuto niente di speciale se non essere stata quella in cui il virus ha avuto modo di seguire la sua diffusione naturale per più tempo.

Un paio di settimane più che altrove.


Se hai trovato interessante questo articolo ti consiglio anche: Ha ancora senso guardare i dati della Lombardia e quindi quelli nazionali?

Per chi volesse rispondo ai commenti su Facebook qui. Chi fosse interessato ai prossimi aggiornamenti può seguirmi su Facebook.

Area per i data nerd

I dati non sono banalissimi da trattare e ho fatto una serie di assunzioni, per chi fosse interessato ai dettagli tutto il codice e i notebook riguardo al COVID-19 sono disponibili su Github.