Ieri sera ho avuto una interessante conversazione con Peter W. Kruger sulla metodologia che uso per stimare l'andamento dell'epidemia. Visto che mi sembra interessante, ma è nascosta nei commenti di questo mio post, la replico qui.

Molti fisici, incluso Peter, cercano di interpretare i dati sanitari del contagio di COVID-19 in Italia utilizzando dei modelli che descrivono l'andamento dell'epidemia nel suo complesso, dall'inizio alla fine, e conseguentemente approssimano il numero dei ricoveri e i decessi con una "regressione logistica" o "curva di Gompertz".

Nelle parole molto chiare di Peter:

il contagio non è mai esponenziale! tende ad una esponenziale nella fase iniziale mai poi entrano in gioco gli effetti saturativi. la probabilità di contagio dipende da tre fattori: il numero di infetti, il numero di potenziali non infetti e la probabilità che un infetto infetti un non infetto. Per questo tutte le epidemie assumono un andamento a logistica generalizzata (non la logistica semplice). Il distanziamento sociale agisce un po' sul primo fattore ma prevalentemente sul secondo fattore, cioè di fatto abbassa la saturazione. [...]

Io sono d'accordo con il modello, ma poiché le deviazioni dall'esponenziale iniziale si apprezzano solo quando la percentuale di suscettibili ("i potenziali non infetti") si discosta in maniera significativa dal 100%, ritengo che non vediamo ancora nessun effetto di saturazione nei dati regionali e meno che mai in quelli italiani.

Anche ammettendo che il dato ufficiale dei "positivi accertati", quasi 30 mila ieri, sia molto sottostimato e che ci siano dieci volte più persone positive al coronavirus, ossia circa 300 mila, si tratta ancora di una percentuale minima della popolazione delle regioni più colpite, qualche decina di milioni. La deviazione da una percentuale di suscettibili del 100% e quindi da una crescita esponenziale, forse si può vedere nei comuni in cui si è diffuso il contagio all'inizio, ma non ancora nel dato regionale.

Da fisico: se ho l'opportunità di approssimare, approssimo.

Per questo io continuo ad modellare i dati sull'evoluzione dell'epidemia "a tratti" con delle semplici curve esponenziali, ossia cambio la descrizione della curva quando osservo delle deviazioni significative. E nella maggior parte dei casi riesco a "spiegare" la discontinuità come l'effetto di misure di contenimento del contagio introdotte qualche tempo prima.

Le misure che dovrebbero aver diminuito il numero di contatti interpersonali, e quindi il famoso "erre zero", sono:

  • 2020-02-24: chiusura delle scuole in Lombardia, Emilia Romagna e Veneto
  • 2020-03-01: parziale blocco delle attività in tutta la Lombardia
  • 2020-03-05: chiusura delle scuole in tutta Italia
  • 2020-03-08: blocco della mobilità in Lombardia
  • 2020-03-10: blocco della mobilità in Italia

La maggior parte delle discontinuità sul numero dei ricoveri sono compatibili con un ritardo di 11 giorni dalla data di entrata in vigore di ciascuna misura di contenimento. Ritardo che è compatibile con quello che sappiamo della malattia dal rapporto del WHO, ossia 5/6 giorni di incubazione e circa una settimana per passare dai primi sintomi alla necessità di ricovero per i pazienti che lo necessitano.

Ad esempio sotto sono riportati il numero di ricoveri in Lombardia con le linee 11 giorni dopo le varie misure:

Numero di ricoveri e approssimazione esponenziale a tratti, ritardo 11 giorni

Le discontinuità sono due, in corrispondenza della chiusura delle scuole e del primo parziale blocco, sempre più 11 giorni. Manca la discontinuità di ieri perché le scuole erano già chiuse.

Nelle Marche invece la prima discontinuità riguarda l'introduzione delle zone rosse, viene saltata la seconda data che non ha effetto, mentre la chiusura delle scuole si è manifestata solo ieri insieme al resto d'Italia.

Numero di ricoveri e approssimazione esponenziale a tratti, ritardo 11 giorni

Non tutte le interpretazioni sono altrettanto facili, e nei dati regionali ci sono discontinuità inspiegate, ma in generale il modello di esponenziale a tratti:

  • ha una motivazione teorica
  • produce stime straordinariamente buone quando non ci sono discontinuità
  • ci da informazioni importanti sull'efficacia delle misure di contenimento proprio grazie alle discontinuità

Ossia, sembra una teoria scientifica decente.

E se è corretta l'effetto del lockdown in tutta Italia del 10 Marzo lo vedremo sui ricoveri il 21 Marzo. E il segno che le misure sono state sufficienti a bloccare l'epidemia sarà il crollo del numero dei nuovi ricoveri.

Per commentare sono qui su Facebook.

Il codice utilizzato è disponibile su GitHub.