CoViD-19 e dati

by

Questa mappa rappresenta la variazione del numero di casi rilevati di CoViD-19 per mille abitanti nelle Provincie dell’Italia fra il 27 e il 28 marzo 2020.

Come l’ho creata? Ho prelevato i dati dal repository GitHub COVID-19 (https://github.com/pcm-dpc/COVID-19) dove vengono caricati ogni giorno gli aggiornamenti. I dati di popolazione sono stati prelevati dal sito web dell’ISTAT e sono aggiornati al 1 gennaio 2020 (https://www.istat.it/it/popolazione-e-famiglie?dati). Lo anche lo shapefile con le geometrie delle provincie è stato prelevato dal sito web dell’ISTAT.

Innanzitutto ho allineato i nomi e i codici delle singole unità geografiche (Provincie), perché pur essendo banche dati gestite da organi tecnici dello Stato, non c’è (mai!!) concordanza nella grafia dei nomi. Questo problema è ricorrente quando si usano diverse banche dati e posso garantirvi che c’è da diventare matti a volte. Ad ogni modo, in questo caso è stato relativamente facile.

A questo punto ho sottratto il numero di casi del 27 marzo da quello dei casi del 28 marzo per ogni provincia, l’ho diviso per il numero di abitanti e moltiplicato per mille. Ho importato la tabella così ottenuta in un progetto GIS creato usando QGIS 3.4 e ho collegato il file delle geometrie (Provincie) con quello dei dati (la tabella) attraverso un normale join. Ho quindi creato una scala di colori classificando le densità di casi / 1000 abitanti in intervalli a cui ho associato dei colori evocativi. Blu variazione negativa (diminuiscono i casi), verde piccolo aumento, rosso aumento più grande. Non esiste una scala colori standard e quindi potrete vedere migliaia di mappe con colori diversi, ma col medesimo significato se i dati sono gli stessi e l’elaborazione è uguale.

La mappa ci dice quali sono le zone in cui l’incremento dei casi è maggiore o minore in relazione alla popolazione. Se avessi mappato solo l’aumento di casi, è ovvio che nelle zone più popolose avremmo numeri più elevati. Questo sarebbe utile per capire quali siano le zone dove bisogna inviare più aiuti, ma non ci direbbe quale probabilità ci sia che un “sano” diventi “caso”.

Difficoltà incontrate:

Ho un dubbio relativo al significato di “totale casi”. Inizialmente pensavo che quel numero rappresentasse il numero totale cumulativo di casi rilevati da inizio periodo di osservazione. In tal caso, il numero deve essere sempre maggiore o uguale a zero. Invece nel calcolo ho scoperto che in Provincia di Savona il valore per il 28 marzo è inferiore a quello per il 27 marzo. Ovviamente questo non è possibile nel caso di un cumulo. Io ho riportato in cartografia il risultato del calcolo e sul file readme del repository il campo “totale casi” viene descritto semplicemente come “Totale casi positivi”. Questa denominazione viene usata per le Regioni allo scopo di indicare il numero cumulato di casi.

Ho notato che ci sono dei piccoli errori territoriali, ad esempio la Provincia di Udine non comprende, nella cartografia, il Comune di Sappada, che pure è entrato a farne parte.

Tag: , , , , , , ,

Una Risposta to “CoViD-19 e dati”

  1. Sconfortante | Bepo Glace Blog Says:

    […] Comunque, per giocare mi sono messo a fare una mappa della variazione del numero di casi dichiarati. La trovate in un post sul mio blog “scientifico” ovvero qui: CoViD-19 e dati. […]

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google photo

Stai commentando usando il tuo account Google. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...


%d blogger hanno fatto clic su Mi Piace per questo: