Sicurezza stradale, la prevenzione passa per i big data

Report incidenti stradali in Italia – analisi 30 milioni di dati Istat

Tra i numerosi campi di applicazione dei big data uno dei più interessanti può essere individuato nella sicurezza stradale.

Sulle autovetture è infatti particolarmente agevole installare sensori che possano fornire informazioni in caso di incidenti stradali. L’utilità di questi strumenti è talmente riconosciuta dalle compagnie di assicurazioni che già da alcuni anni vengono praticati degli sconti agli automobilisti che decidono di installare la scatola nera, ovvero un’apparecchiatura in grado di registrare alcune informazioni sul veicolo, come posizione, velocità e altri parametri.

Con il tempo questi strumenti diverranno sempre più sofisticati e permetteranno di registrare sempre più informazioni, come le condizioni atmosferiche oppure specifici parametri delle vetture, come la pressione delle gomme o lo stato di usura dei freni.

Una volta raccolte tutte queste informazioni provenienti da milioni di autovetture circolanti in Italia, se non anche dai miliardi di mezzi circolanti in tutto il mondo, i dati ottenuti potrebbero essere utilizzati al fine di migliorare la sicurezza stradale.

Ad esempio, essere avvisati dalla propria autovettura che una serie di condizioni, in un dato momento, aumentano notevolmente il rischio di incidente potrebbe indurre il guidatore a usare maggiore prudenza alla guida, se non addirittura a rimandare il viaggio e intraprenderlo quando quei fattori di rischio si saranno ridotti.

incidente tra autoAl fine di offrire alcuni possibili spunti di riflessione sull’argomento abbiamo condotto un’analisi volta a individuare quali condizioni (per esempio ora, giorno, tipo di strada, meteo) siano presenti con maggior frequenza nel caso in cui un incidente stradale avvenuto in Italia abbia determinato la morte di almeno un soggetto coinvolto nel sinistro.

Tale analisi offre delle considerazioni utili anche per adottare quegli accorgimenti necessari al raggiungimento dell’obiettivo europeo per il 2020, ovvero il dimezzamento del numero di vittime registrate nel 2010, che stante le stime preliminari dell’Istat sul primo semestre del 2016 è ancora distante dall’essere raggiunto (i decessi sono stati 1.466, circa 160 in più rispetto all’obiettivo del periodo).

Un modello di analisi della mortalità su strada in Italia

L’analisi è stata condotta utilizzando la rilevazione degli incidenti stradali con lesioni a persone condotta dall’Istat relativamente agli anni compresi tra il 2010 e il 2013.

Tale indagine raccoglie una serie di informazioni relative a tutti gli incidenti stradali in cui sia stato coinvolto un veicolo in circolazione sulla rete e che abbia comportato danni alle persone .

I dati sono raccolti dall’Istat sulla base di questionari compilati da Polizia Stradale, Carabinieri, Polizia locale, provinciale o da altre autorità intervenute sul luogo.

Il set di informazioni raccoglie, nei quattro anni considerati, oltre 220 mila sinistri e per ogni evento sono disponibili oltre 120 specifiche, come l’individuazione del luogo dell’incidente, il giorno della settimana, il mese, età e sesso dei soggetti coinvolti, ecc.

Nel complesso il database che abbiamo costruito è composto da oltre 30 milioni di dati, una mole di informazioni che per essere gestita correttamente richiede l’applicazione di metodi applicati nel contesto dei big data.

Dato lo scopo dell’analisi abbiamo studiato i fattori che incidono su quegli incidenti in cui ci sia stato almeno un decesso entro 30 giorni dal sinistro. Nel complesso l’1,4% dei sinistri più gravi ha visto la presenza di almeno un morto.

L’analisi è stata condotta utilizzando diversi metodi di stima tipicamente utilizzati nel campo dei big data.

Nello specifico è stato considerato il Generalized Linear Model (GLM), il Gradient Boosted Machine (GBM), il Random Forest Model e i modelli a rete neurale (o deep learning machine). L’approccio che è risultato avere l’errore di stima più contenuto è il GBM . Il GLM, comunque, ha evidenziato un grado di accuratezza solo leggermente peggiore rispetto al GBM e, data la maggior facilità di interpretazione dei risultati, nel resto dell’analisi faremo riferimento alle evidenze ottenute con questo modello di stima.

Fattori che incidono sulla mortalità stradale

Nel grafico 1 sono riportati i coefficienti  stimati in corrispondenza con le 5 province in cui si è rilevata una maggiore probabilità che incidenti gravi determino la morte di uno dei soggetti coinvolti (valore positivo del coefficiente, istogramma rosso nel grafico), e le 5 province in cui invece il rischio di morte in caso di incidente è più basso (valore negativo del coefficiente, istogramma verde nel grafico).

Si rileva come le province di Caserta, Crotone, Rovigo, Foggia e Cosenza siano quelle a più alto rischio, mentre Milano, Genova, Roma, Monza e Firenze mostrino una minore rischiosità.

È interessante notare come il fattore territoriale sembri indicare una maggior incidenza della mortalità nelle province del Mezzogiorno d’Italia. Probabilmente il diverso stato di manutenzione delle strade potrebbe essere un fattore alla base di questo risultato.

Un indizio in questo stesso verso ci viene fornito dall’indicazione sull’impatto della localizzazione dell’incidente (grafico 2). Si riscontra infatti una maggiore mortalità per gli incidenti effettuati su strade statali e provinciali, ossia quelle strade che possono soffrire maggiormente della carenza di risorse necessarie per effettuare investimenti sulla manutenzione e sicurezza delle strade.

Più sicure invece risultano essere le strade situate nei centri abitati e le autostrade.

Grafico 1. Impatto sulla probabilità che in un incidente stradale ci sia almeno un decesso
Classificazione in base alla provincia in cui si è verificato il sinistro

Classificazione incidenti per provincia

Fonte: stime BEM Research su dati Istat.

Grafico 2. Impatto sulla probabilità che in un incidente stradale ci sia almeno un decesso
Classificazione in base alla localizzazione del sinistro

Classificazione incidenti per tipo di strada

Fonte: stime BEM Research su dati Istat.

Guardando al mese dell’anno, si rileva che dicembre e agosto, i mesi contraddistinti da un maggiore traffico di vacanzieri, siano i più rischiosi, mentre più basso è il rischio a maggio e a marzo (grafico 3).

Relativamente al giorno della settimana, il weekend risulta essere chiaramente il periodo con una più alta incidenza di sinistri mortali, mentre più sicuro appare il lunedì (grafico 4).

Le ore che vanno dalle 21 fino alle 6 del mattino sono quelle più rischiose, con un picco in corrispondenza delle ore 5 (grafico 5). Più bassa invece la rischiosità di incappare in un incidente mortale alle ore 8.

Il tratto di strada più rischioso risultano essere le curve, seguite dai rettilinei e dalle gallerie, sia illuminate che non (grafico 6). Quest’ultimo risultato induce a pensare che gli automobilisti possano tendere ad un eccesso di confidenza in alcuni contesti. In linea con questa interpretazione appaiono i risultati con riferimento alle condizioni meteo e allo stato del fondo stradale: la mortalità risulta infatti più alta quando il meteo non è avverso e il manto stradale è asciutto.

Grafico 3. Impatto sulla probabilità che in un incidente stradale ci sia almeno un decesso
Classificazione in base al mese del sinistro

classificazione incidenti per mese

Fonte: stime BEM Research su dati Istat.

Grafico 4. Impatto sulla probabilità che in un incidente stradale ci sia almeno un decesso
Classificazione in base al giorno della settimana del sinistro

incidenti stradali in base al giorno

Fonte: stime BEM Research su dati Istat.

Stessa indicazione può essere tratta dall’analisi degli effetti in base al sesso e all’età del conducente. Nel caso in cui i veicoli coinvolti nell’incidente, e in particolare quello principale, siano condotti da una donna nel sinistro si osserva una minore mortalità.

Stesso risultato nel caso in cui il conducente di uno dei veicoli abbia un’età inferiore ai 30 anni. In definitiva, quando nell’incidente di grave portata è coinvolto un adulto di sesso maschile è più probabile che possano esserci anche dei decessi.

Grafico 5. Impatto sulla probabilità che in un incidente stradale ci sia almeno un decesso
Classificazione in base all’ora del sinistro

Classificazione incidenti stradali in base all'ora

Fonte: stime BEM Research su dati Istat.

Grafico 6. Impatto sulla probabilità che in un incidente stradale ci sia almeno un decesso
Classificazione in base al tipo di strada dove è avvenuto il sinistro

tipologia di strada

Fonte: stime BEM Research su dati Istat.

La tendenza ad avere un eccesso di confidenza alla guida del proprio mezzo emerge anche dall’effetto della presenza nel sinistro di un veicolo di recente immatricolazione (dal 2012 in poi): in tal caso risulta esserci una maggior probabilità di decesso al verificarsi dell’incidente.

Infine, risultano avere un impatto positivo sulla probabilità di morte a fronte di un sinistro stradale la presenza di un veicolo a due ruote o di un autocarro.

Indicazioni di policy

Sulla base dell’analisi effettuata possono trarsi alcune indicazioni per il policy maker. Per ridurre la mortalità stradale sarebbe opportuno agire su tre piani.

Un primo livello dovrebbe essere quello di intervenire sulle infrastrutture, concentrando le risorse sulle strade statali e su quelle provinciali delle aree del paese in cui si riscontra una maggiore rischiosità.

Gli investimenti dovrebbero interessare soprattutto i tratti stradali in cui siano presenti curve pericolose o tratti di rettilineo a doppio senso di marcia su cui si possano verificare scontri frontali tra automezzi.

Un secondo piano di interventi dovrebbe riguardare l’intensificazione dei controlli da parte delle autorità. In particolare gli sforzi andrebbero concentrati soprattutto durante il fine settimana, nelle ore notturne e nei mesi in cui si osservano i maggiori spostamenti per le vacanze.

Il terzo livello di interventi dovrebbe riguardare un piano di sensibilizzazione degli automobilisti. Renderli quindi maggiormente consapevoli del fatto che la mortalità su strada è più alta quando c’è un eccesso di fiducia nella capacità di governare il proprio mezzo, che può indurre il conducente a mantenere una velocità troppo elevata, azzardare sorpassi spericolati o utilizzare lo smartphone durante la guida.

Tale campagna dovrebbe interessare soprattutto i guidatori adulti di sesso maschile, ma ovviamente sarebbe utile verso tutte le categorie di automobilisti.

Questa tipologia di interventi potrebbe portare maggiori risultati rispetto all’intensificazione delle pene introdotta con la legge sull’omicidio stradale.

Se gli incidenti mortali avvengono soprattutto in momenti di “spensieratezza” del guidatore anche il pensiero di subire gravi conseguenze penali, fino al carcere, potrebbe non essere un efficace deterrente.

Infine, un aiuto alla risoluzione del problema potrebbe essere offerto dalla tecnologia a bordo delle autovetture. Se nelle vetture più recenti è presente un segnale che avvisa il guidatore quando non sono state indossate le cinture di sicurezza, qualcosa di simile dovrebbe essere attuato nel caso in cui si presentino potenziali condizioni di rischio. Il dispositivo navigatore potrebbe riconoscere i tratti stradali più rischiosi e “agire” di conseguenza emettendo, ad esempio, un avviso.

Note

Sono esclusi dalla rilevazione i sinistri da cui non sono derivate lesioni alle persone e quelli che non si sono verificati nelle aree pubbliche di circolazione.

Il database è stato suddiviso in tre blocchi estraendo in modo casuale il 60% delle osservazioni per il set di informazioni utilizzate per la stima del modello, il 20% per la sua validazione e il restante 20% per la fase di test. Nel test è risultato che su 44.418 sinistri quelli mispecificati, ovvero considerati come mortali quando invece non ci sono stati decessi (errore di tipo I) o, viceversa, stimati come privi di decessi quando effettivamente si sono verificati (errore di tipo II), sono stati 1.427 per il GBM, corrispondente ad un tasso di errore del 3,2%. Il modello a reti neurale ha prodotto invece 1.455 errori (3,3%), il GLM 1.556 (3,5%) e il modello Random Forest 2.416 (5,4%).

I coefficienti riportati nei grafici della presente nota sono standardizzati al fine di permettere il confronto tra i diversi fattori considerati.

Rassegna stampa

Di seguito alcune testate giornalistiche che hanno pubblicato l’analisi:

  • Il Sole 24 Ore – Sicurezza stradale, il guadagno è assicurato (se serve, per la manovra correttiva)
  • La Stampa – Autostrade sicure, statali pericolose. A mezzogiorno meno rischi al volante
  • Libero Quotidiano – Incidenti d’auto, le strade e le ore più pericolose per guidare
  • Il Secolo XIX – Incidenti: autostrade sicure, statali pericolose. A mezzogiorno meno rischi

Servizi correlati