Multifaktorová analýza dopravní nehodovosti

Článek vyšel v Silničním obzoru 6/2015.

Abstrakt:
Článek představuje multifaktorovou analýzu dopravní nehodovosti. Jedná se o soubor statistických postupů, které umožňují identifikovat rizikové faktory působící na pozemních komunikacích, kvantifikovat jejich vliv nebo určit kritické hodnoty. Po stručném teoretickém úvodu se článek soustřeďuje především na praktickou aplikaci, tvořenou dvěma příklady multifaktorové analýzy: na stykových křižovatkách a na mezikřižovatkových úsecích, obojí na síti extravilánových komunikací II. třídy Jihomoravského kraje.

1. ÚVOD

Článek představuje téma multifaktorové analýzy dopravní nehodovosti. Jedná se o praktickou aplikaci statistických postupů, vhodných např. pro správce krajské silniční sítě. S jejich pomocí lze odpovědět na řadu otázek týkajících se bezpečnosti silniční sítě v jejich správě. Tři základní a často kladené otázky jsou:

  1.  Jaké jsou na konkrétní síti rizikové faktory, působící na vznik dopravních nehod?
  2.  Pokud jich je více, jak silný je jejich vliv, který faktor je nejzávažnější?
  3.  Jaká je kritická hodnota, kdy faktor působí nejvíce, nebo naopak od jaké hodnoty jeho působení slábne?

Je zřejmé, že použitím stávajících přístupů nelze na uvedené otázky zodpovědět. Stejně tak není možné kvalifikovaně sestavit „žebříček“ závažnosti (priority řešení) ať už jednotlivých rizikových faktorů nebo konkrétních prvků silniční sítě (křižovatek, úseků apod.). K těmto účelům je potřeba využít moderní statistické metody a modely. Autoři se studiem této problematiky a její aplikací do českého prostředí zabývají dlouhodobě a zprostředkovávají využití moderních poznatků v oblasti správcům silniční sítě na všech úrovních i další odborné veřejnosti.
Text čerpá z certifikované metodiky Multifaktorové analýzy dopravní nehodovosti [1], která byla vytvořena v Centru dopravního výzkumu, v. v. i. v roce 2014. Jsou zde popsány principy, na nichž je založena teorie využitá v prováděných analýzách. Tyto principy umožňují pochopit filozofii metody i bez znalosti statistických postupů. Dále je uvedeno praktické využití na dvou příkladech na extravilánové síti silnic II. tříd Jihomoravského kraje.


2. TEORIE

Metoda používá přístupy kvantitativního výzkumu – ten se zabývá vztahy mezi proměnnými, jejichž hodnoty mohou být čísla nebo kategorie. Závisle proměnná je nehodovost (např. ve formě roční četnosti nehod na křižovatce nebo roční hustotě nehod na 1 km délky mezikřižovatkového úseku). Nezávisle proměnné jsou jednotlivé rizikové faktory. Faktory mohou pocházet ze sféry řidiče, vozidla nebo prostředí.
Teoreticky by nezávisle proměnné měly být příčiny a závisle proměnné by měly být jejich důsledkem. Toto však platí jen v případě čistě experimentálního výzkumu, kdy se pomocí manipulace s nezávislými proměnnými zjišťuje vliv na závisle proměnnou, přičemž tento vliv není zkreslen žádnou jinou proměnnou. Toho lze docílit v laboratorním výzkumu (v dopravním kontextu např. na řidičském simulátoru), obecně však v dopravě tento předpoklad neplatí. Je tedy vhodnější používat pojem vlivy nebo faktory (více viz např. [2]).
Dopravní jevy lze v reálném prostředí zkoumat pouze neexperimentálně – pozorováním (observací), odtud pojem observační výzkum. Při tomto výzkumu se využívá přirozená variabilita nezávisle proměnných. Přitom však působí celá řada tzv. matoucích proměnných, jejichž vliv je nutno statisticky odstranit – tzv. kontrolovat a to tak, že se kontrolní proměnné zapojí do analýzy spolu s ostatními nezávisle proměnnými.
Obecný postup MFA lze pak s využitím uvedených pojmů uvést následovně:

  1.  Volba závislé proměnné.
  2.  Volba nezávisle proměnné/proměnných (včetně kontrolních proměnných).
  3.  Provedení analýzy, ve které jsou zjištěny hodnoty nezávisle proměnných; kvantifikace vztahů mezi závislou proměnnou a nezávisle proměnnými.

Existuje celá řada technik analýz. Jako prvotní (průzkumovou) lze použít metodu hlavních komponent. Těžiště MFA leží v analýze závislostí, především v regresní analýze.
Explorační analýza
Účelem explorační (průzkumové) analýzy dat je odhalit jejich zvláštnosti ještě před vlastním (do jisté míry rutinním) statistickým zpracováním. Mezi její základní prvky patří vizualizace dat (grafická nebo tabelární) a analýza reziduálních (odlehlých) hodnot.
Jednou z technik explorační analýzy je metoda hlavních komponent. Ta se používá k redukci počtu proměnných pomocí tzv. hlavních komponent, které popisují variabilitu všech proměnných a vztahy mezi nimi. Hlavní komponenty vznikají jako lineární kombinace původních proměnných.
Analýza závislostí
Pro analýzu závislostí jsou v metodice využity nástroje korelační a regresní analýzy:
Korelace označuje vzájemný vztah mezi dvěma proměnnými. Pokud se jedna z nich mění, mění se korelativně i druhá a naopak. Sílu této závislosti vyjadřuje korelační koeficient.
Regresní analýza je označení statistických metod, pomocí nichž lze odhadovat hodnoty závisle proměnné na základě znalosti jiných veličin (nezávisle proměnných). Je-li závislost prokázána, lze pomocí nezávisle proměnné odhadovat (predikovat) hodnoty závisle proměnné.
Regresní analýza je velmi rozšířenou technikou statistické analýzy dat. Její standardní variantu (lineární regresi) však lze aplikovat pouze pro spojité proměnné, které (resp., jejichž rezidua) mají normální rozdělení pravděpodobnosti. V ostatních případech lze použít tzv. zobecněnou regresi (zobecněný lineární model). Zvláštním případem je také logistická regrese (používá se v případech, kdy má závisle proměnná pouze dvě hodnoty, např. ano/ne).
Aplikace v kontextu nehodovosti
V kontextu nehodovosti se používají víceproměnné regresní modely. Vysvětlovanou proměnnou bývá nehodovost (např. ve formě roční četnosti nehod na křižovatce nebo roční hustotě nehod na 1 km délky mezikřižovatkového úseku), vysvětlující proměnné se volí většinou podle dostupnosti dat: jedná se např. o intenzitu dopravy (RPDI), počet jízdních pruhů, šířku komunikace, rychlostní limit apod. Pro tyto modely se vžilo označení predikční modely nehodovosti nebo nehodové predikční modely. Protože nehodová data jsou nespojitá a nelineární, používá se zobecněná regrese (GLM), (více viz [2]).

3. PŘÍKLADY

Dále jsou uvedeny dva příklady MFA. První se týká stykových křižovatek, druhá mezikřižovatkových úseků. Oba soubory pochází z extravilánových silnic II. třídy v Jihomoravském kraji.
Příklad 1 – Stykové křižovatky
Cílem prvního příkladu bylo zjistit, jaké faktory zvyšují riziko nehody se zraněním na stykových křižovatkách v extravilánu. Bylo vybráno celkem 72 křižovatek. Závisle proměnnou je počet nehod se zraněním (N) v období 2007 – 2013 v okruhu 100 m od křižovatky (data získána od Policie ČR). Nezávisle proměnné vystihují expozici (intenzitu dopravy) a geometrické charakteristiky. Intenzita dopravy byla vyčíslena jako počet vozidel vjíždějících do křižovatky (tj. polovina obousměrného RPDI). Proměnné, popisující geometrii křižovatek, byly následující: přítomnost samostatného odbočovacího pruhu na hlavní komunikaci (ano/ne), typ křižovatky (prostá/usměrněná), úhel křížení (vhodný/nevhodný), zalomená přednost (ano/ne).
Následně byly použity analýzy, které byly uvedeny v teoretické části:
 Analýza hlavních komponent  byl prokázán vliv intenzity.
 Logistická regrese  byl prokázán vliv intenzity a samostatného odbočovacího pruhu.
 Zobecněný lineární model  byl prokázán vliv intenzity a samostatného odbočovacího pruhu.
Závěry jsou silnější v případě, kdy je vliv některého faktoru potvrzen více analýzami. Zde se takto potvrdil vliv přítomnosti samostatného odbočovacího pruhu. Ten lze vyjádřit i graficky (Obr. 1): roční očekávaná nehodovost je modelována v závislosti na intenzitě na hlavní komunikaci pro dvě varianty: bez odbočovacích pruhů, s odbočovacími pruhy. Z průběhu křivek (mocninných trendů) je zřejmý vliv přítomnosti odbočovacích pruhů: bez nich (červená křivka) lze očekávat obecně vyšší nehodovost než s nimi (modrá křivka).

Obr. 1 Graf očekávané nehodovosti v závislosti na intenzitě dopravy a přítomnosti odbočovacích pruhů

Na tomto příkladu se potvrdil obecně udávaný fakt, že odbočovací pruhy v křižovatce zvyšují její přehlednost. Výsledky ovšem umožňují stanovit, jaký je rozdíl oproti křižovatce bez pruhů. Výsledky je možné využít jako jeden se vstupů např. pro cost-benefit analýzu při výstavbě či úpravách křižovatky, přínos na úsporách z dopravní nehodovosti ve srovnání s náklady nutnými na výstavbu/úpravu křižovatky (dále by mohlo být uvažováno např. se zdržením v prostoru křižovatky, čili s imisním zatížením, úrovní kvality dopravy, atd.).

Příklad 2 – Mezikřižovatkové úseky
V tomto příkladu byly identifikovány charakteristiky silniční sítě, které zvyšují riziko dopravní nehody (bez rozlišení závažnosti). Řešený soubor pokrývá celkem 995 km sítě. Protože se u těchto úseků průběžně mění jejich vlastnosti, byla nejprve provedena segmentace do homogenních úseků. Homogenita byla definována ve smyslu vybraných charakteristik představujících potenciální rizikové faktory, které mají v rámci úseků stejnou hodnotu. Tyto faktory zahrnovaly intenzitu, nejvyšší dovolenou rychlost, šířkovou kategorii komunikace, počet jízdních pruhů a přítomnost zpevněné krajnice. Při každé změně hodnoty některé z těchto veličin byl vytvořen nový úsek. Aby byly délky výsledných úseků vhodné pro případné prohlídky na místě, byla segmentace provedena tak, aby jejich maximální délka nepřesahovala 500 m. Delší úseky byly rozděleny na 250m části. Ke každému úseku byla přiřazena nehodová, silniční a dopravní data z následujících zdrojů:

  •  Počet všech nehod zaznamenaných Policií ČR za období 2009 – 2012.
  •  Údaje o silniční síti ze Silniční databanky ŘSD ČR (aktualizace k červenci 2010), případně doplněné z mapových podkladů.
  •  Údaje o intenzitě dopravy z Celostátního sčítání dopravy 2010.
  •  Údaje o kvalitě povrchu vozovky z průzkumu firmy PavEx Consulting v roce 2011.

Z uvedených dat byly vytvořeny následující proměnné:

  •  Expozice: intenzita dopravy (celkové RPDI a podíl těžkých nákladních vozidel), délka úseků.
  •  Parametry komunikace: kategorie (S 7,5; 9,5; 11,5), počet jízdních pruhů, přítomnost zpevněné krajnice (ano/ne), nejvyšší dovolená rychlost jízdy (nesnížená/snížená), přítomnost lesa v okolí komunikace (ano/ne).
  •  Parametry trasy: hustota křižovatek a dopravních zařízení (počet na 1 km), křivolakost ve 3 formách (průměrná, závlek, hustota oblouků).
  •  Podíl délky úseku, na kterém je havarijní stav povrchu vozovky (číslo v intervalu 0 – 1).

Opět byly použity analýzy popsané v teoretické části.

  •  Analýza hlavních komponent - byl prokázán vliv křivolakosti.
  •  Logistická regrese - byl prokázán vliv intenzity, křivolakosti a lesa.
  •  Zobecněný lineární model - byl prokázán vliv intenzity, křivolakosti a lesa.

V závěrech se opakovaně potvrdil vliv intenzity a křivolakosti. Na Obr. 2 a 3 jsou tyto vlivy znázorněny graficky.

Vliv intenzity (RPDI):
Nehodovost (N) má rostoucí trend přibližně do hodnoty intenzity 15 500 voz/den, následuje pokles. „Zlomová“ hodnota představuje hranici kapacity, při překročení její hodnoty dochází ke kongescím, tj. omezení rychlosti a tudíž i snížení nehodovosti. Tato hodnota přibližně odpovídá mezní kapacitě silnic II. třídy uvedené v ČSN 73 6101, tab. 5.

Obr. 2 Závislost očekávané nehodovosti na RPDI

Vliv křivolakosti (K):
Nehodovost (N) má rostoucí trend, nejprve lineární, prudší nárůst nastává přibližně od hodnoty křivolakosti 125 gon/km. Tento údaj odpovídá zahraničním zkušenostem [3], podle kterých má křivolakost vliv na nehodovost od hodnot 100 – 150 gon/km. Důvodem mohou být zhoršené rozhledové poměry nebo změny jízdní rychlosti.

Obr. 3 Závislost očekávané nehodovosti na křivolakosti úseku

Skutečnost, že další nezávislé proměnné nejsou statisticky významné, souvisí přímo s řešenou silniční sítí. Např. počet úseků s vyšším počtem jízdních pruhů je na řešené síti nízký; přínos vyššího počtu pruhů pro bezpečnost provozu se proto nepodařilo prokázat. Je zřejmé, že výsledky modelu nelze zobecnit na celou silniční síť. Důvodů je mnoho, k nejvýznamnějším patří ráz krajiny a dopravní režim.

4. ZÁVĚR

Text čerpá z certifikované metodiky Multifaktorové analýzy dopravní nehodovosti [1], která byla vytvořena v Centru dopravního výzkumu, v. v. i. v roce 2014. Multifaktorovou analýzu dopravní nehodovosti (MFA) lze použít na plošné hodnocení – např. na celostátní, krajské nebo městské silniční síti. Jednotkou analýzy mohou být křižovatky nebo mezikřižovatkové úseky. Vstupem jsou proto data, která popisují všechny jednotky ve vybrané oblasti (doporučuje se minimální počet 20): nejčastěji se využívají nehodová data Policie ČR, dále údaje o dopravním zatížení z Celostátního sčítání dopravy a údaje o silniční síti ze Silniční databanky ŘSD ČR; doplňkově lze provést vlastní průzkum (např. rychlosti nebo dopravní značení). Výstupem analýzy je rovnice, která obsahuje jednotlivé statisticky významné proměnné (tj. rizikové faktory) a koeficienty udávající míru jejich vlivu na nehodovost či na zkoumanou příčinu nehod na dané síti.
MFA vychází z dat o souboru prvků silniční sítě, nezabývá se tedy pouze jednotlivými místy, ale její výsledky lze v závěru na konkrétní místa aplikovat. Na jednom úseku například nelze zjišťovat vliv hodnot křivolakosti na bezpečnost (protože úsek má jen jednu hodnotu křivolakosti). Proto se analyzuje soubor úseků a z výsledku se zjistí vliv křivolakosti na dotyčných úsecích. Např. podle druhého příkladu je u mezikřižovatkových úseků kritická hodnota křivolakosti 125 gon/km – pak lze na konkrétním úseku hodnotit, zda je jeho křivolakost bezpečná či nebezpečná a zda nepřispívá či přispívá k nehodovosti.
Oba příklady byly aplikovány na extravilánové síti II. třídy konkrétního kraje a nelze je zobecňovat. Použitou metodu však lze (v závislosti na dostupnosti dat) aplikovat i kdekoli jinde, jak ilustrují analýzy Centra dopravního výzkumu, v. v. i. provedené např. na pražských křižovatkách [4] nebo na síti TEN-T [5]. Vytvořené zobecněné regresní modely mají navíc i další využití, např. jako vstup do empirické bayesovské metody (EB), která umožňuje identifikovat kritická místa silniční sítě. Oproti tradičním metodám identifikace, vycházejícím pouze z historických nehodových dat, je předností EB přístupu skutečnost, že dokáže eliminovat náhodný vliv regrese k průměru a tudíž spolehlivěji určí dlouhodobě kritická místa [6]. Tyto principy byly již dříve v Silničním obzoru představeny [7], nyní jsou Centrem dopravního výzkumu, v. v. i. prakticky aplikovány pro účely ŘSD ČR na silniční síti I. třídy Jihomoravského nebo Zlínského kraje [8].

Článek vznikl za podpory výzkumného projektu „Identifikace a řešení kritických míst a úseků v síti pozemních komunikací, které svým uspořádáním stimulují nezákonné nebo nepřiměřené chování účastníků silničního provozu“ (IDEKO) z programu Bezpečnostního výzkumu Ministerstva vnitra ČR (č. VG20112015013).

REFERENCE
[1] Ambros, J., Valentová, V., Striegler, R. a kol. Multifaktorová analýza dopravní nehodovosti – metodika provádění. Centrum dopravního výzkumu, v. v. i., Brno, 2014. ISBN 978-80-88074-01-4.
[2] Ambros, J. Hodnocení bezpečnosti dopravy. Centrum dopravního výzkumu, v. v. i., Brno, 2013 (http://issuu.com/cdvcz/docs/m8_ambros_final). ISBN 978-80-248-3263-0.
[4] Valentová, V. Difference between the expected numbers of accidents for various types of intersection arrangements in Prague. Young Researcher Seminar, Lyon, 2013 (http://www.ectri.org/YRS13/Documents/Papers/Session3a/YRS13_Session3a_Valentova_CDV-Paper.pdf).
[5] Pokorný, P., Ambros, J., Janoška, Z., Kyselý, M. Bezpečnost pozemních komunikací sítě TEN-T. Silniční obzor, 2013, roč. 74, č. 11, s. 10-16.
[6] Valentová, V., Ambros, J., Janoška, Z., Striegler, R. Predikční modelování a jeho výhody oproti stávající metodě identifikace nehodových lokalit. Silniční obzor, 2013, roč. 74, č. 11, s. 290-293.
[7] Ambros, J. Jak měřit bezpečnost? – 2. část. Silniční obzor, 2012, roč. 73, č. 4, s. 103-105.
[8] Pokorný, P., Ambros, J. Identifikace rizikových míst na silnicích I. třídy v Jihomoravském kraji – praktická aplikace empirické Bayesovské metody. Silniční obzor, 2014, roč. 75, č. 12, s. 341-344.