統計的魔鬼細節
「一場車禍發生後,幾天內死亡,可以被算為是因車禍致命?」這是統計定義上的難題,但也可能造成統計上的誤判。
根據WHO報告,不同統計標準,可能造成低估車禍致死率。
台灣警政體系的交通事故統計,可分A1類、A2類。A1類是24小時內致死的車禍件數,表示嚴重快速致命的車禍;A2類則是受傷或超過24小時死亡。
然而,可供辯論的是,同樣有可能是因車禍死亡,「24小時後」死亡就不計入A1統計,是否因此低估台灣致命車禍率?國際間,為達成有意義的資料比較,通常將致命車禍定義為「車禍30日內死亡者」。
細看台灣近10年資料,A1類下降41%,但是A2類卻暴增,車禍致死率是否下降,我們很難判斷。魔鬼藏在細節裡,若只看A1類數字,是否對於交通安全改善、事故資料分析,具有建設性意義?值得辯論。
開放資料格式 跟不上時代
台灣官方開放的交通事故統計資料,未列精準的車禍地點經緯度,常以某路口、某地標方式記錄。以去年資料為例,還曾出現「OO路OO幼兒園(附近)」,這種既不是精確地址、也不確定是否「OO幼兒園」會一直營業而不讓這資料失效的荒謬情況。
這種開放資料格式,既無法用工程方式進行資料視覺化,也造成交通資料的後續統整、累積、再利用、以及判讀不易。
聯合報系新媒體部進行一次2014年A1類1770筆資料清理的實驗。工程師自寫一組內部地圖套件工具,手動調整標示所有類似「台14線70公里500公尺處」、「OO路OO幼兒園」的資料在地圖上。