基于不平衡学习的道路交通事故严重程度分类预测——从数据预处理到模型优化全流程实现

张开发
2026/4/3 17:17:03 15 分钟阅读
基于不平衡学习的道路交通事故严重程度分类预测——从数据预处理到模型优化全流程实现
基于不平衡学习的道路交通事故严重程度分类预测——从数据预处理到模型优化全流程实现第一章 绪论1.1 研究背景与意义交通事故已成为全球范围内导致人员伤亡和经济损失的重大公共安全问题。世界卫生组织的数据显示,交通事故每年造成约119万人死亡,对5至29岁年龄段人群的影响尤为显著[reference:0]。在这一背景下,开发精确的事故严重程度预测模型,对于制定有效的交通安全政策、减少伤亡和财产损失具有重要意义[reference:1]。机器学习方法在事故严重程度预测研究中日益受到关注。随机森林(Random Forest)、极端梯度提升(XGBoost)、支持向量机(SVM)等算法在预测事故严重程度方面展现出良好的性能[reference:2]。然而,事故数据集普遍存在一个固有挑战:致命事故(Fatal Injury)和严重事故(Serious Injury)样本数量稀少,而轻伤或仅财产损失的事故样本占据绝大多数[reference:3]。这种类别不平衡问题严重影响了模型对少数类(致命/严重事故)的识别能力。有研究表明,在不对不平衡数据进行处理的情况下,模型对致命事故的召回率仅为0.198,意味着大量致命事故无法被有效识别[reference:4]。本研究的核心目标正是针对这一关键问题,通过综合运用多种不平衡学习方法,显著提升对致命/严重事故的预测精度。1.2 研究内容与技术路线本研究选取US-Accidents这一大规模交通事故数据集,构建完整的事故严重程度分类预测流程。该数据集包含约225万条事故

更多文章