企业实训|自动驾驶中的图像处理与感知技术——某央企汽车集团
11月中旬北京海淀,TsingtaoAI技术团队为某央企汽车集团智驾团队开展交付自动驾驶中的图像处理与感知技术主题实训。

在智能驾驶技术快速迭代的今天,图像感知作为自动驾驶的"眼睛",其技术深度与落地能力直接决定系统可靠性。本实训聚焦真实工业场景,系统梳理从传统图像处理到前沿多模态融合的全栈技术路径。

课程以传感器标定、车道线识别等基础技术为起点,深入讲解CNN/Transformer在3D目标检测(如DETR3D、BEVFormer)、语义分割(U-Net、DeepLab)中的实战应用,结合多任务学习实现车道线、可行驶区域等多维度感知。特别针对行业痛点,详解模型量化、TensorRT加速等部署技术,剖析BEV+Transformer主流范式、端到端感知等前沿趋势。通过真实案例解析,帮助工程师突破长尾场景、恶劣环境等挑战,构建可落地的感知系统,为智能驾驶研发提供坚实技术支撑。


-
掌握自动驾驶感知全流程技术:涵盖传统图像处理(如车道线检测)与CNN/Transformer在目标检测、语义分割中的应用。
-
具备模型开发、优化与部署能力:熟练使用多传感器融合(如3D检测)、多任务学习(如UNet),并掌握模型量化及硬件加速技术。
-
紧跟行业前沿与创新实践:理解多模态融合、端到端感知等趋势,培养解决复杂问题的能力以支撑职业发展。

自动驾驶感知概论与图像传感器
1.1、感知在自动驾驶中的作用。
1.2、传感器基础。
1.3、图像传感器原理
图像预处理技术与车道线识别基础
2.1、图像增强
2.2、图像去噪
2.3、几何变换
2.4、图像数据增强
传统图像处理算法
在车道线与交通标识识别中的应用
3.1、边缘检测
3.2、霍夫变换
3.3、颜色空间与形态学操作
3.4、模板匹配
深度学习基础与CNN
4.1、深度学习概述
4.2、CNN原理
4.3、Transformer-based视觉模型基础(ViT、Swin Transformer简介)
4.4、迁移学习与预训练模型
基于深度学习的3D目标检测与跟踪(上)
5.1、目标检测概述
5.2、单目3D目标检测方法
5.3、Transformer在3D检测中的应用(如DETR3D、BEVFormer)
基于深度学习的3D目标检测与跟踪(下)
与红绿灯识别
6.1、多传感器融合3D目标检测
6.2、典型算法
6.3、多目标跟踪(MOT)
6.4、深度学习在红绿灯识别中的应用
语义分割与车道线精确识别及多任务学习
7.1、图像分割任务回顾: 语义分割:像素级别的类别分类(如天空、道路、车辆)
7.2、语义分割网络
7.3、实例分割网络
7.4、多任务学习
图像感知系统部署与挑战及未来趋势
8.1、模型部署
8.2、感知系统挑战
8.3、未来发展趋势









