自动驾驶计算机视觉培训
一、简介
1、自动驾驶的应用:不同应用场景(L2+或L3乘用车、robotaxi、robobus、干线物流、快递、矿区码头等封闭场景)对自动驾驶功能的需求
2、自动驾驶的系统:自动驾驶的软、硬件系统,背后的云服务、数据服务等
3、自动驾驶的技术栈:感知、定位、地图、PnC等,以及每个技术方向依赖的基础技术如:成像投影原理、特征提取、图像匹配、目标检测、深度估计、全景分割、深度学习、数据闭环等。
4、QA&交流&后续安排(30min)
二、关键技术讲解
1、视觉感知
1.1目标检测:重要的任务之一,模型结构、训练策略、监督信号等;QA(20min)
1.2目标跟踪:预测、匹配、相似度计算;QA(10min)
1.3图像分割:以车道线检测为例讲解模型设计;QA(10min)
1.4 其他任务:红绿灯检测、标志标牌识别、深度估计等
2、视觉定位
2.1相机标定:成像原理说明真实世界与图像平面的关系
2.2特征提取:各种算子(SIFT、ORB)从图像中提取关键角点信息进行匹配
2.3参数估计:从匹配的角点计算投影关系,如图优化等
2.4 QA(10min)
三、工程化落地与工具链建设
1 Cyber/Ros简介:机器人基础运行架构
2深度学习模型部署:剪枝、量化、tensorrt、cuda等模型实时运行技术
3 深度学习模型研发闭环
3.1 数据闭环链路:所有跑车数据可落盘、可回盘、有标记、可查询
3.2 数据挖掘&数据标注:寻找有价值的数据
3.3 case分析、可视化:可视化并分析、定位问题
4 仿真刷库:积累足够的case,验证迭代过程中是否带来其他负面影响