“火山引擎携旗下自动驾驶数据服务解决方案亮相ICVS年会”
为助力自动驾驶行业加速变革,推动行业技术创新交流,由上海市通信管理局指导、上海市车联网协会主办、华墨集团、中国智能汽车及自动驾驶博览会承办的2022第二届ICVS中国自动驾驶年会于2022年12月15日在上海隆重举行,本届年会以“推动智能汽车产业发展,加速自动驾驶商业化落地”为主题,设置了55场专题演讲,汇聚了自动驾驶领域共计1000余位业内大咖云集,是近年来规模领先的线下自动驾驶技术领域盛会。
在本次ICVS年会上,火山引擎与NVIDIA联合设立了云上创新专场,该论坛汇聚火山引擎智能驾驶行业伙伴强大阵容,技术大咖与最佳实践案例结合,重点聚焦当前智能汽车领域云算力、算法训练、高质量数据等热点话题。
数据、算法、算力被看成人工智能中的“三驾马车”,数据是其中的土壤。2022年,随着自动驾驶数据标注的需求量开始爆发,简单粗暴地堆人力,已无法有效解决“需求波峰”时供应不足的行业痛点,企业需要高质量、高安全性、高效的数据体验。
负责人专访
针对这些行业痛点和需求,火山引擎AI数据服务基于全生命周期的管理作业平台,提供一站式的服务能力体系,包含:售前咨询、方案设计、数据采集、数据标注、调研测评、智能标注工具等,帮助企业解决AI智能时代下的高质量数据缺口问题。在活动现场,火山引擎首次面向行业集中展示了AI数据服务的产品能力及商业进展,我们也采访了AI数据服务负责人金亮,深度了解该项业务的情况。
智车科技:火山引擎AI数据服务这块业务是怎么成长起来的?
金亮:最初,AI数据服务业务是为了满足集团内各条业务线的机器学习需求而诞生的。在2021年,我们累计服务了内部40多条业务线和产品线,承接集团内需求达数千项,实际产出了数十亿条数据。所以说,我们在作业量和对不同业务场景的熟悉度和理解程度等方面具备一定天然的优势。
2021年年初,我们逐步开始了对自动驾驶领域的探索。在开展行业调研时发现,近几年自动驾驶行业对于数据标注的需求在逐步增大,主机厂、自动驾驶算法公司对于数据标注的需求开始释放明显的信号,并在未来几年里的增量会非常可观,AI数据行业将迎来发展新机遇。通过对行业的判断,并在行业内进行了反复的验证,待时机较为成熟后,正式对外开放服务。
智车科技:可以分享一下现阶段我们在自动驾驶领域的进展吗?
金亮:我们现阶段在智能驾驶领域拥有几千名2D/3D经验生产人力,平均交付准确率已经可以实现99%以上。客户已经覆盖头部互联网公司无人车项目、造车新势力、传统车厂、图商、自动驾驶方案提供商等。项目能力覆盖了2D/3D融合、点云车道线、连续帧追踪标注等主要类型。标注车型覆盖商用车、乘用车及无人配送车等多类型车辆,标注场景实现全覆盖。在未来,我们将加快在自动驾驶领域的探索,也期待与更多智能驾驶领域的客户展开合作。
智车科技:AI数据服务和火山引擎智驾云解决方案是怎么连接和协同的呢?
金亮:先大概介绍一下火山引擎智驾云解决方案。智驾云提供的是一套完整的云端数据闭环开发工具,其中包含智能驾驶数据平台、AI数据服务、机器学习平台、云基础(存储/计算/网络等)、仿真平台等产品。覆盖了数据接入、数据处理、数据标注、模型训练、仿真验证等阶段的研发需求。这套基于大数据和人工智能技术的解决方案能够深度赋能客户加速智能驾驶技术研发与落地。
那么AI数据服务本身与数据存储、模型训练关系密切,标注平台也是智驾工具链中重要的一环,可以与云基础产品形成相互带动之势。与此同时,AI数据服务成为智驾云解决方案里的一块的“拼图”后,对于客户而言,可以按需、灵活地部署相应的基础资源,也使得数据流转的安全性和便利性都得到了大幅增加。
智车科技:和市面上的数据标注公司有什么区别,优势在哪里?
金亮:首先值得一提的是服务能力和团队经验,火山引擎AI数据服务团队均来自知名院校以及业内头部企业,综合素质高,专业能力强,为内部业务线服务多年,各类型项目经验沉淀丰富。我们在天津、龙岩、重庆、烟台等10+地方拥有自建基地,综合标注人员达万人,可覆盖市面绝大部分需求类型和场景,拥有过规模化量产组织管理能力。另外,光有人力团队支持是远远不够的,我们也非常注重平台智能化能力的研发工作。现已拥有AI预识别、边标边训的算法能力,能够实现30%-100%的效率提升和10%-30%的质量提升。在人员管理可视化方面,通过工时管理平台与标注平台的打通,可以科学地分发任务、进度看板提前预警,实现以多维度、多角度、科学精准地做好产量管控。一般小型的标注公司的标注场地比较分散,下游的用工方式和情况较为复杂,数据在接入和流转的过程中存在着一定的数据安全风险。面对这一问题,我们有数据平台安全+物理环境管控+网络终端安全+人员规范管理四重方法来保障信息安全。
智车科技:近些年数据安全问题凸显,我们有哪些具体的措施来保证安全和质量呢?
金亮:为预防数据安全问题出现,在数据流转的过程中,我们提供云链接加密传输、硬盘传送、专人监督运送、阅后即焚、文档权限管理等方式。通过完善的数据传输、管理、存储流程,确保数据流转最小必要原则。
在人员培训方面,通过一系列科学的方式和培训来提高人员对数据安全保护意识。数据平台管控方面,通过数据平台水印、飞书文档权限、数据生命周期和行为记录等方式确保数据不外传。在物理场地管控方面,采用了门禁、CCTV和专人巡检的方式保证作业环境安全。在网络及终端安全方面,我们采用了集团先进的管理方法,同时有国内外数据安全法务专家支持,给予专业指导,全面排除合作风险,综合地来保证数据安全。
智车科技:【自动驾驶 数据标注】行业发展趋势和发展方向是怎么样的?
金亮:从行业的角度看,伴随着智能驾驶行业的整体壮大,越来越多的量产车正式上路,可以预见到2025年,自动驾驶对于数据标注的需求会是长期且持续不断的,这也为AI数据行业带来了快速发展的机遇。
当前,这个行业中有大量的企业还停留在劳动密集型产业的定位中,在过去数据量还没有那么大的时候是行得通的,但面对现阶段自动驾驶所需要处理的大额数据量时,就显得捉襟见肘,大规模比拼人力的时代也将会成为过去。
我认为接下来行业会向智能化的阶段过渡。通过AI算法的辅助来减少对于人力的依赖、提升整体作业效率是未来数据标注创新的大趋势。与此同时,高度智能化的数据标注平台将有助于实现精细化管理,推进管理系统化进程,为高效实现项目工时管理和人效管理提供有力支持。