5 亿多年前,汪洋之中生活着一些身体构造极其简单的小生物们,它们静等食物的到来,或也成为它物的食物。
偶然也好、必然也罢,最早期的这些小生物们慢慢出现了一双双“眼睛”,这个器官使得它们在猎取食物时可以自如地进攻,也可以自在地防守。
适者生存的理论指引下,之后相对较短的一段时间内,地球上的物种得到了非常丰富的发展,这也使得视觉进化引发“寒武纪大爆发”。
由此受惠的当然也包括人类,视觉也慢慢成为人们最为重要的感知系统,人脑中超过一半的认知都需要与视觉相联系,人们利用视觉支持日常的生活、工作,更好地了解世界。
5 亿年,时间完美地让绝大多数动物都看到了世界的光明,但稍显遗憾的是:
直到今天,机器和计算机面对的还是相对“黑暗时代”。
我们在街头巷弄安装了视频摄像头,但只能做到事后报警,尚不能做到事前预警;
我们的社会每天都会产生海量视频数据,但我们无法根据这些数据进行高效检索;
我们可以让无人机在广袤天空展翅,但我们还不能根据它所看到的数据绘制地貌。
总结而言:
作为一个社会整体,我们还是个盲人,因为我们最为智能的机器还是个盲人。
这是此前 CV 大牛李飞飞教授出席未来论坛时,谈到的她对于视觉智能的一些看法。
而这个看法,也被业内绝大多数从业者所认同。他们认为,计算机视觉目前在各研究应用中主要还存有几大问题:
1、感知问题可以通过神经网络函数无限逼近,相比之下认知问题解决起来就比较棘手。
比如:如何准确、快速地教会机器辨识什么是一把椅子?如果定义为四条腿,很多椅子并不满足此描述;如果定义为可以坐的物体,很多非椅子类工具也有此功能。
一个如此简单的检测物体问题,背后都蕴含着多层次的认知问题,而这些问题至今还未得到完美解决。
2、在遮挡、模糊等弱线索情况下,人类作出某种判断可以依据常识、推理等辅助手段实现全过程构建。
但如果想要将这些能力教授给机器则非常困难,它们所表现的识别能力与人类相比相差甚远,在需要能力协同、关键决策、精准控制时,机器智能尚显不足。
计算机视觉技术带给机器的能力不只是用来观察世界,而是需要与世界建立联系,从而智能交互。
换句话说:计算机视觉技术在城市级领域的探索才刚刚开始。
认识到技术的重要性及问题的多面性,作为全行业最为关注 AI 赛道的媒体之一,雷锋网紧抓市场化急速前进节点,于每年的「CCF-GAIR 全球人工智能与机器人峰会 」上开设「 视觉智能 」专场。
CCF-GAIR 是目前本土人工智能领域规格最高、影响力最大的峰会之一。自 2016 年创办以来, 已先后邀请到诺贝尔奖得主、图灵奖得主,20 余位中美英法加等国院士、百余位 IEEE / ACM / IAPR Fellow、数百位在各自专业领域享有盛誉的学者以及 AI 领域的知名企业家、投资者和创新者共襄大会。
而「 视觉智能 」专场的目的则比较聚焦:召集业内最为顶尖的技术大牛、业界专家,围绕未来城市级视觉 AI 的发展方向展开细致讨论。
过去五年,「 视觉智能 」专场已经邀请到了包括:权龙、罗杰波、贾佳亚、孙剑、Demetri Terzopoulos、梅涛、山世光、林达华、王晓刚、王孝宇、温浩、申省梅等超过三十位业界顶尖学者分享前瞻的技术研究 & 产品经营方法论。
譬如孙剑,身为旷视首席科学家、研究院院长、西安交通大学人工智能学院院长,去年 7 月 14 日,在第四届 CCF-GAIR 全球人工智能与机器人峰会「 视觉智能 」专场上,他便从视觉智能、计算机摄影学以及 AI 计算三个方面介绍了计算机视觉研究领域的变革。
他首先回顾了深度学习发展历史。深度学习发展到今天并不容易,过程中遇到了两个主要障碍:
第一,深度神经网络能否很好地被训练。在深度学习获得成功之前曾被很多人怀疑,相比传统的机器学习理论,深度学习神经网络的参数要比数据大 10 倍甚至上百倍;
第二,当时的训练过程非常不稳定,论文即使给出了神经网络训练方法,其他研究者也很难把结果复现出来。
这些障碍直到 2012 年才开始慢慢被解除。孙剑认为,深度学习和传统机器学习最大的差别是,随着数据量越来越大,使用更大的神经网络就有可能超越人类性能。
孙剑之外,上述的每一个人,都在为算力的陡增做着尝试、为算法的精进做着努力、为计算机视觉的成熟应用而深刻改变社会的信息资源使用观念和方式做着奋斗。
同时,他们也都选择在「CCF-GAIR 全球人工智能与机器人峰会 」这个目前中国学术界最为标杆的大会之上发表他们过去几十年的所思、所想。
「 视觉智能 」专场
计算机视觉技术应用路上,道阻且长,尚有无数未知黑暗森林亟待探索。
历史车轮滚滚势不可挡,每隔一段时间都会有新的技术突破。
2020 年,技术的迭代又匹配了哪些城市场景?而这是否又会带来新一轮的市场洗牌?
2020 年 8 月 7 日 -9 日,由中国计算机学会(CCF)主办,香港中文大学(深圳)、雷锋网联合承办的第五届 CCF-GAIR 全球人工智能与机器人峰会,即将在深圳召开。
延续往年,今年再次设置了「视觉智能 」专场。
本专场以「城市视觉新基建 」为主题,汇聚全球极具代表性的计算机视觉、AI 芯片、安防、智能服务器等企业高管,联合政、企、学、研、投、媒六界顶层资源,共同探讨智能城市背后计算机视觉的未来。
目前已经确认的演讲嘉宾包括:
田奇,华为诺亚方舟实验室首席计算机视觉科学家,IEEE Fellow
孙剑,旷视首席科学家
林达华,商汤科技联合创始人
姚志强:云从科技联合创始人
张磊,阿里巴巴集团副总裁,达摩院 AI 中心副主任,IEEE Fellow
申省梅,澎思科技首席科学家、新加坡研究院院长
通过一年一度的计算机视觉赛道品牌盛会,雷锋网希望你能从中读出鲜活的落地实践,考察字里行间的深意所向,还原起初不知或无法了解的既定事实,并重新审视那些塑造当今世界智能化的下沉力量。