加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

造芯者胡郁:用半生来阐释「从 0 到 1」的 AI 攻城人

2021/09/28
773
阅读需 13 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

胡郁与刘庆峰和科大讯飞的缘分,几乎可以说是命中注定的。

科大讯飞联合创始人、轮值总裁胡郁,离职了。

9 月 26 日下午,科大讯飞发布人事变动公告,公告称:胡郁因为打造更完整人工智能产业生态的需要,而辞去公司董事职务。

同一天,刚从科大讯飞卸任的胡郁,以聆思科技董事长的身份,出现这一公司的人工智能芯片战略研讨会上——值得一提的是,科大讯飞董事长刘庆峰也出现在这场会议上,并且就坐在胡郁身边。

(图自:LISTENAI

对于胡郁来说,这次职务变动,颇有归零之感,但又隐含着从 0 到 1 的创业意味。

不过,从 0 到 1 的感觉,胡郁并不会感到陌生——毕竟,这样的从业体验,在他 22 年的科大讯飞职业生涯中已经有了三次。

1

第一个从 0 到 1:

以学生身份担任联合创始人

胡郁与刘庆峰和科大讯飞的缘分,几乎可以说是注定的。

出生于 1978 年的胡郁是安徽省宣城市泾县人,这也是刘庆峰的故乡;不仅如此,虽然刘庆峰比胡郁大五岁,但他报考高考志愿是找胡郁父亲给的建议,两人可以说是世交。

更有趣的是,两个人都是以宣城理科状元的身份,考上了中国科技大学电子工程系;刘庆峰是 1990 年,胡郁是 1995 年,中间也是隔了五年时间——不仅如此,当胡郁入学的时候,刘庆峰刚好拿到中国科大电子工程专业学士学位。

1997 年下半年,胡郁上大三,他进入到了王仁华教授主导的中科大人机语音通信实验室。此时刘庆峰也在这一实验室,但他已经在负责国家 863 项目 “KD 系列汉语文语转换系统” 的研发——这一系统在 1998 年 12 月的国际汉语口语处理研讨会(ISCSL)上获得高度评价。

1999 年,刘庆峰决定创业,他自己出资十万,拉上 17 个兄弟们凑了一点钱,在中科大、安徽省经贸委的出资支持下,成立了科大讯飞的前身硅谷天音——这 17 位兄弟中,就有当时正在读大四的胡郁。

早年的讯飞公司

当年 6 月 9 日,安徽中科大讯飞信息科技股份有限公司组建,开始产业化运作,26 岁的在读博士刘庆峰担任公司总经理,王仁华教授担任技术总监和研究院院长。

到了 11 月,在讯飞公司框架下,六名中科大学生研制出我国第一台“能听会说”的中文电脑,获得总计 668.85 万元的技术股权。这里提到的“能听会说”电脑的研制是智能计算机研究领域的重要课题,也是我国“863 ”计划支持最早、持续最久的高科技项目。

21 岁的本科生胡郁,正是这六名学生的其中之一,他负责的是汉语语音库设计。

此后,胡郁一边继续在中科大读书,一边担任中科大讯飞公司的研究员,主要从事的是语音合成专项技术研究。接下来的数年间,科大讯飞在蹒跚中不断抓住机会发展,而胡郁也从研究员逐步担任基础研发部经理、讯飞语音联合实验室副主任等研发管理角色。

就这样,胡郁伴随着科大讯飞从 0 到 1 的起步过程。

2

第二个从 0 到 1:

国内第一个企业 AI 研究院院长

胡郁在讯飞的一路成长,在 2005 年是一个重要节点。那一年,科大讯飞成立了研究院,胡郁担任研究院执行院长,如今来看,这是国内第一个企业 AI 研究院。

那一年,胡郁才 27 岁。

当时的一个大背景是,科大讯飞在业务方向上看中了运营商的“彩铃”业务,这个业务需要解决的问题是语音识别问题。但科大讯飞的专长是语音合成,而非语音识别。为此,科大讯飞选择了与全球语音巨头 Nuance 合作,成为 Nuance 的代理,并且获得业务成功,最后在 2008 年上市——此为后话。

其实,在上述业务一路发展的过程中,科大讯飞其实也深刻意识到自己在语音技术上对 Nuance 的依赖不可持续,因此需要建立起科大讯飞自己的语音识别研发力量,而要单开语音识别这条线,刘庆峰得先找一个业务带头人。

这个人,就是胡郁。

胡郁开始做语音识别的一个契机是,当年他妻子在香港大学霍强教授处读博士后,想让胡郁跟着去陪读两年;霍强教授也是王仁华教授的学生,当时在语音识别领域已经形成自己的江湖地位。于是,刘庆峰去找老师王仁华商量,王仁华给了一个建议,胡郁在给妻子陪读的同时给霍强做研究助理,借此开始建立起科大讯飞在语音识别的班底。

于是,2005 年至 2007 年,胡郁给霍强当了两年研究助理——多年后谈到这段经历时,胡郁的说法是:“我在香港搞清楚了国际一流的研究怎么做这个问题,并经常把从港大学到的新东西及时带回内地。”

2007 年,霍强从香港大学转去微软亚洲研究院后,胡郁又去找王仁华教授的另一个学生江辉合作,江辉也是科大讯飞创业 18 罗汉之一,是当时中科大 BBS 上黑客版的版主,比刘庆峰高三届,因去东京大学读博士离开,后来又回到科大讯飞。

此外,在语音识别领域,科大讯飞也选择与清华大学王作英实验室合作。就这样,胡郁三箭齐发,开始逐步组建起科大讯飞在语音识别领域的团队。

左林大叔&胡郁

2008 年 6 月,胡郁更进一步,担任科大讯飞公司高级副总裁、讯飞研究院院长,负责领导科大讯飞公司语音合成、语音识别、语音分析、语音评测、声纹语种、语音信号处理等智能语音核心技术的研究及公司整体经营管理。

八年后的 2016 年,科大讯飞在国际语音识别大赛 CHiME上 取得全部指标第一;而在认知智能领域,科大讯飞又相继获得国际认知智能测试全球第一、国际知识图谱构建大赛核心任务全球第一等成绩。

3

第三个从 0 到 1:

让 To C 站在 AI 商业链顶端

对于胡郁来说,他在讯飞的第三个重要台阶,是 C 端业务。

毕竟,移动互联网随着 iPhone 的推出开始爆发,语音行业江湖掀起大浪潮,科大讯飞也感知到了这个趋势,于是它先是推出了“讯飞语音云”平台,又在随后上线了 Android 和 iOS 版的中文语音助手讯飞语点——当然,讯飞也与三大运营商达成合作,试图把握住移动互联网的机会。

一直以来,AI都是以 To B/G 的形式对外赋能,而在 To C 场景中鲜有成功的产品。

对于刘庆峰和胡郁来说,一直非常重要的是,如何让讯飞的技术触达更多的 C 端消费者。

对此,胡郁的说法是:“光凭技术很难成就一家真正伟大的公司,而技术创新、产品创新和商业模式创新都要天时地利……科大讯飞也是这么多年积累了一个成体系的技术体系,在这样的基础上,我们决定向 C 端输出”。

终于,2016 年这一年年底,科大讯飞做出新的组织结构调整,拆分成三个事业部;其中,消费者事业部赫然在列——这一次,作为刘庆峰的多年亲密战友,胡郁又一次被推到前台,他卸任研究院院长一职,担任消费者事业部的负责人。

于是,在胡郁的主导下,科大讯飞开始 To C 道路上的进军。

胡郁在 2016 年发布会上

从产品策略上来看,科大讯飞在 C 端产品上采用了三条内在的逻辑体系。第一条,是通过场景的细分将技术产品化,用技术解决刚需;第二条,是通过构建生态环境来联手合作伙伴一起拓展产品品类;第三条,是通过研发一专多能的全 AI 平台来扩大产品化的技术能力半径,提高自身的核心竞争力。

具体在产品上,从 2017 年开始,科大讯飞相继推出了翻译机、录音笔、智能笔记本、智能鼠标、会议宝、AI 学习机等面向消费者用户的智能硬件,甚至在近两年推出了智能 TWS 耳机 iFLYBUDS、智慧屏、投影仪等产品——当然,这些产品背后都是基于讯飞在语音和 AI 方面的积累。

从业务贡献来看来说,在胡郁和他的团队的努力下,自 2017 年到 2020 年,讯飞消费者业务连续三年保持超过 30% 的高增速,C 端营收占比在 2020 年上半年达 37.59%。

同时,2020 年科大讯飞的 C 端产品,在 618 大促期间整体销售额累计同比增长超 40%,双十一期间累计销售额同比增长 56%。

值得一提的是,在 2020 年 “618” 期间,身为科大讯飞轮值总裁的胡郁也出现在直播间上,为自家旗舰店的产品带货,也是非常拼了。

另外,在 2020 年疫情爆发的大背景下,胡郁也带领团队迎难而上,结合疫情需要,让人工智能产品在战"疫"中大显身手,"智医助理"、"新冠肺炎影像辅助诊断平台"、 "停课不停学"等智能产品在疫情期间也发挥了重要作用。

4

下一个从 0 到 1:踏上芯征程

古人云,四十不惑;43 岁的胡郁,已然过了不惑之年。

在这 43 年间,他用超过一半的岁月伴随了中国语音 AI 龙头企业科大讯飞 22 年有余的完整发展历程。他不仅参与了讯飞从 0 到 1 的发展壮大,也是讯飞研究院从 0 到 1 的掌舵者,更是讯飞 To C 的破局者——可以说,科大讯飞能有今天,胡郁是厥功甚伟的。

而如今,胡郁虽然离开科大讯飞,但又并非与之完全切割。

毕竟,聆思科技的大股东是言知科技,而后者背后的大股东和实际控制人正是刘庆峰;而根据刘庆峰自己的说法,聆思科技是科大讯飞人工智能生态战略的芯片支点——如此来看,身为聆思科技董事长的胡郁,与其说是离职,不如说是一次再创业。

只是这一次,胡郁的目标,是挑战更高的自研 AI 芯片领域,而且他拥有更高的独立自主权。

对于新的挑战,胡郁的说法是,在智能物联网时代,布局 AI 芯片符合国家战略需要与产业发展趋势,自己将从战略规划、产品研发、商业模式、募集资金等领域推动新公司快速发展,“用更长远的眼光布局未来”。

在某种程度上,这也正是胡郁的另外一个从 0 到 1。

Nuance

Nuance

我们在语音、自然语言理解、推理和系统集成方面的创新共同创造了更多的人类技术。

我们在语音、自然语言理解、推理和系统集成方面的创新共同创造了更多的人类技术。收起

查看更多

相关推荐

电子产业图谱