2023年,国内半导体产业发展面临着很大的不确定性,这应该是共识。
IC芯片设计公司,重度研发创新导向。
站在企业角度,怎么在不确定性下,组织人、财、物,面向未来,应对市场竞争?
算命?我们是不会的。
但我们可以帮各位CEO们算一算账。
我们将从现金流、时间、人、TCO(总体拥有成本)、研发架构五个视角来展开对比,为各位做决策判断提供支持。
现金流
现金流:在银行的现金,不包括受限制的现金、投资或任何被捆绑的东西。未收到的现金不是现金。
现金管理是CEO的首要任务,他需要知道:
第一,在任何给定时间点有多少流动现金;
第二,未来有多少个月的跑道。
这就暗含了三个要求:
1)减少当下流动现金的占用,增加OpEx,减少CapEx
2)未来现金支出的可预测性
3)环境如果发生变化,未来支出的弹性
自建数据中心
计算、存储、网络、机房等,属于典型固定资产,全是CapEx,对现金流是一次性占用。
资源规划几乎是所有公司存在的痛点,未来需求很难预测:
按顶格规划,会造成巨大浪费;按中间取值准备,当某个时间点任务量激增,就会出现人机不匹配,不是有人力没机器,就是有机器没人力。这种错配导致资源利用率极低,影响研发进度。
不知道什么时候就需要扩建,而且只能加不能减,不需要的时候就是闲置的废铁。
研发云平台
0固定资产,全是OpEx,按需付费,现金流可以根据需要缓慢支出。
未来支出可控制且可预测,我们有科学的估算方法《解密一颗芯片设计的全生命周期算力需求》,专门解决算力资源规划和现金流之间的平衡。配合我们的Auto-Scale功能自动伸缩,随用随关不浪费,资源使用尽量贴合业务
需求曲线。同时,还能在团队内部避免资源错配。
未来资源使用具备弹性,随买随用。有需求时可扩大,需求收缩时可一并收缩,非常灵活。
时间
我们把时间分为两种,一种可以节省的过去时间,一种需要争抢的未来时间。
可以节省的过去时间:
1)硬件采购周期
2)机房建设周期
3)软件功能模块需求评估、供应商选型及评估周期
4)本地研发环境开发、建设、测试周期
自建数据中心 VS 研发云平台
研发云平台是端到端的一整套IC设计研发云环境,包括算力、存储、VPN、VDI、EDA运行环境,且能覆盖整个芯片设计的全生命周期,是已经经过数百家客户实践与验证的成熟产品。比如最近发的这篇燧原案例。
无需硬件采购、机房建设,不需要从零开始进行功能模块需求评估,一家家供应商选型、对接、开发和测试验证兼容性,研发环境可以快速启动。
能节省的过去时间全节省了。
需要争抢的未来时间:
- 1)算力需求高峰期
- 2)项目出现紧急突发需求
- 3)芯片TO前
- 4)研发任务高并发排队等待期间
研发云平台资源随用随开,弹性使用,可以随时满足各种业务突发需求,全球数据中心提供资源充足保障。
自建数据中心,任何变动都需要比较长的周期,几乎不能应对紧急情况。
人
企业人力资源,主要分为管理者、研发工程师、CAD、IT/运维工程师。
先说招聘难度。
成熟有经验有能力的研发工程师和IT/CAD,重金难求。甚至逼得国内半导体公司不得不组建海外研发团队来满足部分需求。
再谈关注点:人力成本和人效。
人力成本
上一点里提到自建数据中心需要的:硬件采购及后期维护,机房建设,软件功能模块需求评估、供应商选型及评估,本地研发环境开发、建设、测试,所有的事情都需要专业的人来完成,需要耗费大量人力成本。
人效
我们的研发云平台不但这些事全都省了,在产品能力之外,还提供从IT到CAD的全方位服务支持。
管理者:释放管理者带宽,关注项目整体效率;
研发工程师:专注研发,任务并发度高,资源适配,提升研发效率;
IT/CAD:底层资源统一管理,屏蔽底层技术细节,全维度IT自动化,提高管理带宽,原来一个人管十台,现在一个人管一百台。
TCO(总拥有成本)
先说一个热知识,我们在云上使用的服务器和本地采购的服务器在物理层面上是一样的,所以两者之间的差异主要是构建在物理实体之上的产品功能模块与服务水平。
当然,对企业来说,最重要的差异在于:使用方式和计费模式。
我们将TCO分成两大类,一类看得见的,一类看不见的。
自建数据中心看得见的成本包括四类:
1)计算、存储、网络等硬件设备成本+硬件维保服务成本
2)机房建设+电费等成本
3)集群调度软件+软件维保服务成本
4)人力成本:软件功能模块需求评估、供应商选型及评估,本地研发环境开发、建设、测试
研发云平台除了计算、存储、网络等硬件设备需要按使用时长付租赁费用以外,其他成本皆为0。我们的集群调度软件Fsched是我们自主研发的,性能与商业调度器完全一致,我们能提供代码级的技术支持。
看不见的成本是由两种截然不同的使用方式带来的。
比如下图某无线通信芯片公司算法团队9个月实际日平均资源用量波动总览图,具有需求不可测、短时间使用量波动巨大等特点。
自建数据中心先建设,后使用。可能出现三种情况:
1)需求高峰期的任务排队等待和项目周期拖延
2)需求低谷时的资源闲置
3)资源错配带来的内部浪费。
而研发云平台按需使用,随用随开,可以做到随资源需求曲线平滑波动,利用率极高,以上情况几乎不存在。
我们是怎么做到的?详情戳:芯片设计五部曲之三 | 战略规划家——算法仿真
研发架构
研发架构,听起来比较抽象,但是是研发型企业的根基之所在。
- 自建数据中心是封闭的,自成一体,或者分成一个个的孤岛。
- 对外界变化的兼容性不强,任何变动都涉及不小的建设工程量。
- 运行情况接近于黑箱,很难获取内部的数据和信息。
研发云平台是开放的统一平台,对现在与未来的兼容性与弹性极强。
资源层的兼容:支持N*本地+N*云的混合云模式,资源使用弹性极大,从0到数万核;
地理位置的兼容:支持N*国内研发中心+N*海外研发中心的全球化协同;
用户层的兼容:不改变用户使用习惯,使用人数具备弹性,可上可下,几人到数百人;
业务层的兼容:覆盖整个芯片设计生命周期,支持多项目组多产品线。
平台内部运行方式是透明的,团队管理者可以监控各个重要指标,从全局角度掌握项目的整体任务及资源情况,为未来项目规划、集群生命周期管理、成本优化提供支持。
比如,半导体企业特别关心的EDA License使用优化功能,可帮助企业用户最大化提升License的利用率,更好地规划License的购买策略,控制整体使用成本。