昨天有同学问我多核CPU和单核的区别大不大,今天简单写一篇回复下吧。大家有其他问题也可以文末给我留言,我会尽量抽时间写文回复。
首先回顾下基本概念,CPU,就是中央处理器,包括运算器和控制器。cpu的主要功能就是“一行一行的执行代码”。所以大家可以把cpu看成是医院的医生诊室,在一定时间内执行一行代码(给一个病人诊断治疗)。
所以单核cpu就是,代码经过前面一系列的前导操作(类似于医院挂号),然后到cpu处执行时发现,就只有一个cpu,大家排队执行。(类似于10个挂号窗口挂号,结果跑到医生那只有一个医生,只能排队等)。
这时候想要提升系统性能,只有两个办法,要么提升cpu性能(让医生看病快点),要么多加几个cpu(多整几个医生)。
多年前英特尔奔腾年代不断提升主频,就是提升cpu性能的思路。那个时候正是我读大学的时候,配电脑就是分析主频,秀操作就是超频。还有人搞什么液氮冷却超频……
后来主频实在玩不下去了,因为随着主频提升对工艺要求,EMI/EMC要求,发热量等要求太高,扛不住了,所以不得不转换思路,开始研究多核这条路了(一个医生已经007了,实在受不了了,不得不多配几个医生了)。
于是乎整起了多核心,多个cpu同步运行指令,这速度就起来了。多核还有两种不同思路,一种叫对称多核心,就是多个核心是完全相同的,譬如4核cortex-a53,这样的4个核心都是同一种内核a53,这种术语叫SMP。还有另一种就是多个核心不一样,譬如stm32mp157,内置2个cortex-a7,1个cortex-m4核心,所以它内部是有a7和m4两种不同类型的核心的,这种术语叫AMP。
一般经常说到的多核问题都是SMP的多核问题,amp这种析构多核大多数人还不太接触。我们今天主要是想说说smp。我从以下几个问题角度来讲一下。
1 多核的效率是单核的倍数吗?
譬如4核A53的cpu,性能是单核A53的4倍吗?理论上是,但是实际不可能,至少有两方面的损耗。
一个是多个核心的其他共用资源限制。譬如内存,你换了4核cpu难道内存也会加4倍吗?譬如cache,4核cpu的cache也是4倍设计吗?譬如寄存器,每个内核的寄存器都是独立的单核倍数设计吗?这就好像医院一样,1个医生换4个医生,但是做B超检查的还是一台机器,性能瓶颈就从医生转到B超检查了,不可能性能提升4倍的。
另一个是多核cpu之间的协调管理损耗。譬如你有4个任务要执行,怎么评论分配给多个cpu核心,避免那种“旱的旱死,涝的涝死”的情况,这就是所谓负载均衡的问题,在支持多核的os调度器设计时要考虑的。譬如多个核心同时运行两个相关的任务,需要考虑任务同步的,这也需要消耗额外性能。
这就好像公司工作一样,一个人的时候至少不用开会浪费时间,自己跟自己商量就行了。两个人就要开会同步工作,协调分配,所以工作效率绝对不可能达到2倍。要是几千几万人呢?那一天工作8小时有6小时在开会,干活时间只有30%不到了。
但是多核心宏观上总是提升了系统总体性能的,这就好像公司,团队人多了对外输出能力总是更强的(管理不失水准情况下)。所以SMP是目前提升系统性能的一种主流思路。
2 多核在编程上有区别吗?
如果你是做操作系统底层开发移植,那么多核和单核是有区别的,这个大家不妨去看看一些SMP SOC的Linux kernel源码就知道了,在我们经常分析的head.S中就有不少处理smp相关的代码。
但是如果你是做应用层开发,那对你来说区别很小了。
现在崇尚大家用多线程编程,也是因为SMP的硬件成为主流了,编程时把工作分开到多个线程中,这样调度器就可以将他们同时调度到多个cpu去运行,就可以提升系统性能,让你感觉到软件运行速度更快了。所以多线程编程要注意同步和临界区问题等,也都是并行运行带来的。