在语音语义识别技术发展的前几年,大家应该对智能音箱的变种智慧屏不陌生。作为语音技术落地的载体之一,智慧屏理应迎来高光时刻,然而弱智的理解能力让这样的产品最终沦为鸡肋。而今,随着AI大模型的发力,智慧屏才真正得以显威。本期视频我们将拆解百度推出的一款搭载文心大模型的智能屏——小度智能屏X9 Pro。
小度智能屏X9 Pro相当于几种产品的集合体。在硬件上,它能实现智能音箱、监控摄像头、平板等功能;而在系统软件层面,它有AI口语、AI阅读、AI画画等功能,可以说既是一个家庭控制监控产品,又是一个娱乐交互产品。这样一个多功能的产品,内部的硬件方案是怎样的?
拆解
通过拆解发现这个智能屏的结构相对比较简单,内部空间利用率不高。正面是一块8英寸的屏幕以及扬声器的开孔;顶部有一个支持云台和上下调节的一个摄像头,云台通过步进电机实现控制,支持灵活旋转,可视角度有360度;底部则是扬声器以及相应的音腔构造布局。
智能屏内部只有一块主板,并且背面布局的都是一些连接器接口座,而芯片基本都布局在正面。
PCB板子上的核心芯片是联发科4核Arm Cortex-A35 SoC(MT8167A),集成WiFi/BT,性能不怎么样,重点是集成度高,省去了额外的无线芯片。SoC旁边是金士顿的两颗512MB DDR3(D2516ECMDXGJD,总共1GB运存)以及江波龙32GB eMMC(FEMDNN032G-A3A55),所以从基本硬件看,这个智能屏的配置相当低。
摄像头云台电机驱动控制是通过拓尔微步进电机驱动IC(TMI8150B)实现。
SoC配套的电源管理芯片为联发科的MT6392A。
顺芯半导体音频ADC(ES7243E)实现麦克风采集的模数转换。
晶豪科技立体声D类音频放大器(AD52058)用于扬声器音频放大输出。
整个硬件方案的主要元器件如下表所示:
厂商 | 型号 | 说明 |
联发科 | MT8167A | 4核Arm Cortex-A35 SoC,集成WiFi/BT |
金士顿 | D2516ECMDXGJD | 512MB DDR3 |
江波龙 | FEMDNN032G-A3A55 | 32GB eMMC |
联发科 | MT6392A | 电源管理芯片 |
拓尔微 | TMI8150B | 步进电机驱动IC |
顺芯半导体 | ES7243E | 音频ADC,模拟转数字 |
晶豪科技 | AD52058 | 立体声D类音频放大器 |
小结
拆解完小度智能屏,说实话,硬件方案有点让人失望,感觉像是用一堆库存料做了个产品,配置比较低端,唯一亮点是给它接入了文心一言大模型。因此我们不难发现目前边缘端设备运行AI大模型主要还是靠云端的算力,对边缘计算的要求不高,另一方面也说明目前缺少先进制程的国产芯完全没问题,低端硬件方案照样可以实现运行AI大模型的自由。