查看: 2942|回复: 0

[评测分享] 【米尔FZ3深度学习计算卡】核心芯片 xilinx XCZU3EG

[复制链接]
  • TA的每日心情
    开心
    3 天前
  • 签到天数: 597 天

    连续签到: 1 天

    [LV.9]以坛为家II

    发表于 2020-11-16 15:08:35 | 显示全部楼层 |阅读模式
    分享到:
    【米尔FZ3深度学习计算卡】核心芯片 xilinx XCZU3EG

    米尔FZ3深度学习计算卡核心芯片是XILINX  ZYNQ  UltraScale+ XCZU3EG
    1.png
    XILINX ZYNQ UltraScale+ 产品属于赛灵思多核心 MPSoC应用处理器,处理器内有两部分,一部分是PS,相当于一颗MPU微处理器,另一部分是 PL,相当于FPGA
    这颗芯片是XILINX  ZYNQ UltraScale+ 产品中的高端芯片,顶级芯片,没有比它更高级的了,如下第三列。第四列是RFSoC射频芯片,重在RF应用,和本芯片使用场景不同。
    2.png
    XILINX ZYNQ UltraScale+  MPSoC内不仅集成了大量的各种专用处理单元(PS),还带有资源最多的FPGA(PL),如下图中间一列:
    3.png
    4.png
    XILINX ZYNQ UltraScale+  MPSoC又分了三小类,XCZU3EG型号属于 EG 类,如下中间一列:
    EG EV 对比,仅仅少了一颗视频编码器,但是PL部分可选资源缺范围大了很多。其实视频编码器是可以用PL实现,所以EG系列相对EV应用场景完全一样。稍后看芯片框架就会发现这一点
    5.png
    EG 系列中的不同型号, PS 部分完全一样,只有PL资源多少的区分,XCZU3EG型号的FPGA 资源相对偏少,除了专业应用需要用到大量FPGA资源,其他使用完全没有问题,算是实用型的。
    6.png
    核心是金属顶盖,内部结构如下图:
    最下面浅绿色是芯片基板,通过锡球和米尔FZ3深度学习计算卡的焊盘连接;
    芯片基板上面的 die 是一颗晶片,就是硅基半导体集成电路,就是IC;通过倒装的方式焊接到芯片的基板上
    Die 的锡球周围浅蓝色的是封装材料,一般是胶,固化后很牢固,结构稳定,又可以向下传导热量
    Die 上面棕色是导热材料,把die 工作时产生的热量向上导出
    最上面黄色的lid heat spreader就是看到的金属顶盖,一般是铜材质的,把中心的热量快速分散开,降低热密度,方便外部散热模块散热。
    金属顶盖是通过周边蓝色的胶,粘合在芯片的基板上。
    这颗芯片的内部结构,和 intel 台式电脑完全一样,一摸一样。只是带有锡球不同
    7.png
    芯片大小 23x23mm,底部有 28x28 个锡球,共 784 个,锡球中心间距是0.8mm
    Pin编号,从标识点开始记作A1 到对角位置 AH28,共 784个编号
    8.png
    784pin脚,其中PS占用 214 个,HD IO  96个,HP IO  156个,PS-GTR 四对共 8个,稍后细说
    9.png
    784pin脚按照bank 划分,bank 24252644 DH iobank 64 6566 HP IObank 500 – 505 PS io,其中的bank 505 PS GRT io
    10.png
    11.png
    12.png
    784pin脚中的电源,地,专用pin脚和多功能pin
    13.png
    14.png
    这颗芯片比较大,pin 比较多,熟悉了pin再看原理图和资料会清晰很多
    看了几遍笔者自己把所有784pin分类汇总整理成以下5类来熟悉,稍后详细说每一类,对应到每个pin编号和名字上:
    1,  PL 端IO,共255个,如表格1-7行
    2,  PS端IO,共256个,如表格8-13行
    3,  PUDC_B是个配置引脚,1个,如表格14行
    4,  电源和地引脚,244个,如表格15行
    5,  NC空引脚28个,如表格16行
    15.png
    以上一共784个引脚,逐行去看:
    bank24252644,共4bank,各有24 IO,一共96IO,全部是 HD IO,低速接口,用户都可以使用。Pin脚编号,和名字如下,一一对应
    16.png
    17.png
    18.png
    19.png
    bank646566,共3bank,每个bank53IO53IO中有差分IO  48个,单端IO  4个,参考电压IO  1个。三个bank一共159IO,去掉3个参考电压IO,用户可用IO  156个,差分144个,单端12个,全部是高性能IOBank65中有4个多功能引脚是复用的
    20.png
    Bank65中有4个多功能引脚是复用的,如下箭头标识:
    21.png
    其中H8H9 可复用为PCIe reset pinH9K9 可复用为IIC接口,R8 可复用为 PMbus alert 中断pin
    22.png
    Bank500501502,共3bank,每个bank26IO,属于PS端复用IO,一共78个。
    23.png
    24.png
    25.png
    Bank503 PS端的配置引脚,如下,一共18
    26.png
    Bank504 PSDDR内存引脚,一共136
    27.png
    28.png
    29.png
    Bank505 PS-GTR 引脚,一共24个, 信号引脚16个,时钟信号8
    30.png
    PUDC_B 引脚一个,是用来配置上电设置的,专用引脚

    电源+地一共244个,其中专用引脚7个,也放在这里面。
    31.png
    32.png
    33.png
    34.png
    35.png
    36.png
    NC 空引脚共28个:
    37.png
    784 pin全部一一看完

    芯片架构图如下:
    38.png
    整颗芯片分成就PS PL 两部分,PS MPU微处理器单元一样,该有的都有,比如四核arm  a53 核心,双核arm  mali-400 GPU,双核arm  R5实时处理器,系统安全管理等单元,和一些外设接口,比如高速接口DP1.2ausb3.0sata3.1 PCIePS-GTR,通用类接口千兆网口,usb2.0接口,can接口,uartspi接口,QSPInandSD/eMMC

    板子上有MIPI接口,BT1120 接口,而PS部分并没有这个接口,那这两个接口都是通过PS部分实现的。

    芯片的PL 部分是一颗FPGA单元可以在上面实现自己的逻辑单元

    再回头看芯片相关资料不容易搞错,比如IO汇总图片,这颗芯片PS端总可用214IO,用户IO中的HD 96HP 156,差分IO中的HD  96HP 144,其实都是同样的96HD io 144IOHP 相差了12IO,是HP 12单端IO,用户可用,又不属于差分IO
    此图表说的IO214 + 96+156 个,并不是 214 + 96+156+96+144个。
    39.png
    HD IO 是用在低速接口上,支持3.3V HP IO 用在对性能有高速要求的接口上,最大只支持1.8V,两种接口特性差别还是挺大的,支持电压也有不同
    40.png
    41.png
    42.png
    43.png
    44.png
    45.png
    46.png
    稍后看开发板系统框架,所有IO都能找到归属,对应到开发板硬件中去

    总结:

    米尔FZ3深度学习计算卡,有 XILINX ZYNQ UltraScale+ MPSoC 顶级芯片加持,PS 端拥有最丰富的功能和顶级性能,同时PL端又非常实用,如果一定找个词来形容他,那就是 - 平民法拉利.







    回复

    使用道具 举报

    您需要登录后才可以回帖 注册/登录

    本版积分规则

    关闭

    站长推荐上一条 /4 下一条

    手机版|小黑屋|与非网

    GMT+8, 2024-11-23 16:30 , Processed in 0.124613 second(s), 17 queries , MemCache On.

    ICP经营许可证 苏B2-20140176  苏ICP备14012660号-2   苏州灵动帧格网络科技有限公司 版权所有.

    苏公网安备 32059002001037号

    Powered by Discuz! X3.4

    Copyright © 2001-2024, Tencent Cloud.