C-SKY®嵌入式CPU之CK860/CK860MP——面向机器视觉/人工智能等应用的超高性能计算引擎


CK860是杭州中天微系统有限公司自主开发的面向机器视觉、人工智能等领域的超高性能CPU核产品,它以先进的指令架构与流水线技术在控制性能、计算性能、频率等方面达到业界领先水平。CK860基于C-SKY V2自主指令架构与16/32位可变长指令系统,支持面向图像、神经网络算法、视音频等加速的AI加速指令集扩展。单核CK860采用先进的9-12级超标量流水线技术与乱序猜测执行框架,具有高主频、高单位性能、高功耗效率等优点;CK860支持2-4个同构多核,支持AXI 4.0的主/从设备接口;此外,CK860配有128位数据位宽的AI计算引擎,支持半精度浮点/单精度浮点/字节/半字/字的SIMD计算。CK860系列嵌入式CPU包括基础核CK860、针对计算机视觉和人工智能算法加强的CK860A、以及多核产品CK860MP等。


CK860单核主要技术特征

  • 精简指令架构,32位数据,16/32位可变长指令;

  • 单位性能4.1DMIPS/MHz;

  • 超标量架构,支持3指令译码、4指令分发与5指令发射;

  • 9-12级的深流水线技术;

  • 强大的混合分支处理技术,支持分支方向、分支地址、函数返回地址与间接跳转地址的预测;

  • 基于物理寄存器的重命名机制;

  • 静态指令发射单元,支持指令动态投机发射;

  • 快速指令退休能力,支持多达9条指令同时退休;

  • 双发射、乱序的存储载入技术;

  • 多通道、多模式的数据预取技术;

  • 哈佛结构L1 Cache + 共享L2 Cache的存储子系统;

  • AXI4总线架构;

  • 支持IEEE754-2008的浮点计算单元,支持半精度/单精度/双精度浮点运算;

 

AI计算引擎主要技术特征

  • 支持128位数据宽度的矢量运算;

  • 支持半精度浮点格式,可支持8组半精度浮点数的并行计算;

  • 完整支持字节的并行计算,可支持16组字节数据的并行计算;

  • 支持单精度/双精度/半字/字的矢量计算;

  • 支持L2 Cache以及AXI 4.0协议的从设备接口,极大的优化了存储器访问延时;


CK860多核主要技术特征

  • 支持2-4核同构多核;

  • AXI4.0的从设备接口,用于实现IO device的数据一致性;

  • 紧耦合的 L2 Cache,支持128KB~1M可配,可选的ECC和奇偶校验机制;

  • 共享内存架构,支持多bank的L2 Cache提高L2的访问带宽和snoop的并行性;

  • 集成片上中断控制器和计时器,支持多核调试功能。


CK860主要技术参数

CK860的应用领域

  • 机器视觉;

  • 智能监控;

  • 车载导航;

  • 移动智能信息终端;


CK860结构与设计特点

CK860面向高性能计算进行体系结构设计优化,设计有9-12级整形流水线。取指单元设计了bimode分支方向预测器、分支目标地址缓冲器、返回地址预测器、间接分支跳转预测器等融合的混合分支预测器并配有循环指令缓冲器;发射单元设计有5个支持乱序发射的指令队列,对应两条独立ALU流水线、分支流水线和两条并行的Load/store流水线。Load/store流水线允许一条Load指令和一条Store指令的的完全乱序执行。CK860设计有多种模式、多个数据流的数据预取引擎,对于图像处理、视频处理和人工智能算法处理具有出色的加速效果。

CK860支持L2 Cache以及AXI 4.0主设备接口。同时支持AXI 4.0从设备接口,允许DMA在DDR等慢速内存与L2 Cache之间快速搬运数据,该技术对于CPU与内存之间进行神经网络配置参数/图像/视频等大数据的同步,优化CPU的高性能计算效率具有非常好的优化效果。

CK860支持AI计算引擎,尤其支持了半精度的矢量计算,这对于深度学习算法/人工智能算法具有非常显著的加速效果。



CK860支持多核高性能并行处理,CK860MP可支持1-4CK860核协同工作,处理器使用CIU单元实现多核数据存储的高效一致性。CK860MP可运行主流SMP操作系统。