1.1.3 移动终端芯片发展现状
移动终端芯片或集成电路是移动终端的核心关键器件。移动终端的核心芯片通常包括应用处理器(AP)、基带处理器(BP)、射频模块、电源管理模块以及接口控制模块等[5]。应用处理器支持逻辑处理与计算,随着移动终端智能化发展,为了更好地支持高效智能计算与3D、4K图像及视频处理,应用处理器在传统中央处理器(CPU)的基础上,引入了神经处理单元(NPU)及图形处理单元(GPU)等异构计算模块[6][7]。基带处理器实现通信信号处理功能,射频模块负责信号的收发,电源管理芯片负责元器件的电力供应管理,接口控制模块则负责各种外设接口逻辑控制。
从芯片形态上看,各类处理器与模块可以以独立的形态存在,也可高度集成于一个片上系统(SoC)。由于移动终端对轻、薄的极致追求,以可复用IP核为基础的SoC成为主流的芯片设计技术。但是,SoC对芯片的集成度及制造工艺提出了更高的要求,例如,2020年10月华为公司发布的移动终端SoC芯片麒麟9000采用了5 nm的制造工艺,集成了8个CPU核、3个NPU核和24个GPU核。
CPU主要分为ARM架构和X86架构。ARM架构为32位精简指令集处理器架构(RISC),而X86架构则是由Intel公司设计的复杂指令集处理器架构(CISC)。目前,以低功耗见长的ARM处理器已占据移动芯片市场总销售量的90%以上。从精简指令集体系结构角度看,ARM处理器包括ARMv1~ARMv9等架构;如果从处理器内核角度看,ARM处理器包含ARM7、ARM9、ARM11以及Cortex等架构[8]。两种划分方法的对应关系见表1-1。不同处理器内核架构适用于不同应用领域,例如,Cortex-A系列架构多应用于移动智能终端领域,Cortex-M系列架构多应用于工业控制嵌入式领域,Cortex-R系列架构则多用于对稳定性要求高的领域。
表1-1 ARM架构简介
(续)
由于CPU遵循的是冯·诺依曼架构,架构中大量空间用于放置存储单元(Cache)与控制单元,相比之下计算单元(ALU)只占据了很小的一部分,因此,CPU在进行大规模并行计算方面受到限制,更擅长处理逻辑控制。与CPU相比,GPU是由大量运算单元组成的大规模并行计算架构,专门用于处理多重并行计算任务[9]。近年来,人工智能技术广泛应用,移动应用对于高效移动智能计算的需求激增。因此,NPU已成为中高端移动芯片的标配,其工作原理是在电路层模拟人类神经元和突触,并使用深度学习指令集直接处理大规模的神经元和突触,一条指令完成一组神经元的处理。相比于CPU和GPU,NPU通过突触权重(synaptic weight)实现存储和计算一体化,能够大幅提高智能计算效率。