整理的概念来自寒武纪向上海证券交易所回复的发行股票招股说明书,来自寒武纪是如何与英伟达和华为海思较劲的?的启迪
名词概念解释
| 芯片、集成电路、IC | 集成电路是一种微型电子器件或部件,采用一定的工艺,将一个电路中所需的晶体管、电阻、电容和电感等电子元器件按照设计要求连接起来,制作在同一硅片上,成为具有特定功能的电路。IC 是集成电路(Integrated Circuit)的英文缩写,芯片是集成电路的俗称 |
| 人工智能、AI | Artificial Intelligence 的缩写,计算机科学的一个分支领域,通过模拟和延展人类及自然智能的功能,拓展机器的能力边界,使其能部分或全面地实现类人的感知(如视觉、语音)、认知功能(如自然语言理解),或获得建模和解决问题的能力(如机器学习等方法) |
| 集成电路设计、IC 设计 | 集成电路在制造前的整个设计过程,包括电路功能定义、结构设计、电路设计、电路验证与仿真、版图设计等流程 |
| 智能芯片、人工智能芯片 | 人工智能芯片、智能芯片是专门针对人工智能领域设计的芯片,包括通用型智能芯片与专用型智能芯片两种类型:通用型智能芯片是针对人工智能领域内多样化的应用设计的处理器芯片,对视觉、语音、自然语言处理、传统机器学习技术等各类人工智能技术具备较好的普适性;专用型智能芯片是面向特定的、具体的、相对单一的人工智能应用所设计的专用集成电路 |
| IP | Intellectual Property 的缩写,中文名称为知识产权,为权利人对其智力劳动所创作的成果和经营活动中的标记、信誉所依法享有的专有权利;在本招股说明书中,智能处理器 IP 指智能处理器的产品级实现方案,由核心架构、代码和文档等组成 |
| 加速卡 | 用于加速特定领域应用程序的板卡产品,其核心构成是板卡上的计算芯片,通常通过主机的附加接口(如 PCIE)接入到系统中。常见的加速卡产品有图形加速卡、视频编解码加速卡、人工智能加速卡等 |
| 云端 | 在计算机领域中一般指集中在大规模数据中心进行远程处理。该处理方案称为云端处理,处理场所为云端 |
| 终端 | 相对于云端,一般指个人可直接接触或使用、不需要远程访问的设备,或者直接和数据或传感器一体的设备,如手机、智能音箱、智能手表等 |
| 边缘端 | 在靠近数据源头的一侧,通过网关进行数据汇集,并通过计算机系统就近提供服务,由于不需要传输到云端,其可以满足行业在实时业务、应用智能、安全与隐私保护等方面的基本需求;其位置往往介于终端和云端之间 |
| 生态 | 在计算机领域,生态一般是基于指令集或处理器架构之上的开发工具、开发者以及开发出的一系列系统和应用的统称。生态的繁荣对于该指令集或处理器架构的成功非常重要,衡量生态的指标包括软件工具链及其上层应用的完备性、开发者和用户的数量、应用场景等 |
| 计算能力 | 通常以芯片每秒可以执行的基本运算次数来度量。在执行同一程序时,计算能力强的芯片比计算能力较弱的同类型芯片耗费的时间短 |
| TOPS | Tera Operations Per Second 的缩写,处理器计算能力单位,1TOPS代表处理器每秒钟可进行一万亿次基本运算操作 |
| 数据中心 | 一整套复杂的信息技术基础设施的总称,主要由计算机系统和其它与之配套的设备(例如通信和存储系统)组成,亦包括相关的辅助设备、设施。它为用户提供计算和数据存储、服务器托管等业务,是互联网和云计算业务开展的关键物理载体 |
| SoC | System on Chip 的缩写,中文名称为系统级芯片,指在一颗芯片内部集成了功能不同的子模块,组合成适用于目标应用场景的一整套系统。系统级芯片往往集成多种不同的组件,如手机 SoC 集成了通用处理器、硬件编解码单元、基带等 |
| 定点 | 计算机处理的数值数据多数带有小数,约定所有数值数据的小数点隐含在某一个固定位置上,称为定点表示法,简称定点或定点数 |
| 浮点 | 计算机处理的数值数据多数带有小数,小数点位置可以浮动,称为浮点表示法,简称浮点或浮点数,浮点表示法一般遵循 IEEE 754 标准 |
| 类浮点 | 按照深度学习的数据特征定义的非 IEEE 标准格式的浮点数据类型,比如领域常见的 bfloat16,bfloat19 就是这类数据类型,以及寒武纪自定义的高精度高能效的类浮点数据类型 |
| 训练 | 在机器学习或人工智能领域,通过大量带标签样本,通过一定的方法,得到对应机器学习/人工智能模型参数的过程 |
| 推理 | 在机器学习或人工智能领域,通过已经训练好的模型(模型参数已经通过训练得到),去预测新数据标签的过程 |
| 稀疏理论峰值 | 在神经网络中,存在大量 0(权重或神经元),由于 0 参与乘加运算不影响结果,智能芯片可通过专门的硬件设计跳过 0 的运算。稀疏理论峰值指的是在 0 数目足够且使能这些硬件时,智能芯片所能提供的最大性能 |
| 非稀疏理论峰值 | 在神经网络中,存在大量 0(权重或神经元),由于 0 参与乘加运算不影响结果,智能芯片可通过专门的硬件设计跳过 0 的运算。非稀疏理论峰值是指没有这些跳过 0 的硬件或不使能这些硬件时,智能芯片所能提供的最大性能 |
| INT2、INT4、INT8、INT16 | 进行 2 位、4 位、8 位、16 位定点运算 |
| FP16、FP32 | 进行 16 位、32 位浮点运算 |
| BF16 | 进行 16 位脑浮点运算 |
| IoT | Internet of Things 的缩写,中文名称为物联网,指通过各类信息传感器实时采集物理世界的信息,并通过网络传输信息实现物与物、物与人的泛在信息连接和智能化感知和管理 |
| 指令集 | 处理器芯片可执行的一整套指令的集合,是计算机硬件和软件之间最重要、最直接的界面和接口 |
| TensorFlow | 一种基于数据流编程的人工智能深度学习编程框架,由谷歌人工智能团队开发和维护,被广泛应用于各类人工智能算法特别是深度学习算法的编程实现 |
| PyTorch | 一种开源的 Python 语言机器学习库和框架,由 Facebook 人工智能研究院(FAIR)推出 |
| Caffe | 一种兼具表达性、速度和思维模块化的深度学习框架,由美国加州大学伯克利分校的研究组开发 |
| 晶圆 | 又称 Wafer、圆片、晶片,是半导体行业中集成电路制造所用的圆形硅晶片。在硅晶片上可加工实现各种电路元件结构,成为有特定功能的集成电路产品 |
| 光罩 | 又称 Mask、光掩模、掩模版,是制造半导体芯片时,将电路印制在硅晶圆上所使用的模具。光罩根据芯片设计公司设计的芯片设计版图生产制作,制作完毕后被晶圆制造商用于晶圆生产 |
| 集成电路封装 | 把从晶圆上切割下来的裸片(Die)用导线及多种连接方式引出管脚,并固定包装成为可使用的芯片成品的过程。集成电路封装不仅为集成电路提供了与外部的电气连接,也对其进行物理保护,使芯片具备正常的功能和可靠性 |
| 集成电路测试 | 集成电路晶圆测试、成品测试、可靠性试验和失效分析等工作 |
| 流片 | 芯片设计企业将芯片设计版图提交晶圆制造,并获得真实芯片的全过程。流片可检验芯片是否达到设计预期的功能和性能:如流片成功则可对芯片进行大规模量产,反之则需找出不成功的原因、优化设计并再次流片 |
| OEM | Original Equipment Manufacturer 的缩写,中文名称为原始设备制造商,亦称代工(生产),指品牌拥有者不直接生产产品,而是利用自己掌握的关键的核心技术负责设计和开发产品,控制销售渠道 |
| IDM | Integrated Design and Manufacture 的缩写,中文名称为垂直整合制造(企业),指集成电路设计、晶圆制造、封装测试、销售等环节由同一家企业完成的商业模式 |
| Fabless | 无晶圆厂芯片设计企业(亦指该等企业的商业模式),只从事芯片的设计和销售,而将晶圆制造、封装和测试等步骤分别委托给专业厂商完成 |
| 晶圆厂、Foundry | 晶圆代工厂,指专门负责芯片制造的企业 |
| OSAT | Outsourced Semiconductor Assembly and Test 的缩写,专门从事半导体封装测试的企业 |
| PDT | Product Development Team 的缩写,中文名称为产品开发团队,是一种产品开发的模式、理念与方法 |
| EDA | Electronic Design Automation 的缩写,中文名称为电子设计自动化,是以计算机为平台,融合微电子学科与计算机学科方法辅助和加速电子产品(包含集成电路)设计的一类技术的总称 |
| CMOS | Complementary Metal Oxide Semiconductor 的缩写,中文名称为互补金属氧化物半导体,是制造大规模集成电路芯片的一种常用技术或用这种技术制造出来的芯片 |
| FinFet | Fin Field-Effect Transistor 的缩写,中文名称为鳍式场效应晶体管,是一种新的互补式金氧半导体晶体管,亦指集成这类晶体管的集成电路制造工艺。FinFet 工艺大幅提升了芯片的晶体管密度,显著提高了处理器芯片的性能 |
| PCB | Printed Circuit Board 的缩写,中文名称为印制电路板,又称印刷线路板,是电子元器件的支撑体和电气连接的载体 |
| 深度学习 | 一类人工智能主流算法的总称,可基于海量数据训练具有大量隐含层的人工神经网络模型(即深度神经网络),使其完成图像识别、语音识别等特定的人工智能任务 |
| 神经网络 | 人工神经网络的简称,是计算机科学家受生物脑基本结构启发而提出的一大类人工智能模型的总称,可用于视觉、语音和自然语言处理等广泛的应用领域,让计算机实现类人的感知功能和较为简单初步的认知功能 |
| CPU | Central Processing Unit 的缩写,中文名称为中央处理器,是个人电脑和服务器中的核心芯片,承担通用计算或控制任务 |
| GPU | Graphic Processing Unit 的缩写,中文名称为图形处理器,是个人电脑、游戏设备、移动终端(如平板电脑、智能手机等)中进行图像和图形运算的处理器芯片 |
| DSP | Digital Signal Processing 的缩写,中文名称为数字信号处理,DSP芯片指能够执行数字信号处理任务的芯片 |
| FPGA | Field Programmable Gate Array 的缩写,是一种在硬件层面可编程的芯片 |
| ASIC | Application Specific Integrated Circuit 的缩写,中文名称为专用集成电路,是应特定应用场景需求专门设计和制造的集成电路 |
| MCU | Microcontroller Unit 的缩写,中文名称为微控制单元,是把 CPU、计数器、数模转换等轻量级模块集成到一颗小尺寸芯片上形成的一类小型计算机系统。微控制单元通常仅提供较小的计算能力,仅需处理较少的数据量,广泛应用于物联网行业 |
| TPU | Tensor Processing Unit 的缩写,是 Google 为人工智能机器学习任务定制的智能芯片 |
| NPU | Neural-network Processing Unit 的缩写,中文名称为神经网络处理器,是为加速人工神经网络模型而专门设计的处理器 |
| IaaS | Infrastructure as a Service 的缩写,中文名称为基础设施即服务,指把 IT 基础设施作为一种服务通过网络提供给客户 |
| PaaS | Platform as a Service 的缩写,中文名称为平台即服务,指将软件研发平台作为一种服务提供给用户 |
| SaaS | Software as a Service 的缩写,中文名称为软件即服务,指通过网络提供软件服务 |
| 性能功耗比、能效比 | 计算机系统或芯片能量转换效率的度量,常用指标为单位功耗所能提供的计算能力 |
| DRAM | Dynamic Random Access Memory 的缩写,中文名称为动态随机存取存储器,是一种半导体存储器 |
| 存储器 | 计算机系统中用于存放程序和数据的设备,可根据控制器指定的地址存入和读出信息 |
| DDR | Double Data Rate 的缩写,中文名称为双倍速率,是内存中用于使数据速率倍增的技术 |
| PCIe | Peripheral Component Interconnect Express 的缩写,是一种高速计算机扩展总线标准,最初的版本由英特尔在 2001 年提出,目前广泛应用于 CPU 与协处理器芯片的互联 |
| PCT | Patent Cooperation Treaty 的缩写,中文名称为专利合作条约,是专利领域的一项国际合作条约。依据 PCT 提交国际专利申请后,申请人可同时获得全世界大多数国家申请该专利的优先权 |
| SerDes | 高速串并收发器的英文简称,是一种芯片间高速数据通信的技术 |
| CCLINK | Cambricon Chip-to-chip Link 的缩写,是寒武纪自研的一种芯片间高速互联总线和协议,可支持芯片间快速灵活的信息通讯和数据交换 |
| DFT | Design For Testability 的缩写,中文名称为可测试性设计,DFT在芯片设计阶段加入测试逻辑,使得芯片的测试、调试更加方便快捷 |
| MBIST | Memory Built-in Self Test 的缩写,存储器内建自测试技术,可提供存储器单元或阵列存储器的内建自测试电路,方便问题定位和生成测试向量 |
芯片类型及特征如下:
| 传统芯片 | CPU | ➢ 通用性最强,可执行各种类型的计算机应用程序 ➢ 由控制单元、运算单元和片上存储等部件组成,运算单元占芯片面积比例较小,峰值运算性能有限 ➢ CPU 非常适合传统的控制密集型计算任务,但进行人工智能处理的性能和能效较低 ➢ 人工智能应用开发生态成熟,但性能已无法满足人工智能快速增长的计算能力需求 ➢ CPU 广泛应用于个人电脑、移动终端、传统服务器等领域 ➢ 代表厂商为 Intel、AMD 和 ARM |
| GPU | ➢ 最初为图形显示与渲染等任务专门设计,后逐步拓展至科学计算与人工智能领域,通用性较好 ➢ 为图形处理、科学计算等传统任务提供了良好的硬件支持,但也因此带来了显著的芯片面积开销 ➢ 运算单元占芯片面积比例很大,擅长数据级并行处理,其峰值运算性能高,但整体能耗较高 ➢ GPU 广泛应用于个人电脑、游戏机、工作站等领域;在人工智能领域,GPU 多用于服务器与数据中心,在终端应用较少 ➢ GPU 在云端具备成熟的应用开发生态,但在终端生态尚不成熟 ➢ 代表厂商为 Nvidia、AMD 和 ARM | |
| DSP | ➢ 最初为数字信号处理任务设计,可用于传统的通信和音视频信号处理,常采用 VLIW 指令集 ➢ 编程开发的门槛较高,在云端应用较少,但在手机等终端设备中有一定生态基础 ➢ 代表厂商为 TI、CEVA 和 Cadence 等 | |
| FPGA | ➢ 在 IC 原型验证与仿真中有着广泛应用 ➢ FPGA 包含充裕的可重构逻辑单元阵列,可通过硬件重构方式灵活实现适合于人工智能应用的架构,但其成本和能效与实现相同架构的非FPGA 芯片相比有很大差距 ➢ FPGA 开发和调试门槛较高 ➢ 代表厂商为 Xilinx | |
| 智能芯片 | 通用型智能芯片 | ➢ 针对人工智能领域内多样化的应用设计的处理器芯片,对视觉、语音、自然语言处理、传统机器学习技术等各类人工智能技术具备较好的普适性 ➢ 无需像 CPU 一样支持控制密集型计算任务,或者像 GPU 一样兼顾图形处理与科学计算任务,架构完全针对人工智能处理的实际需求所设计 ➢ 全新指令集完备高效,可覆盖各类智能算法所需的基本运算操作 ➢ 在指令集、处理器架构以及基础系统软件等方面具备较高的技术壁垒 ➢ 性能功耗比较传统芯片优势明显,可适应各种场景和规模的人工智能计算需求 ➢ 与传统芯片生态兼容,降低了程序员的开发难度 ➢ 架构灵活通用,可支撑其在云端、边缘端和消费类电子终端都获得广泛应用 ➢ 代表厂商为寒武纪和 Google(TPU) |
| 专用型智能芯片(ASIC, Application Specific Integrated circuit) | ➢ 面向特定的、具体的、相对单一的人工智能应用所设计的专用 IC ➢ 在架构层面对特定智能算法作硬化支持,指令集简单或指令完全固化 ➢ 常用于在低功耗、成本敏感的终端上支撑特定的智能应用,芯片架构相对简单,技术门槛相对较低 |