格发软件

首页

许可优化

产品

解决方案

服务支持

关于

在线咨询

申请试用

QR-code-company

155-2731-8020

QR-code-self

许可优化

CAD设计软件
CAE仿真软件
PLM产品周期软件
Adobe全家桶

产品

projectHover_1

许可分析

实现专业软件许可精细化管理

projectHover_2

AI分析

让数据分析更简单，决策更智能

projectHover_3

许可调配

合理管控调配许可资源

终端软件管理

终端软件管理和合规性管理共同保障终端安全

多角度管控软件使用权限，保证软件安全性

实用、强大的资产台账管理工具

行业分类

船舶行业

船舶行业

船舶行业

网络行业

网络行业

网络行业

半导体行业

半导体行业

半导体行业

半导体行业

医疗行业

医疗行业

医疗行业

军工行业

军工行业

军工行业

服务支持

服务保障

服务保障

服务保障

软件文章

软件文章

软件文章

产品教程

产品教程

产品教程

技术文档

技术文档

技术文档

关于

关于我们

关于我们

关于我们

试用产品

试用产品

试用产品

合作伙伴

合作伙伴

合作伙伴

品牌标志

品牌标志

品牌标志

apextopmenu

许可优化

许可优化

产品

解决方案

解决方案

服务支持

服务支持

关于

软件

Autocad

二维三维设计绘图软件

Solidworks

三维机械设计建模软件

jiantou

CATIA

高端三维设计制造软件

jiantou

NXUG

集成设计仿真制造平台

jiantou

Alias

曲面造型工业设计软件

jiantou

Altium Designer

Altium Designer

电子电路设计EDA工具

jiantou

Cadence

芯片系统设计EDA平台

jiantou

Matlab

科学计算仿真编程软件

jiantou

Eplan

电气工程设计管理软件

jiantou

NAPA

船舶设计分析软件

jiantou

Ansys

工程仿真分析软件

jiantou

Hyperworks

多学科CAE平台

jiantou

Adams

多体动力学仿真软件

jiantou

Abaqus

有限元分析软件

jiantou

Masta

轴系零部件强度校核软件

jiantou

Hypermill

数控加工编程CAM软件

jiantou

Ansa

有限元前处理软件

jiantou

StarCCM+

流体仿真分析软件

jiantou

Autoform

冲压成形仿真软件

jiantou

ls-dyna

显式动力学仿真软件

jiantou

3DEXPERIENCE

达索协同设计平台

jiantou

Teamcenter

产品生命周期管理软件

jiantou

Windchill

产品数据管理软件

jiantou

Systemweaver

系统工程协作平台

jiantou

Photoshop

图像处理设计软件

jiantou

Illustrator

矢量图形设计软件

jiantou

产品

许可分析

实现专业软件许可精细化管理

jiantou

AI分析

智能分析许可数据，提升使用效率

jiantou

许可调配

合理管控调配许可资源

jiantou

终端软件管理

终端软件管理

终端软件管理和合规性管理共同保障终端安全

jiantou

软件商店

多角度管控软件使用权限，保证软件安全性

jiantou

资产台账

实用、强大的资产台账管理工具

jiantou

解决方案

解决方案

汽车行业

jiantou

船舶行业

jiantou

网络行业

jiantou

半导体行业

半导体行业

jiantou

医疗行业

jiantou

军工行业

jiantou

服务支持

服务支持

服务保障

jiantou

软件文章

jiantou

产品教程

jiantou

技术文档

jiantou

关于

关于我们

jiantou

试用产品

jiantou

合作伙伴

jiantou

品牌标志

jiantou

当前位置：服务支持 > 软件文章 > AI计算为何青睐GPU？

AI计算为何青睐GPU？

阅读数 2106

点赞 0

copyright

article_banner

今天这篇文章，我们继续来聊聊芯片。

在之前的文章里，小枣君说过，行业里通常会把半导体芯片分为数字芯片和模拟芯片。其中，数字芯片的市场规模占比较大，达到70%左右。

数字芯片，还可以进一步细分，分为：逻辑芯片、存储芯片以及微控制单元(MCU)。

存储芯片和MCU以后再介绍，今天小枣君重点讲讲逻辑芯片。

逻辑芯片，其实说白了就是计算芯片。它包含了各种逻辑门电路，可以实现运算与逻辑判断功能，是最常见的芯片之一。

大家经常听说的CPU、GPU、FPGA、ASIC，全部都属于逻辑芯片。而现在特别火爆的AI，用到的所谓“AI芯片”，也主要是指它们。

CPU(中央处理器)

先说说大家最熟悉的CPU，英文全称Central Processing Unit，中央处理器。

CPU

但凡是个人都知道，CPU是计算机的心脏。

现代计算机，都是基于1940年代诞生的冯·诺依曼架构。在这个架构中，包括了运算器(也叫逻辑运算单元，ALU)、控制器(CU)、存储器、输入设备、输出设备等组成部分。

冯·诺依曼架构

数据来了，会先放到存储器。然后，控制器会从存储器拿到相应数据，再交给运算器进行运算。运算完成后，再把结果返回到存储器。

这个流程，还有一个更有逼格的叫法：“Fetch(取指)-Decode(译码)- Execute(执行)-Memory Access(访存)-Write Back(写回)”。

大家看到了，运算器和控制器这两个核心功能，都是由CPU负责承担的。

具体来说，运算器(包括加法器、减法器、乘法器、除法器)，负责执行算术和逻辑运算，是真正干活的。控制器，负责从内存中读取指令、解码指令、执行指令，是指手画脚的。

除了运算器和控制器之外，CPU还包括时钟模块和寄存器(高速缓存)等组件。

时钟模块负责管理CPU的时间，为CPU提供稳定的时基。它通过周期性地发出信号，驱动CPU中的所有操作，调度各个模块的工作。

寄存器是CPU中的高速存储器，用于暂时保存指令和数据。它的CPU与内存(RAM)之间的“缓冲”，速度比一般的内存更快，避免内存“拖累”CPU的工作。

寄存器的容量和存取性能，可以影响CPU到对内存的访问次数，进而影响整个系统的效率。后面我们讲存储芯片的时候，还会提到它。

CPU一般会基于指令集架构进行分类，包括x86架构和非x86架构。x86基本上都是复杂指令集(CISC)，而非x86基本为精简指令集(RISC)。

PC和大部分服务器用的是x86架构，英特尔和AMD公司占据主导地位。非x86架构的类型比较多，这些年崛起速度很快，主要有ARM、MIPS、Power、RISC-V、Alpha等。以后会专门介绍。

GPU(图形处理器)

再来看看GPU。

GPU是显卡的核心部件，英文全名叫Graphics Processing Unit，图形处理单元(图形处理器)。

GPU并不能和显卡划等号。显卡除了GPU之外，还包括显存、VRM稳压模块、MRAM芯片、总线、风扇、外围设备接口等。

显卡

1999年，英伟达(NVIDIA)公司率先提出了GPU的概念。

之所以要提出GPU，是因为90年代游戏和多媒体业务高速发展。这些业务给计算机的3D图形处理和渲染能力提出了更高的要求。传统CPU搞不定，所以引入了GPU，分担这方面的工作。

根据形态，GPU可分为独立GPU(dGPU，discrete/dedicated GPU)和集成GPU(iGPU，integrated GPU)，也就是常说的独显、集显。

GPU也是计算芯片。所以，它和CPU一样，包括了运算器、控制器和寄存器等组件。

但是，因为GPU主要负责图形处理任务，所以，它的内部架构和CPU存在很大的不同。

如上图所示，CPU的内核(包括了ALU)数量比较少，最多只有几十个。但是，CPU有大量的缓存(Cache)和复杂的控制器(CU)。

这样设计的原因，是因为CPU是一个通用处理器。作为计算机的主核心，它的任务非常复杂，既要应对不同类型的数据计算，还要响应人机交互。

复杂的条件和分支，还有任务之间的同步协调，会带来大量的分支跳转和中断处理工作。它需要更大的缓存，保存各种任务状态，以降低任务切换时的时延。它也需要更复杂的控制器，进行逻辑控制和调度。

CPU的强项是管理和调度。真正干活的功能，反而不强(ALU占比大约5%~20%)。

如果我们把处理器看成是一个餐厅的话，CPU就像一个拥有几十名高级厨师的全能型餐厅。这个餐厅什么菜系都能做，但是，因为菜系多，所以需要花费大量的时间协调、配菜，上菜的速度相对比较慢。

而GPU则完全不同。

GPU为图形处理而生，任务非常明确且单一。它要做的，就是图形渲染。图形是由海量像素点组成的，属于类型高度统一、相互无依赖的大规模数据。

所以，GPU的任务，是在最短的时间里，完成大量同质化数据的并行运算。所谓调度和协调的“杂活”，反而很少。

并行计算，当然需要更多的核啊。

如前图所示，GPU的内核数，远远超过CPU，可以达到几千个甚至上万个(也因此被称为“众核”)。

RTX4090有16384个流处理器

GPU的核，称为流式多处理器(Stream Multi-processor，SM)，是一个独立的任务处理单元。

在整个GPU中，会划分为多个流式处理区。每个处理区，包含数百个内核。每个内核，相当于一颗简化版的CPU，具备整数运算和浮点运算的功能，以及排队和结果收集功能。

GPU的控制器功能简单，缓存也比较少。它的ALU占比，可以达到80%以上。

虽然GPU单核的处理能力弱于CPU，但是数量庞大，非常适合高强度并行计算。同等晶体管规模条件下，它的算力，反而比CPU更强。

还是以餐厅为例。GPU就像一个拥有成千上万名初级厨师的单一型餐厅。它只适合做某种指定菜系。但是，因为厨师多，配菜简单，所以大家一起炒，上菜速度反而快。

CPU vs GPU

GPU与AI计算

大家都知道，现在的AI计算，都在抢购GPU。英伟达也因此赚得盆满钵满。为什么会这样呢?

原因很简单，因为AI计算和图形计算一样，也包含了大量的高强度并行计算任务。

深度学习是目前最主流的人工智能算法。从过程来看，包括训练(training)和推理(inference)两个环节。

在训练环节，通过投喂大量的数据，训练出一个复杂的神经网络模型。在推理环节，利用训练好的模型，使用大量数据推理出各种结论。

训练环节由于涉及海量的训练数据，以及复杂的深度神经网络结构，所以需要的计算规模非常庞大，对芯片的算力性能要求比较高。而推理环节，对简单指定的重复计算和低延迟的要求很高。

它们所采用的具体算法，包括矩阵相乘、卷积、循环层、梯度运算等，分解为大量并行任务，可以有效缩短任务完成的时间。

GPU凭借自身强悍的并行计算能力以及内存带宽，可以很好地应对训练和推理任务，已经成为业界在深度学习领域的首选解决方案。

目前，大部分企业的AI训练，采用的是英伟达的GPU集群。如果进行合理优化，一块GPU卡，可以提供相当于数十其至上百台CPU服务器的算力。

NVIDIA HGX A100 8 GPU 组件

不过，在推理环节，GPU的市场份额占比并没有那么高。具体原因我们后面会讲。

将GPU应用于图形之外的计算，最早源于2003年。

那一年，GPGPU(General Purpose computing on GPU，基于GPU的通用计算)的概念首次被提出。意指利用GPU的计算能力，在非图形处理领域进行更通用、更广泛的科学计算。

GPGPU在传统GPU的基础上，进行了进一步的优化设计，使之更适合高性能并行计算。

2009年，斯坦福的几位学者，首次展示了利用GPU训练深度神经网络的成果，引起了轰动。

几年后，2012年，神经网络之父杰弗里·辛顿(Geoffrey Hinton)的两个学生——亚历克斯·克里切夫斯基(Alex Krizhevsky)、伊利亚·苏茨克沃(Ilya Sutskever)，利用“深度学习+GPU”的方案，提出了深度神经网络AlexNet，将识别成功率从74%提升到85%，一举赢得Image Net挑战赛的冠军。

左起：伊利亚·苏茨克沃，亚历克斯·克里切夫斯基，杰弗里·辛顿

这彻底引爆了“AI+GPU”的浪潮。英伟达公司迅速跟进，砸了大量的资源，在三年时间里，将GPU性能提升了65倍。

除了硬刚算力之外，他们还积极构建围绕GPU的开发生态。他们建立了基于自家GPU的CUDA(Compute Unified Device Architecture)生态系统，提供完善的开发环境和方案，帮助开发人员更容易地使用GPU进行深度学习开发或高性能运算。

这些早期的精心布局，最终帮助英伟达在AIGC爆发时收获了巨大的红利。目前，他们市值高达1.22万亿美元(英特尔的近6倍)，是名副其实的“AI无冕之王”。

那么，AI时代的计算，是不是GPU一家通吃呢?我们经常听说的FPGA和ASIC，好像也是不错的计算芯片。它们的区别和优势在哪里呢?

免责声明：本文系网络转载或改编，未找到原创作者，版权归原作者所有。如涉及版权，请联系删

武汉格发信息技术有限公司，格发许可优化管理系统可以帮你评估贵公司软件许可的真实需求，再低成本合规性管理软件许可,帮助贵司提高软件投资回报率，为软件采购、使用提供科学决策依据。支持的软件有: CAD,CAE,PDM,PLM,Catia,Ugnx, AutoCAD, Pro/E, Solidworks 等。

返回上级列表

，获取更多内容

英特尔发布首款PCIe 5.0和CXL功能FPGA，助力客户快速定制技术部署

Achronix与BittWare携手推出VectorPath加速卡，赋能高带宽数据加速应用

相关文章

SiC为何受车企青睐？盘点车企与SiC的深度合作

【材料选择】不锈钢耐用不生锈，为何汽车厂家不青睐？

英伟达AI设计GPU算术电路：超越EDA，更高效

10大机械设计软件对比评测，你更青睐哪一款？

欧特克数字化样机解决方案备受青睐，独占鳌头

HPC高性能计算：4卡GPU服务器推荐

GPU在工程计算中的优势与应用解析

2020回顾：云计算与AI的快速发展

云计算时代：企业为何仍需放弃“一次性买断”模式？

DeepFlame燃烧反应流体计算平台，共建AI时代

EDA的下一项革命：通用、可解释的AI计算硬件设计

华为云赋能行业，释放AI生产力，探索AI落地新路径

NVIDIA发布GV100专业图形卡，赋能AI计算新时代

2025顶配装机方案：4K渲染+AI计算工作站配置

AI大模型时代，软件许可证管理如何适配弹性算力需求？

PCB走线设计：为何避免90度直角？

【计算几何02】Bentley-Ottmann线段交点算法详解

CST2022多物理场耦合安装步骤：含GPU加速计算卡驱动配置

AI诈骗升级，10分钟骗走430万，AI防骗技术如何应对？

AI芯片与传统芯片：差异何在？

技术文档

SiC为何受车企青睐？盘点车企与SiC的深度合作

【材料选择】不锈钢耐用不生锈，为何汽车厂家不青睐？

英伟达AI设计GPU算术电路：超越EDA，更高效

10大机械设计软件对比评测，你更青睐哪一款？

欧特克数字化样机解决方案备受青睐，独占鳌头

HPC高性能计算：4卡GPU服务器推荐

GPU在工程计算中的优势与应用解析

2020回顾：云计算与AI的快速发展

云计算时代：企业为何仍需放弃“一次性买断”模式？

DeepFlame燃烧反应流体计算平台，共建AI时代

EDA的下一项革命：通用、可解释的AI计算硬件设计

华为云赋能行业，释放AI生产力，探索AI落地新路径

NVIDIA发布GV100专业图形卡，赋能AI计算新时代

2025顶配装机方案：4K渲染+AI计算工作站配置

AI大模型时代，软件许可证管理如何适配弹性算力需求？

推荐好文

一招解决CATIA许可不够：开启"许可回收"，用户无感知

Ansys仿真许可模块回收，两家独立策略谁更细

MATLAB许可证浪费大，对比六种优化工具性价比

软件许可证不够用怎么办？试试"许可复用"，一份许可多人干活

NX浮动许可调度策略，对比三种智能分配算法

Ansys仿真许可回收通知机制，三家优劣对比

gotoDetail

武汉格发信息技术有限公司

湖北省武汉市经开区科技园西路6号103孵化器

电话：155-2731-8020 座机：027-59821821

电子邮件：tanzw@gofarlic.com

links

友情链接

格发

发现

终端软件管理

方案

半导体行业

服务

关于

© gofarlic.com 武汉格发信息技术有限公司 - 鄂ICP备18026411号-1 - 鄂公网安备42011302000881号

隐私声明 | 使用条款 | 网站地图

联系我们

武汉格发信息技术有限公司

湖北省武汉市经开区科技园西路6号103孵化器

电话：155-2731-8020 座机：027-59821821

邮件：tanzw@gofarlic.com

发现

终端软件管理

方案

半导体行业

服务

关于

隐私声明 | 使用条款

Copyright © 2023 Gofarsoft Co.,Ltd. 保留所有权利

鲁ICP备14018425号-1 鄂公网安备42011302000881号

遇到许可问题？该如何解决！？

评估许可证实际采购量？

不清楚软件许可证使用数据？

收到软件厂商律师函!?

想要少购买点许可证，节省费用？

收到软件厂商侵权通告!?

有正版license，但许可证不够用，需要新购？

联系方式

board-phone

155-2731-8020

close1

预留信息，一起解决您的问题

* 姓名：

* 手机：

* 公司名称：

姓名不为空

姓名不为空

手机不正确

手机不正确

公司不为空

公司不为空