源起
自从2023年初,OpenAI公开发布ChatGPT大模型后,便引爆了AIGC领域。

chatGPT
AIGC(Artificial Intelligence Generated Content,生成式人工智能),被称为是人工智能从1.0时代进入2.0时代的重要标志。

AI产业链框架图,来源:中泰证券
AIGC可应用于各行各业,比如聊天、写作、视频、音频、制图、设计等,甚至可以生成游戏策略和代码。AIGC时代序幕已拉起,AI领域的应用和创业迎来资本的追捧,各大厂商也纷纷布局。

AIGC商业落地产业图谱,图片来源: TE智库《企业AIGC商业落地应用研究报告》
当前,国内的AIGC产业链结构主要由基础大模型、行业场景中模型、业务领域小模型,AI基础设施、AIGC配套服务五部分构成,并且已经形成了丰富的产业链。
AIGC的应用,离不开底层芯片与算力的支撑,因此,对于投资、理财甚至科普,如何理解什么是算力芯片产业,尤为关键。
AI算力芯片
AI的智能化程度是直接由它所能调用的计算资源来决定的。因此,为了衡量计算资源,就有了算力这一概念。算力其实就是计算能力,按《中国算力发展指数白皮书》中的定义:算力是设备通过处理数据,实现特定结果输出的计算能力。
有关算力方面的详细信息,若有兴趣,可参阅作者文章:简单科普:人工智能的算力Tops到底是个什么东西!
那么AI算力芯片行业有哪些机遇和龙头厂商呢?

算力芯片的分类
从技术架构来看,算力芯片主要分为GPU、FPGA以及ASIC三大类(严格意义上,只要是能进行逻辑运算的新欧都可以被称为算力芯片,包括CPU,更详细信息请参阅作者文章:一文,帮你捋顺所有芯片分类!)。

算力芯片
ASIC(Application-Specific Integrated Circuit , 特定应用集成电路)芯片主要应用于深度学习加速,体积小,功耗低,定制化程度高是其主要特征,以 VPU、TPU(谷歌AlphaGo背后的功臣) 为代表。ASIC芯片,能够在某一特定场景、算法较固定的情况下,实现更优性能和更低功耗,可以满足企业对极致算力和能效的追求。我国的ASIC主要企业有寒武纪、蓝旗科技、黑芝麻、地平线、华为、海思、阿里巴巴等。
第一代算力芯片就是ASIC架构的时代。尽管ASIC有着极致的算力和能效,但也存在着应用场景局限、依赖自建生态、客户迁移难度大、学习曲线较长等问题。
FPGA(Field-Programmable Gate Array,现场可编程门阵列)其主要功能也是配合CPU进行加速。它是由一堆可编程逻辑单元(可以是门电路、寄存器、算数单元等等),以及大量可编程互连线构成的。将原本用硬连线实现的数字电路编程软件实现,从而更加灵活可塑。
对于需要频繁修改、更新功能的项目,FPGA比ASIC更加适合。因为,只要通过编程即可实现修改和升级,避免了设计、测试和生产等环节需要重新进行的情况。海外大厂赛灵思和英特尔形成双头垄断。
GPU(Graphics Processing Unit,图形处理器)的计算能力最强,通用性强,可以为深度学习提供良好的加速效果,但是成本高,功耗高。目前GPU市场主要由英伟达、AMD和英特尔三家公司占据,英伟达在GPU领域一家独大,美国很早之前就已限制对华销售最先进,使用最广泛的AI训练GPU英伟达100以及H100。
GPGPU(General-purpose computing on graphics processing units,通用图像处理器)是一种利用处理图形任务的图形处理器,来计算原本由中央处理器处理的与图形处理没有任何关系的任务。在不断迭代和发展中成为AI计算领域的最新发展方向。

GPU、FPGA、 ASIC
GPGPU和GPU的区别:
1、GPGPU负责非图形相关程序的运算,而GPU负责的是图形渲染。
2、GPGPU通常被集成到CPU,而GPU则是作为一个单独的模块,也就是独立显卡核心或者主板集成显卡核心。3、GPU负责图形渲染、图形计算的场景,在玩游戏时GPU的性能至关重要;而GPGPU则是负责一些和图形无关的计算,具体体现在加密解密的速度等等。
其实,如果非要算的话,其实还有一个存算一体芯片,属于尚未非常成熟的新型计算机架构,感兴趣的可以参与作者文章:用人话讲明白,存算一体芯片到底是怎么一回事?
算力芯片的主要用途
根据算力芯片实践目标,可分为训练芯片和推理芯片两类。
训练芯片:用于构建神经网络模型的算力芯片,训练需要高计算性能 (高吞吐率) 、低功耗,更为注重绝对的计算能力。训练芯片主要用于机器学习和深度学习的训练过程。需要通过大量的数据进行学习,以便能够对新的未知的数据进行准确的预测或分类,因此训练芯片需要有强大的并行处理能力,训练芯片还需要有高效的存储器,以便能够快速地访问和更新数据。
推理芯片:主要是利用训练好的神经网络模型进行推理预测,利用输入的新数据来一次性获得正确结论的过程。推理芯片的目标是在已经训练好的模型上执行任务,推理芯片不需要进行复杂的学习过程,其设计重点是在保持高效计算的同时,尽可能减少功耗。因此,推理芯片比较关注低延时、低功耗,对于计算能力要求相对较低。
后记
风口上,猪都可以飞起来,集成电路设备、制造、封测的风口已然过去,整体上已然处于下行周期。但蹭着人工智能的热度,算力芯片及存储芯片细分赛道,倒是依然保持着强劲的势头,大有更上一层楼的态势。

评论留言