人工智能登高一呼,模型生态群山四应—— AIGC策略深度报告

AIGC
后台-插件-广告管理-内容页头部广告(手机)

摘要

AIGC产业技术加速发展,产业链呈现为三层架构。

诸多AI技术累计融合,催生了AIGC的技术变革,使AI工程化门槛不断降低。AI发展周期可以划分为2012年-2018年与2017年至今两个阶段,未来文本、图片、语音等场景将逐步走向成熟,将助推技术向多模态融合发展。AIGC产业链可分为上游基础层、中间技术层、下游应用层三个层级。人工智能赋能产业发展已成为主流趋势,AI将参与到社会建设的千行百业中来,应用场景进一步多元化。

人工智能持续升温,产业进入高速发展阶段。

在政策和市场的共同驱动下,中国乃至全球人工智能市场规模持续扩大。当前人工智能算力持续突破, GPU领域或因算力需求增长受益。人工智能在我国呈现为政策大力支持、商业化应用逐步落地、产业技术加速创新升级的发展趋势,行业发展潜力巨大。依据当下AIGC产业链分布,算力及中间层企业发展机会较大。

许多科技巨头已布局多年,应用“模型+工具平台+生态”三级协同加速产业智能化。

海外玩家中谷歌推出了NLP大模型Bert,微软推出的是chatGPT,二者分别在语言理解类和语言生成类任务上有着更好的表现。国内厂商则主要包括百度、阿里、360、华为等人工智能企业,也有智源研究院、中科院自动化所等研究机构。

风险提示:宏观经济下行;科技转化不及预期;AI商业化进程不及预期;行业竞争加剧的风险。

1.行业梳理

(一)AIGC的概念与内涵 2022年是AIGC爆火出圈的一年,随着AI作画风行一时,chatGPT刷爆网络,不仅消费者竞相追捧AIGC,投资界也积极关注,还被全球各大科技企业竞相追逐。据中国信通院AIGC白皮书定义,AIGC(Al-Generated Content) 即人工智能生产内容,可用于代码生成、文本问答、图像生成等,既是从内容生产者视角进行分类的一类内容,又是一种内容生产方式,还是用于内容自动化生成的一类技术集合。AIGC技术能力根据面向对象、实现功能的不同可分为三个层次: 智能数字内容孪生(可分为智能增强技术和智能转译技术)、智能数字内容编辑、智能数字内容创作。根据Gartner测算,当前生成式人工智能占所有数据产量不到1%,其生成数据渗透率有广阔提升空间,预计至2025年将上升至10%。

(二)AIGC的发展流程 据甲子光年智库分析,人工智能主要包括六大学科,当下业界讨论往往聚焦机器学习这一学科,其在各种领域都具有广泛的应用前景,包括自然语言处理、计算机视觉、电子商务等等。人工智能算法的不断迭代是AIGC发展进步的源动力,诸多AI技术累计融合,尤其是深度学习模型方面的技术创新,催生了AIGC的技术变革,使AI工程化门槛不断降低,有望重新定义生产力。

基础的生成算法模型不断突破创新,Transformer、扩散模型等深度学习的生成算法相继涌现;预训练模型(PLM)引发了AIGC技术能力的质变,2018年以来,预训练语言模型及其”预训练-微调”方法已成为自然语言处理(NLP)任务的主流范式,规模越大的模型不仅在已知任务上有着更好的表现,同时展现出完成更复杂的未知任务的强大泛化能力; 多模态技术推动了AIGC的内容多样性,让其具有了更通用的能力。

据创新工场定义,AI发展周期可以划分为以下两个阶段:

AI的1.0时代(2012年-2018年): 主导逻辑是大数据、小算力、专用决策范式。存在单领域、多模型的限制,数据集、模型碎片化明显、AI泛化能力不足,大多数行业需要花费巨大成本来收集和标注数据以利用AI,从而导致规模不经济。AI1.0缺乏规模化能力来降低应用开发的门槛,打造完善生态链,因此商业化价值较小。

AI的2.0时代(2017年至今): 预训练大模型在无需人工标注的海量数据的学习训练后具有良好的通用性和泛化性,通过微调等方式适配和执行五花八门的任务,能显著降低AI工程化门槛,让其成为自动化内容生产的 “工厂”和“流水线”。GPT-3的出现让大数据、大算力和通用范式成为典型模式,AIGC模型有望逐步达到具有预测、决策、探索等更高的认知智能,真正有望实现平台化的效应,进而探索商业化的应用创新机会。

未来文本、图片、语音、代码等场景将逐步走向成熟,将助推技术向多模态融合发展,五大方向路径分别为:文本到文本AIGC,如大型语言模型聊天机器人ChatGPT;文本到图像AIGC,如谷歌推出的文本到图像的扩散模型Imagen;文本到3DAIGC,如谷歌推出的DreamFusion可以根据给定的文本创建3D模型;音频相关AIGC,如Murf AI推出的人类语音生成器;图像到图像AIGC,如Preferred Networks推出的Crypko可以创作上半身动漫形象。

(三)AIGC的产业分布

AI的七大关键能力为感知、认知、决策、学习、执行、社会协作能力以及符合人类情感、伦理与道德观念,这些能力在进化中逐步扩展累积,逐步“解放大脑”。AIGC的本质是内容与场景的融合,其发展需要AI模型、基础设施、上层应用的相互配合,后端基建,算法、算据和算力三要素耦合共振。

AI全栈技术架构分为三个层级:算力层、平台层和算法层,其中,算法层包括应用层、中间层和基础层或模型层中间层可向下对接大模型能力,向上提供个性化服务,由一批专门负责调整大型模型以适应具体应用需求的初创企业构成。而基础大模型将逐步走向统一,形成寡头格局,开发人员将基于这些基础模型研发AI应用。

目前,AIGC产业生态加速形成和发展,产业链呈现为上中下三层架构,包括上游基础层、中间技术层、下游应用层三个层级。基础层由于预训练模型的高成本和技术投入,因此具有较高的进入门槛,主要参与机构为头部科技企业、科研机构等;中间技术层使模型即服务(MaaS)开始成为现实,预计将对商业领域产生巨大影响;应用层旨在无缝衔接AICG模型和用户需求,以实现产业落地。

2.商业模式

(一)ChatGPT 引入Plugins,大幅拓展应用能力

OpenAI于3月24日发布ChatGPT,即ChatGPT 插件集,插件是专门为以安全为核心原则的语言模型设计的工具,可以帮助ChatGPT访问最新信息、运行计算或使用第三方服务。从OpenAI的等待列表中被邀请的插件开发人员可以为ChatGPT构建一个插件,如由Expedia、 FiscalNote和Instacart等创建的第三方插件,普通用户可以选择自己需要的插件使用。

OpenAI专门为chatGPT开发了两大插件:网络浏览器(Browsing)和代码解析器(Code interpreter)。Plugins引入后,ChatGPT的应用能力将得到极大的扩展,进一步催化至多场景的业务处理能力。开发者想从一小部分用户开始,基于此了解更多信息,逐步推出更大规模的访问,以塑造人机交互范式未来的社区。Browsing实现了ChatGPT的联网能力,可以读取互联网上的最新信息;Code interpreter则实现了用Python代码去解决定性或定量的数学问题,进行数据分析,以及格式转换等。当前,插件还在alpha期间,OpenAI将与用户和开发人员密切合作,对插件系统进行迭代。

插件可以成为语言模型的“眼睛和耳朵”,使它们能够访问非常近期、非常个人或者非常具体而不能包含在训练数据中的信息。在响应用户的明确请求时,插件还可以使语言模型代表用户执行安全的、有约束的操作,从而提高系统的整体有用性。引入插件后的chatGPT影响力将显著提升,生态规模极速扩大,应用层百花齐放。插件的价值可能远远超出现有的限制,从浏览产品目录到预订航班或订购食品,帮助用户使用各种新的用例。OpenAI认为,插件可能会产生广泛的社会影响,他们发现使用工具的语言模型可能会比没有工具的语言模型产生更大的经济影响,并预计当前的人工智能技术浪潮将对工作转换、取代和创造的速度产生重大影响。

(二)开启API收费服务,与微软深度合作,OpenAI商业化进一步推进

2023年3月1日,OpenAI宣布以收费形式开放ChatGPT API和Whisper API(应用程序接口),允许外部公司开发者将ChatGPT集成至他们的应用程序和服务中。宣布之时共有5家公司接入ChatGPT API,分别是Snapchat母公司Snap lnc、全球学习平台Quizlet、日用百货配送公司Instacart、消费者购物软件shop的开发商Shopify以及教育软件Speak的开发商。

OpenAI根据API调用的token(分词)输入和输出总数计费,同时token总数还需低于模型最大限制。新发布的ChatGPT模型其 API收费标准为 0.002美元/1000tokens,与前一代使用模型相同,但比现有的GPT-3.5模型价格便宜了90%。Whisper API是一种语音转换文字(speech to text)模型,可以转写或翻译语音,支持包括英语、中文、阿拉伯语和日语等几十种语言, 现在通过该API提供了large-v2模型,Whisper API的使用费用为每分钟0.006美元。

在订阅渠道,2023年2月1日,OpenAl宣布,推出其人工智能聊天机器人ChatGPT的付费订阅版本ChatGPTplus,每月收费20美元,订阅用户即使在高峰时段ChatGPT也可以正常访问,有更快的响应时间,还可以优先访问新功能。同时OpenAl也继续提供ChatGPT的免费访问。

OpenAI已同意将GPT-3授权给微软用于他们自己的产品和服务。微软作为OpenAI最为重要的合作伙伴和投资人,其旗下产品与OpenAI的相关模型深度融合,在微软的消费者和企业产品中引入新的体验。如搜索引擎结合GPT4的技术,企业服务平台Dynamic 365结合ChatGPT的技术推出Dynamics 365 Copilot,开发者工具Power Platform结合ChatGPT技术推出Power Virtual Agents和AI Builder。微软产品在融合了OpenAI技术后展现出了更优秀的产品性能和市场竞争力,而OpenAI 将利用微软Azure云计算服务提供的算力,以更快地实现AI的突破。微软投资OpenAl扩展合作伙伴关系,一方面为了加强AZure竞争力来对抗云计算领域的巨头亚马逊,另一方面,微软正式推出由ChatGPT支持的最新版本Bing(必应)搜索引擎和Edge浏览器,直接挑战了谷歌的搜索引擎巨头地位。

3.应用场景

基于软件服务、云服务、硬件基础设施等产品形式,结合消费、制造业、互联网、金融、元宇宙与数字孪生等各类应用场景,人工智能赋能产业发展已成为主流趋势。根据艾瑞咨询统计,2022年,人工智能产学研界在通用大模型、行业大模型等促进技术通用性和效率化生产的方向上取得了一定突破。商业价值塑造、通用性提升和效率化应用是AI产业发展战略方向,人工智能将参与到社会建设的千行百业中来。

目前,AIGC已经在多个领域得到广泛应用,如金融、传媒、文娱、电商等,未来应用场景会进一步多元化,如数据科学、医疗、游戏、艺术等。除应用场景的横向扩展外,场景与场景的融合交互也是未来的发展趋势之一,例如“文旅+游戏”、“商业+艺术”等。

根据红杉资本对市场格局的分类,AIGC按不同细分方向应用可分为:

文本领域。是发展最完备的领域,目前在通用的中、短篇写作方面表现还算不错,但通常只被用来生成初稿或对初稿做迭代完善。随时间推移,有望看到更高质量及更长篇的内容,并且针对各垂直领域有特定的优化。

代码生成。如GitHub CoPilot,它能极大提高程序开发者的生产力,也能助力非专业人员编写代码。

图像领域。其应用爆发是新近之事,因为相较文字图像是社交媒体上更受欢迎的分享方式。市面上出现了很多不同审美风格的图像模型,以及编辑和修改生成图像的不同技术。

语音合成。语音合成的应用出现较早,如语音助手Siri,但消费与企业级的应用才刚刚起步,如将来能为电影和播客等高端应用一次性生成与配音演员或主播录音一样不机械、有自然质感的作品。

视频和3D模型领域。这一领域的进步较为缓慢,包括电影、游戏、VR、建筑和实体产品设计等。预计在未来1-2年内,能看到一些基础的3D和视频生成模型。

其它领域。其它许多领域还处于基础模型研发阶段,如音频、音乐到生物与化学领域。

(一)B端应用

2023年3月16日微软发布了AI服务Microsoft 365 Copilot。微软将其内置于Word、PowerPoint、Excel、Outlook、Teams等Microsoft 365应用中,以聊天机器人的形式呈现在办公软件的侧边栏上。同时还可以通过全新产品Business Chat使用,该软件被应用于大型语言模型、Microsoft 365应用以及用户的日历、电子邮件、聊天、文档、会议和联系人,用户可以运用自然语言命令,使其根据会议、电子邮件和相关聊天记录等生成一个进度更新报告。

Dynamic365是微软旗下的企业服务平台,2023年3月9日推出的的Dynamics 365 Copilot结合了ChatGPT相关的AI技术,跨业务功能提供交互式、AI 驱动的帮助,运用于客户关系管理 (CRM) 和企业资源规划 (ERP),可为销售、服务、营销、运营和供应链等跨业务的人员提供支持,例如帮助向客户编写电子邮件回复,创建团队会议的电子邮件摘要,为营销人员提供灵感等。

Jasper旗下有多款产品接入GPT-3 进行商业性文字创作,此外,还有一些企业或平台也将AI引入了产品中,如下表所示:

(二)C端应用

2023年2月8日,由ChatGPT提供支持的全新搜索引擎Bing正式亮相。新Bing在传统的搜索外还有对话窗口,将“搜索+答案+创造+聊天”融为一体,可用类似于ChatGPT的方式,向它提问或是征求它的意见,还可以进行创作。新版Bing在技术和功能上的革新,使其能够更加灵活地满足用户的多样化需求,为用户带来更为智能的使用体验。新版Bing在短期内获得了庞大的用户群体,在超过百万的新版 Bing 预览用户推动之下, Bing 每日活跃用户已突破1亿,在这数百万活跃用户中,大约三分之一是Bing的新用户。此外,微软还在2月22日宣布为移动端发布新版Bing应用程序。

此外,据德勤白皮书分析,基础数据服务受AI商业化落地驱动高速增长,人工智能基础数据服务应用于众多下游场景,但不同下游场景对数据采集类型以及数据标注对象有着各自的差异化需求,自动驾驶当前是人工智能基础数据服务最重要的应用领域,并将在未来继续维系这一地位,自动驾驶AI算法的升级迭代及模型训练数据量的指数级增长,将持续拉动人工智能基础数据服务需求,自动驾驶AI算法的升级迭代及模型训练数据量的指数级增长,将持续拉动人工智能基础数据服务需求。

4.市场应用

(一)市场规模及未来增速

近些年来,在政策和市场的共同驱动下,人工智能持续升温:投融资规模持续扩大,AI领域论文发表量和专利申请量逐年增长,人工智能基础设施蓬勃发展,相关产品和服务持续优化创新,人工智能向着各行各业不断渗透,该产业进入了高速发展阶段。

据IDC统计,2021年全球市场人工智能市场收入规模(含软件、硬件及服务)达850亿美元,IDC预测该市场规模将于2025年突破 2000亿美元大关,2021年-2025年均复合增长率可达24.5%,并预计中国的该市场规模将于2025年突破160亿美元。据德勤预测,2025年世界人工智能市场规模将超过6万亿美元,2017年-2025年均复合增长率可达30%。

(二)算力需求持续增加,有望推动AI服务器放量

自OpenAI于2020年推出GPT-3以来谷歌、华为、智源研究院、中科院、阿里巴巴等企业和研究机构相继推出超大规模预训练模型,包括Switch Transformer、DALL·EMT-NLG、盘古、悟道2.0、紫东太初和M6等,不断刷新着各榜单纪录。当前,预训练模型参数数量、训练数据规模按照300倍/年的趋势增长,继续通过增大模型和增加训练数据仍是短期内演进方向。复杂的深度学习模型往往需要消耗大量的存储空间和计算资源,难以在端、边等资源受限情形下应用。轻量化深度学习成为解决这一挑战的重要技术,包括设计更加紧凑和高效的神经网络结构、对大模型进行剪枝等,从而减少计算量、提升计算效率。

当前人工智能算力持续突破,面向训练用和推断用的芯片仍在快速演进。这主要源于算力需求的驱动,一方面体现在模型训练阶段,根据Open AI数据,模型计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距;另一方面,由于推断的泛在性,使得推断用算力需求持续增长。基于GPU的训练芯片持续增多,面向GPU创新的企业开始发力,出现了摩尔线程、天数智芯等一批专注GPU赛道的初创公司。基于ASIC 等架构云端训练芯片能力提升显著,寒武纪的思元 370、原科技的“邃思2.0”以及百度的昆仑2等相对上一代产品均有3-4 倍以上的算力提升。

而英伟达在GPU领域的强劲实力使其成为HPC(超大规模数据中心和高性能计算)需求增长的受益者。NVIDIA A100 Tensor Core GPU可针对AI、数据分析和HPC应用场景,在不同规模下实现出色的加速,有效助力更高性能的弹性数据中心。A100的性能比上一代产品提升高达20倍,并可划分为七个GPU实例,以根据变化的需求进行动态调整。A100提供40GB和80GB显存两种版本,A100 80GB将GPU显存增加了一倍,并提供超快速的显存带宽(每秒超过2万亿字节 [TB/s]),可处理超大型模型和数据集,为数据中心提供了强大的端到端AI和HPC平台。

(三)国内市场前瞻

随着信息通信技术的高速发展,中国乃至全球的数据规模都将迅猛增长。据IDC统计,中国数据规模将从2021年的18.51ZB增长至2026年的56.16ZB,CAGR为24.9%,增速位居全球第一。数据是AI模型开发和迭代的基础,是推动产业智能化发展的重要资源。大规模的可用数据,为人工智能深度学习带来巨大助力。企业应将大数据机遇转化为发展红利,打通数据壁垒,实现数据汇聚,进而提升商业价值。

人工智能技术在我国呈现为政策大力支持、商业化应用逐步落地、产业技术加速创新升级的发展趋势,该行业蕴藏着庞大的发展潜力,市场前景十分广阔。从2015年以来,人工智能先后被写进“十三五”、“十四五”国家发展规划纲要,国家持续推动人工智能产业发展,积极布局产业新规划,给予该行业很大的增长动力与长期保障,人工智能政策红利日益凸显。根据2017年国务院《新一代人工智能发展规划》所制定的战略目标,到 2025 年,核心产业规模应超过4000亿元,带动相关产业规模超过5万亿元。

目前中国正加速推进5G基站、人工智能等新型基础设施建设,其中AI芯片是支撑人工智能技术和产业发展的关键基础设施之一,未来将催生大量高端芯片、专用芯片的需求,正向促进AI芯片、深度学习等相关产业的技术突破与应用发展。近些年,中国人工智能行业整体呈快速发展趋势,产业规模持续增长,AI逐渐渗透进各行各业中,行业大环境持续向好。据艾瑞测算,2022年中国人工智能产业规模达1958亿元,年增长率7.8%,整体平稳向好,预计2027年人工智能产业整体规模可达6122亿元,2022年-2027年的相关CAGR=25.6%。

5.产业链分析

当下一级市场中AIGC企业按技术架构下的产业链分布来看,算法层竞争度高,算力层竞争度小。算法层中又以基础层和应用层企业居多,中间层企业较少,中间层企业未来机会空间较大。其中,大厂较多布局算力层、算法层的基础层和平台层的模型生产和训练等,聚焦高投入、大算力需求、大数据量级、通用能力好的环节。中间层、应用层和平台层的数据平台环节所需投入少、算力需求不高、数据量级要求低,未来可能会涌现出很多中小企业。

(一)算力层

包括AI芯片及处理器、AIDC智算中心和AI传感器。算力层投资价值体现为:由于数据规模和模型复杂度增速远超算力增速,当前AIGC对算力的需求指数级增长,算力供需已经失衡,需求拉动下成长空间较大;新计算产业已成为中国数字经济发展的必由之路、重中之重,受政策鼓励扶持,具有战略价值;相比于大模型投入成本低;专业性壁垒高;具有先发优势:先发布属于填补空白,突破卡脖子,社会效应高。

AI芯片根据所在服务器在网络中的位置可以分为云端AI芯片,边缘及终端AI芯片,云端芯片侧重训练,边缘+终端层芯片侧重推理,这两类芯片均具有较高成长空间。训练AI芯片代表企业有:NVIDIA、寒武纪、摩尔线程和壁仞科技等,推理AI芯片代表企业有:NVIDIA、Google、Intel和寒武纪等。

(二)平台层

包括模型生产、训练平台和数据平台,其中数据平台又包括数据采集、数据清洗、数据标注、数据合成和数据溯源。根据IT技术人员重要性调研反馈,数据处理与应用环节更为值得投资机构的关注。代表企业有:百度、阿里和华为等。

(三)中间层

中间层预期未来将涌现一批初创企业,专门负责调整大型模型以适应具体AI应用需求,提供更精准化、更专业的预训练模型并反哺给大型模型。中间层属于蓝海市场,成长空间大,有专业性、深度进入壁垒;先训练、先迭代,具有一定容错率。中间层普遍具有数据飞轮效应,更多数据可以训练出更好的模型,吸引用户从而产生更多用户数据用于训练,形成良性循环。

从现有中间层的AIGC企业分布情况来看,企业布局主要聚焦智能机器人、计算机视觉应用、智能交互、机器人操作系统、chatBOT等方向,在内容生成、推荐引擎、机器学习应用、知识图谱、机器翻译等领域布局较少,未来潜力较大。

6.海外玩家

(一)谷歌

2023年3月21日,谷歌正式宣布开放Bard的访问权限,其采用了先进的深度学习算法,具有包括翻译、摘要等在内的一系列能力,并由大量文本提供支持。Bard暂时只能进行英文对话,编程功能暂不可用,在生成内容的形式方面Bard能一次性创建几个不同的版本,供用户从中择优选用。

2023年3月6月谷歌推出大型视觉语言模型PaLM-E。通过PaLM-540B语言模型与ViT-22B视觉Transformer模型相结合,PaLM-E最终的参数量高达5620亿。作为一种多模态具身视觉语言模型(VLM),PaLM-E不仅可以理解图像,还能理解、生成语言,甚至将二者结合起来,处理复杂指令。文本功能方面,PaLM-E是一个仅有解码器的LLM,在给定前缀或提示下,能够以自回归方式生成文本补全。图像功能方面,经过单个图像提示训练,PaLM-E不仅可以指导机器人完成各种复杂的任务,还可以生成描述图像的语言。PaLM-E展示了前所未有的灵活性和适应性,代表着一次重大飞跃,特别是人机交互领域。

ChatGPT和BERT都属于Transformer模型的变体,但它们之间还存在着一些关键的差异。ChatGPT使用的是transformer的Decoder结构,在模型训练时,GPT模型从左到右依次生成被预测词,只能看到被预测词前面的词而无法看到被预测词后面的词。因此GPT在语言生成类任务上有着更好的表现,例如机器翻译,文本生成等。与此相反,BERT使用的是transformer的Encoder结构,采用双向 Transformer 结构进行预训练,能够对单句或双句文本进行建模,模型能够根据被预测词的上下文语义信息预测出中间词出现的概率。因此BERT更加擅长语言理解类的任务,如文本分类,实体抽取,情感判断等。在训练数据方面,BERT采用预先训练和微调两个阶段来学习通用的文本表示并将其应用于特定的NLP任务,而ChatGPT则通过大量输入更广泛的文本来学习文本表示。

(二)微软

2023年3月9日微软推出Dynamics 365 Copilot,为各项商业应用全面引入互动式的人工智能助手,通过整合CRM和ERP系统,帮助客户从各个业务层面加速创新和增加营收,提升员工、客户体验及运营效率。2023年3月16日微软发布了AI服务Microsoft 365 Copilot。Copilot是将大型语言模型GPT-4内建到Microsoft 365。在程序里面可以用非常口语化的方式使用AI,还可以通过各个程序的配合,达到预期效果,开启全新工作方式。3月16日微软还推出了Power Platform Copilot,基于GPT能力让制作者用自然语言描述想要的应用、流程或机器人,在几秒内完成创建并提供改进建议。

(三)Meta

2023年2月25日,Meta官网公布了一个新的大型语言模型 LLaMA(Large Language Model Meta Al)。从参数规模来看,Meta提供有70亿、130亿、330亿和650亿四种参数规模的 LLaMA 模型,并用20种语言进行训练,且具有以下特点:参数规模小,对算力要求低;训练数据多;AI能力出众,在逻辑推理等方面优于GPT-3,在代码生成方面优于LaMDA和PaLM。

7.国内玩家

大模型生态涉及底层服务支持、算法平台以及行业应用,厂商主要包括百度、阿里、商汤、华为等人工智能企业,也有智源研究院、中科院自动化所等研究机构,许多科技巨头已布局多年。其中百度早在2019年3月发布预训练模型ERNIE 1.0,2021年12月鹏城实验室与百度联合发布了大模型ERNIE 3.0 Titan,2023年3月推出了文心一言(ERNIE Bot);2021 年4 月,华为发布盘古大模型;2021年7月,澜舟科技推出了孟子大模型;2021年9月,中科院自动化所打造了大模型“紫东太初”;2021年11月,商汤科技和上海人工智能实验室等发布了书生(INTERN),2023年3月推出了书生(INTERN)2.5;2022年4月,清华大学和阿里达摩学院等合作设计了大模型“八卦炉”;2022年4月,腾讯对外披露混元大模型;2022年9月,阿里发布通义大模型系列。

大模型增强 AI 技术的通用性,让开发者以更低成本、更低门槛,面向场景研发更好的 AI 模型,助力普惠 AI 的实现。基础大模型得到大规模产业应用并成为产业基座不仅需要有与场景深度融合的大模型体系,还需要有支持全流程应用落地的专业工具和平台,还需要开放的生态来激发创新;“模型+工具平台+生态”三层之间交互赋能,才能形成良性循环的产业智能化生态共同体,也更容易借助长期积累形成竞争壁垒。

(一)百度

百度率先在2019年3月发布预训练模型ERNIE1.0,持续投入大模型的技术创新与产业应用,布局了NLP、CV、跨模态等大模型,率先提出行业大模型,构建大模型工具与平台,探索产品与社区,在企业端和用户端均有不同程度的突破。

在近年的大模型技术探索与产业实践中,百度文心形成了支撑大模型产业落地的关键路径,构建文心大模型层、工具平台层、产品与社区三层体系:建设更适配场景需求的基础、任务、行业三层大模型体系,提供全流程支持应用落地的工具和方法,孵化基于大模型的任务系统与创新产品,营造激发创新的开放生态。

目前,文心大模型已经建设了36个大模型,其中基础大模型包含:NLP(自然语言处理)大模型、CV(计算机视觉)大模型、跨模态大模型,任务大模型包含对话、搜索、信息抽取、生物计算等多个典型任务,行业大模型包含与来自8个行业的头部企业或机构共建的11个行业大模型。

(二)科大讯飞

在ChatGPT引发的AI技术新一轮热潮背景下,讯飞基于认知智能全国重点实验室,已在核心算法、行业数据、算力支撑及团队组建等方面建立了优势保障。

核心算法方面,已将Transformer深度神经网络算法广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平。

数据积累方面,讯飞在多年认知智能系统研发推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据。

算力支撑方面,讯飞在总部自建有业界一流的数据中心,为大模型训练平台建设奠定了很好的硬件基石。此外,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。

行业应用方面,讯飞计划采用“1+N”架构,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本,以进一步提高大模型在细分行业的实用性。

(三)360

作为一家搜索引擎厂商,360在发展人工智能大语言模型上具备数据获取和处理的工程化能力、人工知识训练、场景三大核心优势,将坚持“两翼齐飞”战略,先占据场景,同步发力核心算法技术。360大模型战略在To C端,将推出新一代智能搜索引擎,并基于搜索场景推出人工智能个人助理类产品;在To SME端,将基于生成式大模型推出SaaS化垂直应用,以解决中小微企业数字化转型难题;在To G&To B端,360已将核心数字安全能力融入安全AI模型,计划结合数字安全业务推出企业私有化AI服务,满足客户对私有知识、资产的索引需求。

(四)阿里巴巴

2021年,阿里巴巴达摩院先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破,引领了中文大模型的发展。尤其是达摩院团队使用512卡V100 GPU即实现10万亿参数大模型M6,同等参数规模能耗仅为此前业界标杆的1%,极大降低了大模型训练门槛。

2022年9月,阿里巴巴发布通义大模型,通义构建了国内业界首个AI统一底座,并打造了大小模型协同的层次化人工智能体系,将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。同时,以统一底座为基础,达摩院构建了层次化的模型体系,其中通用模型层覆盖自然语言处理、多模态、计算机视觉,专业模型层深入电商、医疗、法律、金融、娱乐等行业。

2023年4月7日,阿里云宣布了通义千问的人工智能,该服务被描述为“通过大型语言模型 (LLM) 专门针对人类命令的生产力助手和创意生成器”。它使用类似于ChatGPT的机器学习模型进行训练,可以回答复杂的问题,创建详细的文章,甚至编程。

(五)腾讯

2022年4月,腾讯首次对外披露了混元AI大模型,其先后在跨模态检索领域实现大满贯、CLUE自然语言理解分类榜及 CLUE 总榜登顶,又在多模态理解领域国际权威榜单 VCR中取得第一。2022年12月,腾讯混元又迎来全新进展,推出国内首个低成本、可落地的万亿NLP大模型,并再次登顶CLUE。

目前,混元AI大模型已经广泛应用于腾讯微信搜索、腾讯广告等业务场景,提升了搜索体验和广告推荐精准度。随着研究的进一步完善和业务实践的不断深入,未来将赋能更多业务场景,帮助精准理解用户需求,更好地服务用户。腾讯混元AI大模型的跨模态、多模态能力也成为了开发类ChatGPT的重要基础。据36氪报道,腾讯针对类ChatGPT对话式产品已成立“混元助手(HunyuanAide)”项目组,该项目组将联合腾讯内部多方团队构建大参数语言模型,其目标是“通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能大助手”。

(六)华为

2021年4月,华为云盘古大模型正式对外发布。其中盘古NLP大模型是业界首个千亿参数的中文预训练大模型,在CLUE打榜中实现了业界领先。为了训练NLP大模型,团队在训练过程中使用了40TB的文本数据,包含了大量的通用知识与行业经验。而盘古CV大模型,在业界首次实现了模型的按需抽取,动态范围可根据需求,覆盖特定的小场景到综合性的复杂大场景;提出的基于样本相似度的对比学习,实现了在ImageNet上小样本学习能力业界第一。从立项之初,盘古大模型就已开展了一系列产业合作,该大模型已经在100多个行业场景完成验证,包括能源、零售、金融、工业、医疗、环境、物流等等。盘古大模型产业化过程中逐渐表现出精度提升、效率加强、开发成本下降等特点。华为云盘古大模型致力于做好行业应用,形成关键技术壁垒,为煤矿、电力、金融、农业、国家云创造产业价值。

(七)寒武纪

从2018年至2021年开始,寒武纪基本保持着每年推出一款AI芯片的节奏,至今发展出了远端智能芯片及加速卡、边缘智能芯片及加速卡两大AI芯片业务。寒武纪也在加快推动商业化落地,谋求“自主造血”能力。

风险提示

宏观经济下行;科技转化不及预期;AI商业化进程不及预期;行业竞争加剧的风险。


证券研究报告
《人工智能登高一呼,模型生态群山四应——AIGC策略深度报告》
对外发布时间:
2023年4月19日
报告发布机构:
长城证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)
本报告分析师:
汪毅 S1070512120003 yiw@cgws.com

长城证券研究院市场策略研究团队:

汪毅,李烨,王小琳

最新的市场策略观点,最新的月度股票组合,最新的机构观点汇总,欢迎关注长城宏观策略!

长城研究--宏观策略

特别声明:

《证券期货投资者适当性管理办法》、《证券经营机构投资者适当性管理实施指引(试行)》已于2017年7月1日起正式实施。通过新媒体形式制作的以上推送信息仅面向长城证券客户中的专业投资者及风险承受能力为稳健型、积极型、激进型的普通投资者。若您并非上述类型的投资者,请取消阅读,请勿收藏、接收或使用以上推送中的任何信息。

因此受限于访问权限的设置,若给您造成不便,烦请见谅!感谢您给予的理解与配合。

免责声明:

长城证券股份有限公司(以下简称长城证券)具备中国证监会批准的证券投资咨询业务资格。

以上推送信息摘自长城证券已发布的研究报告,完整内容请以长城证券已发布的研究报告为准。

研究报告由长城证券向专业投资者客户及风险承受能力为稳健型、积极型、激进型的普通投资者客户(以下统称客户)提供,除非另有说明,所有研究报告的版权属于长城证券。未经长城证券事先书面授权许可,任何机构和个人不得以任何形式翻版、复制和发布,亦不得作为诉讼、仲裁、传媒及任何单位或个人引用的证明或依据,不得用于未经允许的其它任何用途。如引用、刊发,需注明出处为长城证券研究所,且不得对研究报告进行有悖原意的引用、删节和修改。

研究报告是基于本公司认为可靠的已公开信息,但本公司不保证信息的准确性或完整性。研究报告所载的资料、工具、意见及推测只提供给客户作参考之用,并非作为或被视为出售或购买证券或其他投资标的的邀请或向他人作出邀请。在任何情况下,研究报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用研究报告中的任何内容所引致的任何损失负任何责任。

长城证券在法律允许的情况下可参与、投资或持有研究报告涉及的证券或进行证券交易,或向研究报告涉及的公司提供或争取提供包括投资银行业务在内的服务或业务支持。长城证券可能与研究报告涉及的公司之间存在业务关系,并无需事先或在获得业务关系后通知客户。

长城证券版权所有并保留一切权利。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。