海外发展:现阶段海外大模型发展领先,GPT4已呈现出色的内容生成与交互能力,Google、Meta等也已发布相关产品,预计将带来可观的增量市场与效率提升,已给相关应用(微软、彭博等)带来巨大变化,预计相似的变革也将在国内发生。
国内大模型:国内成熟大模型落地具备较好的条件:业内已有相对成熟的方法路径(Transformer等)、大模型(GPT2、 Meta-LLaMA等)及相关数据基础,而芯片短期看并未成为发展限制,百度、阿里、字节、华为、腾讯等巨头均加速布局,百 度、阿里、商汤发布大模型且迭代进展迅速,预计国内GPT3级模型或在不久的将来出现,对国内产业链形成巨大影响。
应用场景展望:考虑现阶段国内大模型未完全成熟,因此更多是借鉴海外路径演绎国内发展。目前看海外应用端已经百花齐放,办公、搜索、教育、对话社交、游戏、金融、电商、图片视频等领域已出现大量产品创新,GPT plugin插件推出后相关产品和场景有望进一步扩展。
01
GPT带动AIGC技术革命
AIGC市场机会
1.1
GPT拉开生产力革命序幕
ChatGPT引发巨大关注。
2022年11月30日,OpenAI推出人工智能大语言模型产品ChatGPT,能根据用户的文本输入,产生相应的智能回答,能进行多轮对话与反馈,支持各领域知识场景与多语言内容,其综合语言处理能力接近真人而处理效率显著更高,ChatGPT产品发布以来引发巨大关注,上线两个月后月活突破1亿,日活用户超1200万。
GPT相关技术有望拉开文本信息处理的生产效率革命。
语言文本处理是人类世界最重要的工作内容之一,每年全球投入大量的人员和资源用于处理各种语言文本以协调社会分工,如果AI能够协助人类大幅提升语言文本处理效率,将带来巨大的生产力效率提升。
算力、数据、模型方法等底层要素的持续进步是ChatGPT发展的重要基础与驱动。
算力提升:大规模深度学习模型的参数和数据量大幅提升,如GPT-3大模型包含1750亿参数,如果采用单片V100需要训练超过300年。而近年AI算力技术持续进步是大模型发展重要先决条件,英伟达CEO表示过去十年,通过提出新处理器、 新系统、新互连、新框架和算法,并与数据科学家、AI 研究人员合作开发新模型,已使大语言模型的处理速度提高 100万倍(英伟达财报会议)。
数据积累:随着数字时代的到来,生成数据的工具和软件愈发普遍,数据总量呈指数增长,可供AI训练的数据质量和数量均有很大提升,ChaGPT训练数据超过45TB。
模型方法:GPT-1、GPT-2、GPT-3版本持续优化,迭代到GPT3.5( ChatGPT的模型 ) 已在自然语言理解和内容生成上取得极大性能提升,后续GPT4在参数、语料与能力进一步提升。
1.2
AIGC产业链概览
产业链角度,可分为算力层、大模型与垂直细分模型层、终端应用:
1)算力层、大模型层技术门槛高、规模效应强, 预计主要集中于头部公司(芯片、互联网云服务巨头);
2)应用层重细分垂直行业与场景、数据,强调AI技术对细分领域的赋能提升,有望出现有更多的垂类企业机会。
AIGC海外应用百花齐放、玩家众多、变化巨大
ChatGPT插件(Plugin)功能:门户、平台与生态
插件使ChatGPT能够连接到第三方应用程序交互:
3月23日,Open AI在官网宣布推出ChatGPT插件(Plugin)功能,同时开源知识库插件源代码,从而增强 ChatGPT的功能并允许执行更广泛的操作。
第一批ChatGPT插件包括:
① 本地生活:Expedia(旅行酒店)、KAYAK(航班、住宿和租车)、OpenTable(就餐);
② 电商:FiscalNote(市场数据集)、Instacart(本地订货)、Klarna(线上比价)、Shop(购物);
③ 教育:Speak(学外语)、 Wolfram(数学)、Milo Family Al(家庭教育);
④ 办公:Zapier(邮件、文档);
ChatGPT就能够理解如何调用、何时调用:ChatGPT调用插件只需使用者描述自己开发插件的功能,GPT可以自行调用。
ChatGPT插件(Plugin)功能从开发角度类似于APP Store,越过操作系统实现生态建设,同时被下游反哺。使用角度更像微信小程序,目前不需要界面与交互过程切换(插件属性),有望形成新的流量入口。
1.3
多模态后能力的涌现
开启高维信息的解读是新能力涌现的重要途经:GPT4出现多模态标志着计算机技术领域到其他领域真正的范式转变。
人类的认知和知识结构80% 靠视觉在具象的过程中理解事物,例如:分子结构、机械联动、逻辑关系、社交网络等。
不同于低维度的流数据,图结构表示的信息通常是对环境的深层次挖掘和凝练,其内容可以支持更长周期的预测,无论是对于人类还是其他人工智能体来说,掌握这类信息具有更重大的意义,代表系统深度掌握“推理”的概念。
02
大模型行业核心变量
AIGC市场机会
2.1
算力、算法、数据、生态
算力
AI大模型规模庞大,依赖强大的计算资源,全球芯片计算性能持续提升成为GPT成功落地的重要基础。
英伟达为代表的AI产品性能持续进步。
参数方面,从V100(2017年上市)到H100 (2022年上市)计算性能提升3倍以上而单位功耗显著优化。GTC2023上,英伟达CEO黄仁勋称H100配有Transformer引擎,可以专门用作处理类ChatGPT的AI大模型, 其服务器效率是A100的10倍。
黄仁勋在2023年2月财报会中表示“过去十年,通过提出新处理器、新系统、新互连、新框 架和算法,并与数据科学家、AI 研究人员合作开发新模型,已使大语言模型的处理速度提高了100万倍。”
AI芯片性能显著提升,成为近年大模型涌现的算力基础。
2020年OpenAI推出的GPT-3大模型包含1750亿参数,训练成本达 到了1200万美元,如果采用单片V100需要训练超过300年,而多模态预训练大模型GPT-4预计规模更大,谷歌近期发布的 PaLM-E 包含5620亿参数。如此庞大的模型如果没有先进算力基础,训练耗时和成本将成为不可承受之重。
算法
过去几十年的AI理论持续积累完善,以及GPT本身几代模型算法的持续迭代优化,最终才积累出能力出色的ChatGPT。
从基于规则的算法到用于分类的机器学习,再到可训练的深度神经网络,AI技术把任务的复杂性从函数复杂转向了拓 扑结构复杂,Transformer注意力机制进一步拟合人脑学习方式,最终实现自然语言处理任务突破性进展。
数据
有规模与质量的数据要素是大模型的核心前提——ChatGPT训练数据达到45TB,同时基于人类反馈数据提升性能。
从GPT的训练过程可以看出数据在大模型训练过程中的重要意义, 强化学习过程是ChatGPT 效果区别于其他模型的主要原因。
生态
GPT产品的先发与生态构筑,已成为其重要的竞争优势。
1)先发构筑用户心智与使用习惯(类似搜索引擎),据similarweb,ChatGPT网站2023年2月用户访问数超10亿次,独立访客数超1.5亿,随着产品功能持续完善,AIGC模型本身有望成为超级流量入口,与用户在各种场景直接交互。
2)数据是大模型关键要素,通过先发构筑生态,GPT获取更多的场景与用户数据训练,助力产品力领先,目前GPT回答问题的准确率、质量整体领先于其他模型。
3)大量互联网与软件应用积极与GPT融合,一旦生态构筑,面临迁移成本,一定程度上类似操作系统的生态。
2.2
中美AIGC产业对比
工程与技术对比
底层技术并未卡脖子:大模型技术虽有一定门槛,但对于大厂而言上述竞争要素(算力、数据、算法)并非构成绝对壁垒;
国内大模型表现基本过关:国内大模型相继发布,表观的产品能力表现看,已接近GPT3的水平并且在不断地迭代提升;
生态决定大模型的生命周期:国内基本在同一起跑线,前期进展有先后,但长期壁垒门槛将弱化,未来应用落地或更重要;
产业格局对比
大模型成熟才能赋能下游应用吗?
不同能力的大模型有不同的驱动力,下游应用的落地也需要时间。海外GPT4大模型能力突出,微软凭借率先接入的优势推出产品,其余商业化路径仍在探索,国内则大模型到应用呈现齐头并进的趋势。
大模型一定要通用吗?
通用大模型难度更高,国内大厂很可能凭借业务数据优势、有所侧重的优化大模型,服务于产品功能优化、建立数据飞轮,从而将大模型更好地整合入自身技术栈与生态,变成有场景侧重的基本通用大模型。
03
从海外路径看国内发展
AIGC市场机会
3.1
海外应用:AIGC应用百花齐放
ChatGPT不仅仅是对话机器人,本质是完成以对话为交互形式发布的任务。
办公软件+AI
办公软件是人员处理文本等内容的工具,而类GPT技术大幅提升语言文本处理效率,提升办公效率与体验
微软将Copilot融入Office办公软件,包括Word、Excel、PowerPoint、Outlook、Teams等,演示产品效果出色
类GPT技术还可以和会议软件结合,具备自动生成会议提示/概要/总结、自动生成文本、自动生成电子邮件内容等功能。把重复、枯燥的文本内容实现自动化生成,提升在线会议体验,也可以让用户快速获得所需的会议信息。
谷歌2023年3月15日宣布将类ChatGPT功能集成在Workspace中,包括Docs、Gmail、Sheets、Slides、Meet、Chat等, 目前Google Workspace全球用户已超30亿,可通过自然语言对话自动生成文本等内容,还可以自动生成PPT图片、视频、 音频等。
Zoom IQ近期推出诸多智能化功能,例如通过文本、记录亮点和操作项快速访问所需的会议信息。
语言处理+AI
类GPT技术对文字强大的处理能力还可以运用到记录类产品中,用于对文档的写作、改写、总结、修正、提问、翻译, 对现有文字的编辑优化,甚至到生成几乎任何类型的内容,包括博客文章、会议日程、社交媒体内容、新闻稿、工作 描述、销售邮件以及诗歌等。
语言生成是类GPT技术最常见的应用方式之一,可以用来生成各种类型的文本,例如文案、新闻报道、小说、诗歌等。代表性的应用包括:
• Writesonic:人工智能作家,可以免费为博客、Facebook广告、谷歌广告和 Shopify 创建对 SEO 友好的内容。
• Copy.ai:一款人工智能文案生成助手,可为企业生成高质量的文案。
• Jasper.ai:可以帮助用户进行营销文案编写,进行商业性文字创作 ,截至2022年12月底,Jasper付费用户达到7万;
• Rytr:AI写作助手,可帮助用户以极低的成本创建高质量的内容,包括广告语、社交媒体帖子、产品介绍、电子邮件等等。
• Compose.ai:基于 GPT-3 构建的几种自动化写作工具之一。这是一款免费的 Chrome 扩展程序,可以实现自动进行写作。
• EduRef:基于GPT-3打造的自动化论文写作工具,可以帮助应届毕业生写论文。
• Inspo:基于AI人工智能的灵感写作机器人,帮助用户高效写作、激发创意、获取知识、做出决策。
搜索+AI
AI内容生成与搜索场景有天然的契合度,搜索+AI大幅降低用户处理信息复杂度,提升体验。
2023年2月微软推出 NewBing搜索引擎,新Bing具备ChatGPT强大的语言能力且具备时效性,接入多终端,在使用场景和方便性上都有所提 升。
NewBing在上线后用户活跃明显提升,每日活跃用户已经突破1亿。微软推出Skype必应,将Bing添加到群组内就可让Bing为整个群组回答问题。• 谷歌CEO近期表示也计划在搜索引擎中添加对话式AI功能。
对话社交+AI
类GPT技术构建对话系统,包括聊天机器人、客服系统、社区管理员等,在AIGC技术加持下新聊天机器人优势明显:
• 回复内容将更加拟人化,甚至可以扮演对应风格,增强客户服务体验;
• 对于用户的意图检测更准确,能够更好地满足用户需求,指导用户行为;
• 可以结合历史数据,能更好的识别客户个人情况,对于历史问题也能对答如流;
教育+AI
在教育领域,类GPT技术凭借着广阔的知识储备、准确的答案、流畅的问答交互、快速的内容生产可以作为智能AI导师
Ø 知识问答和辅导:
• Speak是一款基于人工智能AI生成的英语学习平台,让用户获得类真人的交互式口语体验,已生成ChatGPT插件。
• Quizlet 是一个全球性的学习平台,利用ChatGPT 推出Q-Chat AI 导师。每月有超过6000万人使用Quizlet。
• Khan Academy宣布将使用GPT-4来支持一款名叫Khanmigo的全新AI助手,可以同时担当学生的虚拟和教师助手 。
Ø 协助理解复杂信息:
• Talk To Books:可以让人们通过提问的方式查找到书籍及其中的内容。
Ø 协助梳理知识并生成教辅等材料:
• Tutor AI:一键生成对应年级与学科的课程模组,包括了教学模块、教学具体内容、内容简化、教学举例等功能。
• Nerdy将在其在线辅导平台上推出的 ChatGPT 集成产品是人工智能生成的课程计划创建者。
电商与本地生活+AI
类GPT技术将赋能电商与本地生活的开店、运营、导览、支付、售后等多个环节,精准营销、提高用户渗透率、节约人力成本, ChatGPT已经将相关应用整合至插件生态,生成一体化、个性化的用户服务,提升平台一站式打包销售能力。
Ø 电商:Shopify和Instacart是最早采用ChatGPT API的电商公司,现已作为插件合入;
Ø 支付:电商信用支付龙头Klarna旗下电商购物平台也被纳入首批ChatGPT插件;电商支付服务商Stripe也与OpenAI达 成合作,目前已经在智能导购、支付安全、电商SAAS应用等方面开展应用;
Ø 旅游及本地生活:Expedia(OTA)、KAYAK(机票比价)均被纳入ChatGPT首批插件;
游戏+AI
类GPT技术可大幅降低游戏开发的门槛,支持软件开发(编程)、角色设计、脚本、原画、配音、视频编辑等工作。
同时, AIGC与虚拟角色扮演类游戏天然契合,随着GPT类应用的广泛使用,有望驱动游戏内容质量与数量大幅提升。
图片生成+AI
从图片编辑到图片生成的广泛应用:传统的AGI技术已经在图片编辑、修复等领域广泛使用,随着GPT等模型的成熟, 在图片生成领域出现了许多极具影响力的公司,如:stability AI、mid journey等,其作品也引起了广泛讨论。
•摄影师、设计师等内容创作者们面临巨大挑战:随着生成图片的质量越来越好,只需要把参考和关键词提供给AI工具, 就能生成商业大片。
视频生成+AI
AI自动剪辑、拼接素材,提高效率:通过模板或者固定流程可以秒出视频,,节省了视频创作的写脚本/文案、拍摄视频或寻找第三方素材、剪辑素材、配音、配乐、添加素材(转场、特效、字幕、标题、封面图)等环节 。
跨模态生成视频有待产品完善:根据用户提供的文字、图片等生成视频目前未成熟,谷歌、Meta具体产品还未上线。
3.2
机遇与挑战
目前类GPT技术及应用还处在初期探索阶段,随着技术的深入结合,未来将通过影响生产效率、交互方式以及数据资产 带来新一轮社会环节重构,每个企业、个人都同时面临着机遇与挑战,并警惕被价值吞并的风险。
优势壁垒:强大的用户流量与丰富的产品场景
微软本身具备Office、Bing等强大的用户流量入口,同时有较强的软件技术能力,丰富的使用场景能够深度融合 GPT以提升现有产品竞争力,是下游应用领域显著受益于AIGC技术的企业之一,同时也是研究未来哪些国内企业能够较好应用AIGC的参考样本。
优势壁垒:拥有大量优质垂类数据
金融科技(FinTech)领域是一个庞大且专业的领域,其中自然语言运用广泛且复杂,NLP技术可以创造巨大的价值。
彭博社作为一家金融数据公司,凭借其业务特点收集和整理了丰富的专业、高质量金融相关文本数据,构建了迄今为止最大的特定领域数据集,并在特定的金融任务上表现优异。
AIGC产业链竞争四要素
AIGC的技术发展会重构当前行业格局以及业务流程,通过对软件开发、推广、使用环节的改变,通过对信息获取、内容 生产、需求满足等功能属性的替代,AIGC产品能够取代一些应用,同时也能赋能一些应用。
通过对海外产业链应用的变革和演进的分析,用户、技术、场景、数据四个维度具备壁垒的产品具备更大优势,有望借助AIGC技术开创新场景或重塑传统流程,实现产品性能提升、流量突破,保证持续的竞争力;
*数据来自研报等公开数据,仅供学习参考
评论留言