
生成式人工智能是聊天机器人和图像生成器背后的热门新技术。但是它使地球有多热?
作为一名人工智能研究人员,我经常担心构建人工智能模型的能源成本。人工智能越强大,消耗的能量就越多。越来越强大的生成人工智能模型的出现对社会未来的碳足迹意味着什么?
“生成”是指人工智能算法产生复杂数据的能力。另一种选择是“判别性”人工智能,它在固定数量的选项之间进行选择,只产生一个数字。歧视性输出的一个例子是选择是否批准贷款申请。
生成式 AI 可以创建更复杂的输出,例如句子、段落、图像甚至短视频。长期以来,它一直用于智能扬声器等应用程序中以生成音频响应,或在自动完成中用于建议搜索查询。然而,它直到最近才获得了生成类人语言和逼真照片的能力。
使用比以往更多的电力
单个AI模型的确切能源成本很难估计,包括用于制造计算设备,创建模型以及在生产中使用模型的能量。2019 年,研究人员发现,创建一个名为 BERT 的生成式 AI 模型,其中包含 110.<> 亿个参数,消耗了一个人往返横贯大陆飞行的能量。
参数的数量是指模型的大小,较大的模型通常更熟练。研究人员估计,创建更大的GPT-3,具有175亿个参数,消耗1,287兆瓦时的电力,产生552吨二氧化碳当量,相当于123辆汽油动力乘用车行驶一年。这只是为了在任何消费者开始使用之前准备好推出模型。
规模不是碳排放的唯一预测指标。由法国BigScience项目开发的开放式BLOOM模型在尺寸上与GPT-3相似,但碳足迹要低得多,在产生433吨二氧化碳当量时消耗30兆瓦时的电力。谷歌的一项研究发现,对于相同的规模,使用更高效的模型架构和处理器以及更环保的数据中心可以将碳足迹减少2到100倍。
较大的模型在部署过程中确实会消耗更多能量。关于单个生成式AI查询的碳足迹的数据有限,但一些行业数据估计它比搜索引擎查询高出四到五倍。随着聊天机器人和图像生成器变得越来越流行,随着谷歌和微软将人工智能语言模型整合到他们的搜索引擎中,他们每天收到的查询数量可能会呈指数级增长。
用于搜索的 AI 机器人
几年前,研究实验室之外没有多少人使用BERT或GPT等模型。这种情况在 30 年 2022 月 1 日发生了变化,当时 OpenAI 发布了 ChatGPT。根据最新数据,ChatGPT 在 5 年 2023 月的访问量超过 4 亿次。微软将 ChatGPT 纳入其搜索引擎必应,并于 2023 年 <> 月 <> 日向所有人开放。如果聊天机器人变得像搜索引擎一样受欢迎,那么部署AI的能源成本可能会真正增加。但人工智能助手的用途远不止搜索,例如编写文档、解决数学问题和创建营销活动。
另一个问题是人工智能模型需要不断更新。例如,ChatGPT 仅针对 2021 年之前的数据进行了训练,因此它不知道此后发生的任何事情。创建 ChatGPT 的碳足迹不是公开信息,但可能远高于 GPT-3。如果必须定期重新创建以更新其知识,能源成本将增长得更大。
一个好处是,询问聊天机器人可能是比使用搜索引擎更直接的信息获取方式。假设准确性问题得到缓解,您不会得到一个充满链接的页面,而是像从人类那里得到直接答案一样。与搜索引擎相比,更快地获取信息可能会抵消增加的能源使用。
前进的道路
未来很难预测,但大型生成人工智能模型将继续存在,人们可能会越来越多地转向它们获取信息。例如,如果学生现在需要帮助解决数学问题,他们会询问导师或朋友,或查阅教科书。将来,他们可能会问聊天机器人。其他专业知识也是如此,例如法律建议或医学专业知识。
虽然单个大型AI模型不会破坏环境,但如果一千家公司为不同的目的开发略有不同的AI机器人,每个机器人都被数百万客户使用,那么能源使用可能会成为一个问题。需要更多的研究来提高生成人工智能的效率。好消息是,人工智能可以使用可再生能源。通过将计算带到绿色能源更丰富的地方,或者将计算安排在一天中可再生能源更可用的时间,与使用以化石燃料为主的电网相比,排放量可以减少30到40倍。
最后,社会压力可能有助于鼓励公司和研究实验室公布其人工智能模型的碳足迹,正如一些人已经做的那样。在未来,也许消费者甚至可以利用这些信息来选择“更环保”的聊天机器人。
原文标题:Is generative AI bad for the environment? A computer scientist explains the carbon footprint of ChatGPT and its cousins
原文链接:https://techxplore.com/news/2023-05-generative-ai-bad-environment-scientist.html
作者:The Conversation
编译:LCR
评论留言