写给大家看的AIGC通识

AIGC
后台-插件-广告管理-内容页头部广告(手机)

AIGC爆火

  • 钱:春节前美国的投资机构都只看AIGC的方向了
  • 人:裁员潮中AIGC招聘职位却在增长
  • 公司:AIGC方向的初创公司250家以上,接近7成至少拿到天使轮投资,11%已经B轮以上
  • 行业:各种AIGC大会直播
  • 政策媒体:两会报道提了chatgpt

AIGC是什么

AIGC即AI Generated Content,是指利用人工智能技术来生成内容

web1.0(PGC)—— web2.0(UGC)——AiUGC——AIGC(本质上是UGC的重组)

 

AIGC的应用

现在

第一个方向是通过AI生成文字,比如自动写邮件和广告营销文案,这要归功于OpenAI的GPT-3 AI语言模型,目前大多数AI生成文字类项目都使用该模型。

第二个方向是利用AI作图,主要技术是结合多模态神经语言模型CLIP和图像去躁扩散模型Diffusion,仅仅提供一些关键词描述就可以自动生成图片。

第三个方向是AIGC的底层技术模型开发,OPENAI和StableAI 是这个方向的龙头,也是融资金额最大的

 

最近


预计接下来AIGC的热门方向可能是用AI生成视频和动画,这就看Meta、Google的AI视频模型能不能解决视频的连贯性和逻辑性问题,或其他公司提出更好的解决方案。

以后

多场景:仿真驾驶/医疗/工厂/零售/人

多模态:内容生产

 

AIGC有什么影响

机会

脑力生产者效率的第二次飞跃,低成本自动化内容生产,AIGC极有可能成为内容生产的基础设施

有可能成为元宇宙的基石

生成式Ai可能是通用人工智能的雏形—

威胁

知识产权

隐私

安全

技术伦理

环境

AIGC生成图片

Stable Diffusion:开源可定定制

DALL-E2:擅长写实,提示简单

Midjourney:梯子,每月10或30美元,擅长艺术图像

人工智能绘画你给打几分

StableDiffusion、Midjourney 和 DALL-E-2 三种模型对比

  • prompt
 

Stable Diffusion

Midjourney

DALL-E2

AIGC生成文本

ChatGPT:专注于对话生成的语言模型,已经开放api,梯子
用户输入自然语言文本,chatGPT智能对答:回答、短文、诗歌、代码、数学、逻辑计算

聊天

通过上下文模拟面试

写代码

写诗

有理有据的拒绝你

特点:虽然可能回答会歪曲事实,但敢于质疑,能承认无知,支持多轮,能够理解上下文

 

AIGC的其他产品

  • 音频:AI播客Podcast.Ai
  • 视频:
  • Meta:Make-A-Video(生成一段情节连贯的视频)
  • Google:Imagen Video和Phenaki(文字转视频、图片转视频、视频生成视频)
  • 视频的连贯性和逻辑性仍有问题
  • 3D模型:(NeRF)可以把全景相机拍摄的视频自动渲染为3D场景
  • 虚拟摄影:DeepAgency虚拟摄影工作室服务
 

AIGC的底层技术

技术架构

 

变革基础

基础的生成算法突破 、预训练模型引起质变 、多模态技术推进内容多样性

 

Ai生成图片技术

传统GAN图片结果输出不稳定,分辨率低

Diffusion解决作画的问题:2022年7月,是一种去噪扩散模型,工作原理是对图像逐步施加噪点,直至图像被破坏变成完全的噪点,然后再逆向学习从全噪点还原为原始图像的过程,而AI所看到的是全是噪点的画面如何一点点变清晰直到变成一幅画,通过这个逆向过程来学习如何作画。——逆计算

CLIP解决文本和图像的问题:多模态,它一方面对文字进行语言分析,另一方面对图形进行视觉分析,不断调整两个模型内部参数,达到文字和图像高度匹配的效果。

Ai生成文本技术

 

结语

人类还在为了生存苦苦挣扎,Ai却早早拥有了诗和远方。

   
后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。