创业者不必惧怕Sora

AIGC
后台-插件-广告管理-内容页头部广告(手机)

OpenAI确实是一个很好的领先者,但它不可能垄断整个市场。

文|《中国企业家》记者 孔月昕

编辑|马吉英

头图来源|视觉中国

作为九合创投创始人,王啸曾预判到视频的多模态生成在今年有可能出现,但他没想到会这么快。

2月16日凌晨,他刷到了Sora提供的长达1分钟的视频,发现视频的细节、光影处理非常逼真,给他留下了非常深刻的印象。

事实上,文生视频大模型或应用并不新奇,去年就已经有不少相关产品或模型出现。Meta、Runway、Pika、Adobe等公司都发布过视频生成工具,国内大厂及部分创业公司也在该领域进行研究,且部分公司也取得了一定突破。

不过,此前AI生成的短视频大多数还停留在10秒以内,视频的“真实性”也大打折扣,远远达不到Sora呈现的长达1分钟的稳定效果。

因此,Sora的出现,意味着生成式AI迎来了新的机会。行者AI创始人、CEO尹学渊透露,整个团队都非常兴奋,干劲十足。“我们每天都在研究折腾。”在他的印象里,上一次这么兴奋,还是ChatGPT发布的时候。

Sora很大程度上推动了生成视频应用加速发展的趋势。王啸也认为,OpenAI再次明确了视频模型的技术发展路径,最快6个月后,可能就有开源的“Sora”出现了。

“我相信今年就是AIGC视频超级应用的元年。”井英科技创始人、CEO朱江表示。

Sora的到来究竟会如何影响行业发展?投资人从中又发现了哪些新机会和新趋势?围绕相关话题,《中国企业家》近期采访了九合创投创始人王啸、行者AI创始人、CEO尹学渊、井英科技创始人、CEO朱江,以下为采访整理。

九合创投创始人王啸:

不用担心Sora或OpenAI能通吃

其实Sora目前的发展路径在ChatGPT出来之后基本就可以预判了。

Sora是通过Transformer加上过去大模型带来的知识库,再加Diffusion做出来的。我们在以前就有预判,Transformer加上部分原有算法有可能突破多模态生成的瓶颈,但(它的到来)确实是比我们想象中要快。

王啸 摄影:邓攀

另一方面,Transformer+专业场景数据,可能会在其他场景出现类似突破,比如说机器人领域的具身智能、生物领域中的DNA和蛋白生成相关领域,都可能通过这种算法模型将隐藏的规律和信息计算模拟出来。

通过这个理解再进行推演,我们认为其他领域也存在大模型重新改写其中底层技术的可能性。一旦能成功改写,在应用层就会取得巨大突破。

基于此,我觉得OpenAI是新时代结构性能力的提供者,它提供了一种大模型通用智能架构和能力的输出。但这个能力要想运用在我们日常工作或生产中,就需要针对场景进行各种各样的整体解决方案的打造。就相当于一辆车,如果只有发动机也没法跑,还需要轮子、座舱。

OpenAI提供了新时代人工智能的“发动机”,这一点非常有价值。就好像有了苹果这样的硬件公司,基于移动网络,产生了抖音、快手、微信等应用,这是一层一层互相依存发展的。但做移动网络或者5G的公司,不一定能够把手机做出来,做手机的公司还能把APP也做好,它们需要的能力不是完全一样的。

GPT解决了基座问题,而且也给到了行业范例,很多开源模型如Llama 2,以及国内的一些开源软件,我觉得也可以用。现在Sora出来了,最快再过6个月我觉得开源的“Sora”可能也做得出来。因为技术路线基本确定之后,有一些团队是可以做出来相当能力的产品,所以我觉得Sora不太容易形成技术上的独占性。

因此,我觉得未来是分工合作的机会,OpenAI确实是一个很好的领先者,但它不可能垄断整个市场。

Sora相关的视频模型的能力,我觉得未来在to C和to B都有机会,因为它是一种结构性的能力。无论对于家庭、个人,还是企业、机器人等,它都能延伸到各个方面,只不过载体不同。比如进入工厂制造领域,它需要跟机器人、加工机床的软件结合;如果延伸到to C就一定要跟手机、笔记本电脑、Vision Pro等新型终端结合起来。

目前大模型生成内容并不完全可控,它有时有幻想、有时会瞎说,生成的视频里面偶尔还存在问题,这都需要应用层的创业者去把它按照场景进行规划、生成和使用。

因此,(即使Sora出现)我觉得还存在大量创业机会,不用担心Sora或OpenAI能通吃。

不过,在部分大模型通用能力领域中,(创业公司)如果想跟大厂竞争,这对资源的要求非常高。但在垂直领域或行业领域里解决一些具体问题,我觉得大厂能够覆盖的不一定多,也不一定有垂直领域的创业公司专业。

对于大家谈到的算力紧缺问题,从整体上讲,大模型的确是利用大量的数据和算力形成的模型能力,进而去解决某些特定问题,比如视频生成、语言生成等。简单来说,我觉得它是一个用“大力出奇迹”的拆解模式去模拟世界或视频生成中的一部分。当模型的数据量越大,它的效果就越好。

但我也认为,到一定程度后,它可能就不需要更多算力、模型和数据了,在某个程度上它可能存在收敛的部分。尽管算力在里面起到了关键性作用,但我不认为它是决定性部分。

此外,我觉得未来可能会产出针对性的算力芯片。新架构算力硬件或芯片出现后,算力的瓶颈可能会取得突破性的进展。我觉得可能需要一年时间验证我们面向未来的推测。

井英科技创始人、CEO朱江:

超级应用有机会在中国诞生

我觉得Sora出来之后,对我们最有启发的还是技术角度。我们觉得基于Diffusion Transformer的技术路线,接下来还会成为行业研发的热点;此外,Scaling Law在整个视频生成领域也存在很大作用。

尽管从业内来看,我们认为(Sora的技术路线)不是一个新的东西,但OpenAI在整个实践过程中令人非常敬佩,而且比我们预想的快了3~6个月的时间。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。