
D-ID 是一家总部位于特拉维夫的初创公司,因其动画家庭照片病毒视频背后的技术而闻名,该公司正在将其人工智能视频技术引入今天推出的新移动应用程序中。D-ID 的Creative Reality Studio最初作为网络平台提供,允许用户上传静态图像和脚本,然后将其转换为人工智能生成的视频。该技术可用于创建他们自己、历史人物、虚构人物、主持人或品牌大使的数字表示。
据 TechCrunch 此前报道,该公司的早期用例涉及企业培训和教育、公司内部和外部沟通以及产品营销和销售。
现在可以在移动设备上使用,用户可以从App Store或Google Play下载 D-ID 应用程序,然后创建帐户或登录(如果已经注册)。在选择屏幕上,您可以选择 D-ID 提供的预制“数字人物”,也可以从手机的照片库上传图像。然后,您将输入您希望数字人物说出的文本,从 119 种语言中进行选择,并在男性和女性语音选项之间进行选择。您还可以选择演讲的语气——例如快乐、兴奋、友好、充满希望、新闻广播、悲伤、惊恐地大喊、不友好、窃窃私语等。

D-ID 首席执行官吉尔·佩里 (Gil Perry) 表示,为了开展工作,D-ID 正在利用专有和开源人工智能技术的组合来为其平台提供支持。
“其核心是一个能够根据音频输入生成视频帧的基础模型。其所有产品均由强大的 API 提供支持,能够以业界领先的 100 FPS 渲染视频,比实时渲染速度快四倍。”
“核心受众是人工智能爱好者,但它与任何想要发布数字人物视频的人相关,无论是他们自己的版本还是他们可以想象的任何人的版本——历史人物、虚构人物、祖先等,”佩里说。“该应用程序可以随时随地生成视频,大规模降低制作成本,并允许在任何地方灵活地制作视频。”

这些视频的长度最长可达 10 分钟,并遵守与网络版本相同的 审核政策,这意味着该公司正在努力确保该技术不会用于传播错误信息。Perry 告诉我们,在推出移动版之前,桌面版 Creative Reality Studio 每天已有 60,000 名新注册用户,并已使用该平台制作了超过 1.5 亿个视频。此外,该服务的API拥有超过20万用户。
随着 D-ID 登陆移动设备,它能够进入更广阔的市场,包括移动优先或仅使用移动设备的用户。这既包括有兴趣在移动设备上使用工作室精简版的现有用户,也包括来自公众(包括消费者)的新用户。
在推出 Deep Nostalgia 项目及其衍生产品 LiveStory 后,D-ID 去年筹集了 2500 万美元的 B 轮融资。这两个项目涉及将家庭成员的历史照片制作成动画,并添加音频。随着人们利用这项技术制作失散已久的亲人或祖先的有声照片,这些视频迅速走红。从那时起,D-ID 还一直致力于为 GPT及其Creative Reality Studio 软件创建逼真的界面,作为其更广泛的人工智能开发工作的一部分。
评论留言