关于OpenAI发布Sora全网在热议什么?快速了解Sora技术

chatgpt中文网2024-02-20350

chatgpt 欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:

OpenAI在2024年2月16日发布的首个文本生成视频模型Sora,正好赶在春节假期的最后几天,互联网人还没开始上班就已经在全网引起了热议。可能很多人不知道Sora还未开放使用,目前只是官方放出的一批样片就让网友激动不已。

|引起热议的原因主要有两点:

超出预期的效果:Sora生成视频的效果太好了,完全达到了以假乱真的程度,远远超出了人们对AI生成视频效果的预期。这点后面再具体讲。

单点突破到全面领先:另外,最重要的一点是这标志着OpenAI从文本生成的单方面技术优势,开始向图片和视频生成技术深入拓展,从而实现各领域全方位的技术领先。

在此之前,OpenAI的DALL·E模型的图片生成效果还不如Midjourney和Stable Diffusion,很多人猜测OpenAI在技术上可能存在短板,从而认为小公司、小团队在一些领域仍有机会突破。

Pika和Runway两个创业公司更是在OpenAI之前推出视频生成功能,虽然生成的AI视频长度只有3-6s,已经激发了人们对未来前景的广泛期待,并获得了较高的市场估值。Pika凭借仅4个人成立只有半年的团队融资5500万美元,估值超估值2 亿美元;而Runway则刚完成1.41亿美元的C+轮融资,估值达到15亿美元。

OpenAI突然发布的Sora模型生成视频的时长一上来就是60s,并且从视频画面、故事情节、物理真实等方面与Pika和Runway拉开巨大差距。Sora模型之所以能够迅速引发广泛关注和讨论,不仅是OpenAI在视频生成领域的技术突破,还引起了人们对OpenAI隐藏有更多重磅技术的猜测,标志着AI技术发展的新方向和潜力的释放,让更多的人认识到AI未来的无限可能。

下面再回头快速了解下Sora技术,OpenAI官方对Sora的介绍:Sora是一个AI模型,可以从文本指令中创建逼真和富有想象力的场景。

OpenAI正在教人工智能理解和模拟运动中的物理世界,目标是训练模型,帮助人们解决与现实世界交互的问题。

|Sora模型的技术优势:

1.视频时长:Sora能够根据用户提供的文本描述生成长达一分钟的视频,保持视觉质量的同时完整准确还原用户提示词要求。

2.复杂场景:Sora 能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。该模型不仅了解用户在文本提示的要求,还了解这些东西在物理世界中的存在方式。

3.多镜头表现:Sora 还可以在单个生成的视频中创建多个镜头,准确地保留角色和视觉风格的一致性。

4.物理模拟与交互:Sora能够理解和模拟真实物理世界的运动,如物体的移动和相互作用,这将是实现AGI的重要里程碑。

|Sora 模型的缺陷弱点:

1.无法模拟复杂物理原理:在模拟复杂场景的物理现象方面存在一定的困难,有时无法准确模拟现实世界中的物理规律,例如:玻璃破碎。

2.因果关系理解有限:物体交互时不能正确改变状态,例如:篮球穿过篮筐后爆炸。

3.其它缺陷:可能会混淆提示的空间细节,例如混淆左右;并且可能难以精确描述随着时间推移发生的事件,例如:物体会突然出现或消失。

|Sora对未来的影响

微博上看到周鸿祎的观点比较乐观,技术发展会给用户更好的体验。一开始我也是这么认为的,但是想到当OpenAI发展出更完备的AI能力,巨头公司和平台可以直接用ChatGPT生成文本描述,再让Sora生成吸引用户的视频。这就好比“抖音”实现了内容自生产,以后平台生成的短视频都刷不完,人还能做什么,难道都沉迷在AI制造的虚拟世界吗?

放长远看AI和人工的竞争不可避免,人的机会和优势在哪里?如何不被AI替代是个必须重视且认真思考的话题。

|关注AI发展和应用

在AI革新的时代技术变化非常快,大家站在了同一个起跑线上,原有的技术认知很容易被淘汰,需要我们时刻关注学习AI的最新发展和应用。结合自己的工作和能力使用AI解决问题,注重学习提高文字表达和逻辑思维能力,能够清晰完整的描述问题和想法是使用AI提高工作效率的前提。

对于AI新手,推荐使用字节跳动推出的AI工具“豆包”,相比OpenAI虽然AI技术能力差点,对小白更友好没有使用门槛。“豆包”的功能设计更符合国内用户的使用习惯,自带AI智能体类似GPTs满足各种功能需求。

注:Sora模型目前未对外开放使用权限,官方没有明确开放日期,暂时也没有申请候补名单。网上宣称提供Sora服务的不是卖课就是在做营销引流,不要浪费时间精力凑热闹,感兴趣就去关注官方最新消息。

推荐资源


官方:https://openai.com/sora
OpenAI 视频生成模型Sora官方文档和演示视频:
https://pkzorxsptl.feishu.cn/docx/MDPwdwDTloNtJaxZaYVcGE73nQB

本文链接:http://xiaogongchang.cn/chatgpt/1074.html

相关文章