OpenAI 发布 Sora 2:具有音频功能的革命性 AI 视频生成器
2025年9月30日 — OpenAI 正式发布了其旗舰视频和音频生成模型 Sora 2,标志着 AI 驱动内容创作的重大飞跃。此次发布是让先进视频生成技术面向全球创作者的重要里程碑。
Sora 2 的独特之处
Sora 2 不仅仅是一次增量更新——它完全重新定义了 AI 视频生成的可能性。该模型比以往任何系统都更加物理精确、逼真和可控,具有突破性的能力,推动了人工智能的边界。
关键突破
物理精确的运动:与以往经常"作弊"物理规律的模型不同,Sora 2 能够准确模拟现实世界的动力学。如果篮球运动员投篮不中,球会真实地从篮板弹回。当有人在冲浪板上做后空翻时,模型会考虑浮力和板的柔韧性。
同步音频:Sora 2 首次实现了带有同步对话和音效的视频生成。该模型创建复杂的背景音效、准确唇形同步的自然语音,以及与屏幕动作匹配的音效——从脚步声到关门声再到环境噪音。
增强控制:创作者现在可以指定详细参数,包括视频长度、宽高比、分辨率、相机角度和风格偏好。这种控制级别使 Sora 2 适用于专业工作流程,从广告概念开发到产品原型制作。
令人印象深刻的能力
Sora 2 能够处理以前的 AI 模型难以完成的极具挑战性的任务:
- 奥运级别的体操动作,具有准确的身体力学
- 复杂的水动力学,如冲浪板后空翻
- 三周跳和其他技术性花样滑冰动作
- 具有适当物理规律的真实角色互动
该模型不仅生成视觉上吸引人的视频——它理解并模拟控制现实世界中运动和交互的底层物理原理。
可用性和访问
Sora 2 通过多个访问点发布:
- Web 平台:在 sora.com 为受邀用户提供
- iOS 应用:全新独立的"Sora"移动创作应用
- ChatGPT Pro:为 $200/月订阅用户提供更高质量的"Sora 2 Pro"模型
- API(即将推出):供第三方集成的开发者访问
初始可用性仅限于美国和加拿大,计划扩展到其他地区。目前访问仅限邀请,因为 OpenAI 正在扩大容量以满足预期需求。
行业影响
Sora 2 的发布代表了内容创作者、广告商、电影制作人和开发者的范式转变。高质量视频生成与同步音频首次通过直观界面实现,降低了专业视频制作的门槛。
OpenAI 的负责任部署方法包括安全措施、使用指南和同意机制,以确保该技术的道德和安全使用。
有关更多信息,请访问 openai.com/sora-2 上的官方公告。