OpenAI 发布 Sora 2：具有音频功能的革命性 AI 视频生成器

2025年9月30日 — OpenAI 正式发布了其旗舰视频和音频生成模型 Sora 2，标志着 AI 驱动内容创作的重大飞跃。此次发布是让先进视频生成技术面向全球创作者的重要里程碑。

Sora 2 的独特之处

Sora 2 不仅仅是一次增量更新——它完全重新定义了 AI 视频生成的可能性。该模型比以往任何系统都更加物理精确、逼真和可控，具有突破性的能力，推动了人工智能的边界。

物理精确的运动：与以往经常"作弊"物理规律的模型不同，Sora 2 能够准确模拟现实世界的动力学。如果篮球运动员投篮不中，球会真实地从篮板弹回。当有人在冲浪板上做后空翻时，模型会考虑浮力和板的柔韧性。

同步音频：Sora 2 首次实现了带有同步对话和音效的视频生成。该模型创建复杂的背景音效、准确唇形同步的自然语音，以及与屏幕动作匹配的音效——从脚步声到关门声再到环境噪音。

增强控制：创作者现在可以指定详细参数，包括视频长度、宽高比、分辨率、相机角度和风格偏好。这种控制级别使 Sora 2 适用于专业工作流程，从广告概念开发到产品原型制作。

Sora 2 能够处理以前的 AI 模型难以完成的极具挑战性的任务：

该模型不仅生成视觉上吸引人的视频——它理解并模拟控制现实世界中运动和交互的底层物理原理。

Sora 2 通过多个访问点发布：

初始可用性仅限于美国和加拿大，计划扩展到其他地区。目前访问仅限邀请，因为 OpenAI 正在扩大容量以满足预期需求。

Sora 2 的发布代表了内容创作者、广告商、电影制作人和开发者的范式转变。高质量视频生成与同步音频首次通过直观界面实现，降低了专业视频制作的门槛。

OpenAI 的负责任部署方法包括安全措施、使用指南和同意机制，以确保该技术的道德和安全使用。

有关更多信息，请访问 openai.com/sora-2 上的官方公告。