OpenAI发布Sora2官方提示词指南详解

作者:互联网

2026-03-22

PPT

掌握Sora 2提示词编写技巧,可显著提升AI视频生成效果。本指南将详细解析如何通过精准描述实现创作目标。

  1. 构建优质视频提示词
  1. 提示词构思方法

设计提示词时,需假设向从未看过故事板的分镜师做简报。遗漏细节会导致即兴发挥,影响最终效果。通过具体说明镜头预期效果,可增强模型控制力与输出一致性。

适当保留开放细节同样重要,这能赋予模型创作自由,产生意外惊喜。两种方法各有优势:详细提示确保画面可控性,简略提示激发创意可能。平衡点取决于目标需求。提示词应视为创意愿望清单,而非硬性规定。与ChatGPT类似,相同提示多次使用会产生不同结果,这是特性而非缺陷,有时后续版本效果更佳。

需要做好反复调整的准备。镜头、灯光或动作的微小改动都可能显著改变效果。建议采用协同创作模式:用户提供方向,模型输出创意变体。以下指南基于实际使用经验总结,仅供参考。

  1. API参数设置

提示词控制视频内容,但部分属性需通过API参数设定,无法用文字描述实现。必须通过API调用显式设置的参数包括:

  1. model:可选sora-2或sora-2-pro
  2. size:格式为{宽度}x{高度}的字符串。分辨率选项取决于所选模型:
    1. sora-2
      1. 1280×720、720×1280
    2. sora-2-pro
      1. 1280×720、720×1280
      2. 1024×1792、1792×1024
  3. seconds:片段时长,可选"4"、"8"、"12",默认"4"

这些参数构成视频容器,分辨率、时长和品质不会因文字描述改变。提示词用于控制其他要素(主体、动态、光影、风格)。

视频分辨率直接影响视觉保真度与运动连贯性。高分辨率能精确呈现细节纹理和光影过渡,低分辨率可能导致画面柔化或出现伪影。

模型在短片中更易遵循指令。建议采用简洁镜头语言。如条件允许,剪辑拼接两段4秒片段比直接生成8秒片段效果更佳。

  1. 有效提示词要素

优质提示词应像故事板草图般清晰。需明确说明取景构图、标注景深效果、用节奏单元描述动作,并设定光影色调。用鲜明细节突出主体,单一合理动作使镜头更易理解。

如需呈现连续序列,可在单条提示中描述多个镜头。保持每个镜头单元独立性:每次设定一个机位、一个主体动作、一种光影方案。这种方式可根据需求生成独立短片或连贯长镜头。

  1. 简短提示词赋予模型更多创作自由,可能产生意外效果
  2. 冗长提示词会限制创造力,执行效果可能不稳定

简短提示词示例:

In a 90s documentary-style interview, an old Swedish man sits in a study and says, "I still remember when I was young."
在一部90年代纪录片风格的访谈中,一位瑞典老人坐在书房里说道:"我依然记得年轻时的日子。"

该提示词优势在于:

  1. "90年代纪录片"设定视频风格,模型据此选择镜头、光影等变量
  2. "瑞典老人坐在书房里"简练勾勒主体场景,保留创作自由度
  3. "说道:'我依然记得年轻时的日子'"精准呈现台词

这类提示词能稳定生成符合要求的视频,但因细节留白,成品可能与具体构想存在差异。未说明的要素(昼夜时段、天气状况等)将由Sora自动补全。

电影级镜头可使用专业制片术语突破标准提示结构。细致指引镜头焦距、滤光片等参数,能精准锁定特定美学风格。

示例应描述视觉焦点、拍摄设备、光线角度等要素。这种方法适用于复刻真实摄影风格或保持镜头连贯性。

示例:

Format & Look
Duration 4s; 180° shutter; digital capture emulating 65 mm photochemical contrast; fine grain; subtle halation on speculars; no gate weave.

Lenses & Filtration
32 mm / 50 mm spherical primes; Black Pro-Mist 1/4; slight CPL rotation to manage glass reflections on train windows.

Grade / Palette
Highlights: clean morning sunlight with amber lift.
Mids: balanced neutrals with slight teal cast in shadows.
Blacks: soft, neutral with mild lift for haze retention.

Lighting & Atmosphere
Natural sunlight from camera left, low angle (07:30 AM).
Bounce: 4×4 ultrabounce silver from trackside.
Negative fill from opposite wall.
Practical: sodium platform lights on dim fade.
Atmos: gentle mist; train exhaust drift through light beam.

Location & Framing
Urban commuter platform, dawn.
Foreground: yellow safety line, coffee cup on bench.
Midground: waiting passengers silhouetted in haze.
Background: arriving train braking to a stop.
Avoid signage or corporate branding.

Wardrobe / Props / Extras
Main subject: mid-30s traveler, navy coat, backpack slung on one shoulder, holding phone loosely at side.
Extras: commuters in muted tones; one cyclist pushing bike.
Props: paper coffee cup, rolling luggage, LED departure board (generic destinations).

Sound
Diegetic only: faint rail screech, train brakes hiss, distant announcement muffled (-20 LUFS), low ambient hum.
Footsteps and paper rustle; no score or added foley.

Optimized Shot List (2 shots / 4 s total)
0.00–2.40 — "Arrival Drift" (32 mm, shoulder-mounted slow dolly left)
Camera slides past platform signage edge; shallow focus reveals traveler mid-frame looking down tracks. Morning light blooms across lens; train headlights flare softly through mist. Purpose: establish setting and tone, hint anticipation.

2.40–4.00 — "Turn and Pause" (50 mm, slow arc in)
Cut to tighter over-shoulder arc as train halts; traveler turns slightly toward camera, catching sunlight rim across cheek and phone screen reflection. Eyes flick up toward something unseen. Purpose: create human focal moment with minimal motion.

Camera Notes (Why It Reads)
Keep eyeline low and close to lens axis for intimacy.
Allow micro flares from train glass as aesthetic texture.
Preserve subtle handheld imperfection for realism.
Do not break silhouette clarity with overexposed flare; retain skin highlight roll-off.

Finishing
Fine-grain overlay with mild chroma noise for realism; restrained halation on practicals; warm-cool LUT for morning split tone.
Mix: prioritize train and ambient detail over footstep transients.
Poster frame: traveler mid-turn, golden rim light, arriving train soft-focus in background haze.

格式与视觉
时长4秒;180°快门;模拟65毫米胶片化学对比度的数字采集;细颗粒度;高光区微妙光晕;无胶片门晃动。

镜头与滤光
32毫米/50毫米球面定焦镜;Black Pro-Mist 1/4柔光镜;轻微CPL旋转以控制列车窗玻璃反光。

调色/色调
高光:干净的晨光配合琥珀色提亮
中间调:平衡的中性色,阴影处微带青绿调
黑场:柔和中性,轻微提亮以保留雾霾质感

光影与氛围
自然日光从摄像机左侧低角度入射(早晨7:30)
补光:轨道侧4×4银面反光板
遮光:对向墙面形成的负补光区
实景光源:月台钠灯渐暗调光
氛围:薄雾轻笼;列车废气在光束中飘散

场景与构图
都市通勤月台,黎明时分
前景:黄色安全线,长椅上的咖啡杯
中景:等待的乘客在雾霭中呈现剪影
背景:进站列车缓缓制动
避免出现标识或商业品牌

服装/道具/群演
主角:35岁左右旅客,海军蓝外套,单肩背包,手机松握垂于身侧
群演:穿着素雅色调的通勤者;推自行车的骑手
道具:纸质咖啡杯,滚轮行李箱,LED发车屏(显示通用目的地)

音效
仅剧情声源:微弱铁轨摩擦声,列车制动嘶鸣,模糊的远处广播(-20 LUFS),低频环境底噪
脚步声与纸制品窸窣声;禁用配乐或附加拟音

优化分镜(                                                        
                             
                           

相关标签:

办公自动化脚本