【AIGC】story_agent_loop架构初步探讨3
drama_output_v2_spec.py已有证据支持你的方向:v2 spec 明确说 v1 完全合法、v2 字段可选,而且现有后端已经在读取acts/main_appearance/分镜列表并标记source=drama_output_v2。我再看一下导入归一化和按幕编排那段,判断这个 15 秒模式接在哪里最稳。顺手做了一个之前欠着的前端诊断:aigc_mv_pipeline.html当前无 VS Code 诊断错误。后端现有归一化已经专门识别了你这种 xyp 样式:time_stamp + 字符串 camera + shot_content,并会拆成可供 SD2 使用的小 shot;这说明“15 秒场景模式”不是凭空新增,而是已有雏形,适合正式产品化成开关。我同意你的判断:最终剧本格式可以升级为drama_output v2,而不是停留在 storyboard_mix 当前偏歌词段落对齐的 v1 形态。更准确地说,终极 contract 应该是:storyboard_mix 负责生成,但输出目标改成drama_output v2。我刚核对了代码,v2 不是另起炉灶。drama_output_v2_spec.py 明确写了 v1 字段全保留、v2 字段可选、Act/Scene/Shot 三层独立;现有后端也已经在 app_aigc_orchestration.py 里支持