总调度 Agent。任务编排、DAG 流水线驱动(剧本→分镜→资产→配音→口型→字幕→导出),管理全制作流程。
producer.py调度
编剧 Agent。根据世界观/角色/剧情生成剧集剧本,支持知识库增强(科普模式),LLM 驱动。
script.py编剧
导演 Agent。将剧本转化为分镜列表(镜头类型、运镜、台词、角色定位),智能匹配资源需求,LLM 驱动。
director.py导演
资产 Agent。生成角色设定图、场景关键帧、分镜图片、道具图片,管理整集批量资产生成,依赖 ComfyUI。
asset_agent.py资产
图像生成 Agent。ComfyUI 集成层,管理提示词构建(注入角色/场景上下文),基于 prompt_hash 的去重缓存,队列管理。
image_agent.py图像
视频生成 Agent。接收分镜源图,构建 ComfyUI LTX I2V 工作流生成分镜视频,支持单分镜和整集拼接。
video_agent.py视频
配音 Agent。GPT-SoVITS 角色配音生成,支持角色参考音频、缓存检查、单镜头和整集批量生成。
voice_agent.py配音
口型同步 Agent。支持 SadTalker(图片+音频→口型视频)、LivePortrait(视频驱动面部动画),含降级回退策略。
lipsync_agent.py口型
字幕 Agent。生成 SRT/VTT/ASS 格式字幕,多语言翻译,根据音频时长自动调整时间轴。
subtitle_agent.py字幕
成片导出 Agent。收集分镜视频、口型视频、配音、字幕,调用 FFmpeg 拼接、混音、字幕叠加、放大到 1080P。
export_agent.py导出