Agent 体系 影视梦工厂 v3.0

系统全部 Agent 一览 · 已开发/未开发状态标记
22
已开发 Agent
4
未开发 Agent
26
Agent 总数

核心制作流水线 10 个 Agent

ProducerService ProducerAgent
已开发
总调度 Agent。任务编排、DAG 流水线驱动(剧本→分镜→资产→配音→口型→字幕→导出),管理全制作流程。
producer.py调度
ScriptService ScriptAgent
已开发
编剧 Agent。根据世界观/角色/剧情生成剧集剧本,支持知识库增强(科普模式),LLM 驱动。
script.py编剧
DirectorService DirectorAgent
已开发
导演 Agent。将剧本转化为分镜列表(镜头类型、运镜、台词、角色定位),智能匹配资源需求,LLM 驱动。
director.py导演
AssetAgent
已开发
资产 Agent。生成角色设定图、场景关键帧、分镜图片、道具图片,管理整集批量资产生成,依赖 ComfyUI。
asset_agent.py资产
ImageAgent
已开发
图像生成 Agent。ComfyUI 集成层,管理提示词构建(注入角色/场景上下文),基于 prompt_hash 的去重缓存,队列管理。
image_agent.py图像
VideoAgent
已开发
视频生成 Agent。接收分镜源图,构建 ComfyUI LTX I2V 工作流生成分镜视频,支持单分镜和整集拼接。
video_agent.py视频
VoiceAgent
已开发
配音 Agent。GPT-SoVITS 角色配音生成,支持角色参考音频、缓存检查、单镜头和整集批量生成。
voice_agent.py配音
LipSyncAgent
已开发
口型同步 Agent。支持 SadTalker(图片+音频→口型视频)、LivePortrait(视频驱动面部动画),含降级回退策略。
lipsync_agent.py口型
SubtitleAgent
已开发
字幕 Agent。生成 SRT/VTT/ASS 格式字幕,多语言翻译,根据音频时长自动调整时间轴。
subtitle_agent.py字幕
ExportAgent
已开发
成片导出 Agent。收集分镜视频、口型视频、配音、字幕,调用 FFmpeg 拼接、混音、字幕叠加、放大到 1080P。
export_agent.py导出

审核与质量 2 个 Agent

ReviewAgent
已开发
内容审核 Agent。综合合规性检查、质量评估、敏感内容检测、风格一致性检查。支持全剧集审核。
review_agent.py审核
ContinuityAgent
已开发
连续性检查 Agent。检查角色一致性、时间线、世界观、伏笔、场景、人物关系。使用 DeepSeek-R1:14B 推理模型。
continuity_agent.py连续性

知识与翻译 2 个 Agent

KnowledgeAgent
已开发
知识 Agent。科普模式核心:提取知识点、生成知识结构、自然语言转化(科普/故事/问答)、DuckDuckGo 联网研究、脚本关键词自动增强。
knowledge_agent.py知识
TranslationAgent
已开发
翻译 Agent。多语言翻译(50 种语言),文化适配,术语一致性管理,翻译质量评估。支持整集和批量翻译。
translation_agent.py翻译

营销 1 个 Agent

MarketingAgent
已开发
营销 Agent。生成海报提示词、预告片脚本、多平台宣传文案(微信/微博/抖音/小红书)、社交媒体日常内容。
marketing_agent.py营销

支撑服务 3 个 Agent

PromptAgent
已开发
Prompt 工程 Agent。Prompt 模板管理(CRUD),提示词生成(模板+变量填充),针对 FLUX/SDXL 等模型优化。
prompt_agent.py支撑
CharacterService CharacterAgent
已开发
角色 Agent。角色 CRUD、角色设定图管理、角色与剧集/分镜的关联。提供角色描述给 ImageAgent/VoiceAgent。
character.py支撑
SceneService SceneAgent
已开发
场景 Agent。场景 CRUD、场景关键帧管理、场景与剧集关联。提供场景信息给 ImageAgent 生成关键帧。
scene.py支撑

v3 新业务中心 5 个 Agent

NovelService NovelAgent
已开发
小说创作 Agent。剧本提存为长篇小说,卷纲→章纲→正文逐级生成,LLM 驱动。
novel.py小说
AudioDramaAgent
已开发
广播剧制作 Agent。角色分配→配音生成→音效/BGM→混音合成,复用漫剧角色声音。
audio_drama_agent.py广播剧
DigitalHumanAgent
已开发
数字人 Agent。形象创建→声音绑定→口播脚本→口型同步→视频导出。
digital_human_agent.py数字人
ScriptConversionAgent
已开发
格式转换 Agent。漫剧↔小说↔广播剧↔数字人口播的 LLM 跨格式转换。
script_conversion_agent.py转换
UnifiedResourceAgent
已开发
统一资源库 Agent。跨中心的角色/剧本/素材/任务库管理。
unified_resource_agent.py资源库

规划中 / 未开发 4 个 Agent

ScienceScriptAgent
未开发
科学编剧 Agent(PRD 第3章·科普引擎)。将专业知识转化为大众语言,生成科学剧本。部分功能已在 KnowledgeAgent 中实现,独立 Agent 待开发。
---PRD 第3章
ScienceDirectorAgent
未开发
科学导演 Agent(PRD 第3章·科普引擎)。知识拆镜、实验可视化、科学现象动画。将抽象科学概念转化为视觉分镜。
---PRD 第3章
ScienceReviewEngine
未开发
科学审核引擎(PRD 第3章·科普引擎)。四级审核机制:科学性→通俗性→趣味性→安全性。部分功能在 ReviewAgent 中,独立引擎待实现。
---PRD 第3章
DirectorCaseAgent
未开发
导演案例 Agent(Phase 5)。NAS 视频扫描→镜头分割→关键帧提取→场景理解→导演案例卡片→向量检索。与现有 knowledge 系统合并,形成创作反馈闭环。
---Phase 5