免费开源AI短剧工具排行:马上短剧深度测评
输入一个主题词,即可自动完成从剧本创作、分镜头设计、图像生成到视频合成的全流程。支持自定义集数,并确保角色外貌、场景氛围和声音特征高度一致。该工具完全开源免费,基于Python开发,已打包为可直接运行的exe文件,无需安装或注册。源代码与单文件下载链接见文末。
简而言之,这是一套将AI短剧制作流程标准化的高效生产力工具。系统整合了剧本撰写、角色建模、图像渲染、视频拼接和语音合成等模块,旨在帮助创作者快速输出高质量短剧内容。无论个人创作者还是团队,均可借助其角色一致性机制、动态视觉叙事能力以及音画同步功能提升制作效率。
免费开源版“马上短剧生成系统”生成的短视频示例(点击可观看效果)
✨ 核心功能概览
???? 智能剧本管理
支持直接输入主题词自动生成短剧剧本,也能将小说、文章或段子改编为短剧——实用性极强。AI写作环节内置OpenAI和DeepSeek等大语言模型,可自动产出剧本、对话、场景描述及分镜头脚本。输出格式遵循行业标准剧本格式,分集管理直观:只需指定集数即可批量生成。
???? 双一致性系统(角色一致性与环境一致性)
可详细定义角色特征、外貌与背景故事,并支持上传参考图作为视觉锚点。更关键的是,系统不仅维护角色一致性,还能确保场景环境风格统一——彻底告别反复抽卡调参的烦恼,大幅节省时间和成本。
???? AI视频生成
集成Google Veo、Sora、Runway、Stable Video Diffusion等主流视频生成模型。既可直接依据剧本描述生成视频,也可先由分镜图像作为参考再合成,灵活性极高。
????️ 音频合成
TTS引擎支持ElevenLabs、OpenAI TTS与Edge TTS,能够生成富有表现力的角色语音。系统可自动匹配符合场景氛围的背景音乐与音效。自动配音功能通过调用AI接口输出高质量、情感丰富的对话或旁白。声音一致性通过内置参数调优策略保障。
???? 可视化分镜
使用DALL-E 3或Stable Diffusion将剧本场景转为可视化分镜。在视频生成前即可规划摄像机角度与运镜路径。分镜参数内置多种预设选项,操作便捷,显著提升视频制作的掌控力。
???? 技术架构
- 编程语言:Python 3.10+
- 图形界面框架:PyQt6
- AI模型与API:
- LLM:OpenAI GPT-4, DeepSeek
- 图像生成:DALL-E 3, Stable Diffusion
- 视频生成:Google Veo, OpenAI Sora, Runway Gen-2/3
- 音频合成:OpenAI TTS, ElevenLabs
- 媒体处理工具:FFmpeg, OpenCV, Pydub
- 数据管理方式:基于JSON的项目结构
???? 项目目录结构
e:play_tool/
├── src/ # 主程序源码
│ ├── ui/ # 用户界面层 (PyQt6)
│ ├── core/ # 核心业务逻辑 (剧本管理、角色定义)
│ ├── ai_engine/ # AI引擎接口层 (LLM、图像、视频、音频)
│ └── database/ # 数据持久化层
├── resources/ # 资源文件与配置
│ ├── config/ # 配置文件
│ ├── projects/ # 用户项目目录 (已加入.gitignore)
│ └── scenes/ # 场景资源文件
├── .venv/ # Python虚拟环境
├── requirements.txt # Python依赖列表
└── main.py # 应用启动入口
???? 快速部署指南
环境要求
- Python 3.10 及以上版本
- FFmpeg(需安装并配置至系统PATH环境变量)
安装流程
- 克隆代码仓库:
git clone https://github.com/frank36512/horseplay.git cd horseplay
- 创建虚拟环境:
# Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activate
- 安装依赖:
pip install -r requirements.txt
配置指南
- 初始化配置文件:复制示例配置文件
# Windows copy resources\config\config.example.json resources\config\config.json # Linux/macOS cp resources/config/config.example.json resources/config/config.json
- 配置API密钥:编辑
resources/config/config.json,填入你计划使用的服务(OpenAI, ElevenLabs, Google等)的密钥。
启动应用程序
python src/main.py
????️ 开发路线图
- 第一阶段:基础框架搭建——基础UI、项目管理和剧本编辑器。
- 第二阶段:AI核心模块——深度集成LLM实现剧本创作,集成图像生成实现分镜设计。
- 第三阶段:视频合成流水线——从分镜生成连贯视频片段。
- 第四阶段:音频与同步——集成Wav2Lip口型同步技术与自动混音。
- 第五阶段:产品打磨——支持通用视频格式导出,提供时间轴编辑功能。
开源仓库地址:https://github.com/frank36512/horseplay
单文件exe下载链接:https://pan.quark.cn/s/becdf8427ee9




