Skip to content

Latest commit

 

History

History
304 lines (223 loc) · 13 KB

File metadata and controls

304 lines (223 loc) · 13 KB

简体中文 | English


ManimCat Logo
paws

ManimCat

∫   ∑   ∂   ∞

🎬 AI-Powered Mathematical Animation Generator

让数学动画创作变得简单优雅 · 基于 Manim 与大语言模型

◆   ◆   ◆

ManimCE React Node.js License

项目简介样例快速开始技术部署主要扩展版权维护



项目简介

很荣幸在这里介绍我的新项目ManimCat,它是一只猫

本项目基于 manim-video-generator 进行了大幅重构与再开发,现在已经不只是单一生成流程,而是一个更完整的 AI 数学教学可视化创作系统。

它面向课堂讲解、例题拆解与数形结合表达等场景,用户可以通过自然语言生成、修改、重渲染并组织基于 Manim 的教学内容,支持 videoimage 两种输出。

项目目前包含两种明确区分的模式:Workflow Mode 用于直接生成与渲染,Agent Mode 用于基于 Studio 的协作式创作、审阅与迭代。

界面

ManimCat 桌面界面截图 1 ManimCat 桌面界面截图 2
ManimCat 桌面界面截图 3 ManimCat 桌面界面截图 4
ManimCat 桌面界面截图 5 ManimCat 桌面界面截图 6

样例

$1/4 + 1/16 + 1/64 + \dots = 1/3$,证明这个等式,美丽的图形方法,优雅的缩放平稳镜头移动,慢节奏,至少两分钟,逻辑清晰,奶黄色背景,马卡龙色系


default.mp4

▲ 含背景音乐 · 几何级数证明 · ManimCat 生成

快速开始

npm install
cd frontend && npm install
cd ..
npm run dev

访问 http://localhost:3000。环境变量、部署方式以及上游路由示例请查看部署文档

技术

技术栈

  • 产品模式:Workflow 模式用于直接生成,Agent 模式用于 Studio 协作式工作流
  • 后端:Express + TypeScript、Bull + Redis、兼容 OpenAI 的上游路由、Studio Agent 运行时、可选 Supabase 历史记录
  • 前端:React 19、Vite、Tailwind CSS、经典生成界面、Studio 工作台界面
  • 实时层:Workflow 任务使用轮询,Agent 会话使用 Server-Sent Events 推送事件、权限请求与任务更新
  • 渲染运行时:Python + Manim Community Edition、LaTeX、ffmpeg
  • 部署:Docker / Docker Compose、Hugging Face Spaces

Workflow Mode

flowchart LR
    classDef ui fill:#F6F7FB,stroke:#455A64,color:#263238,stroke-width:1.2px;
    classDef logic fill:#FFF8E1,stroke:#A1887F,color:#4E342E,stroke-width:1.2px;
    classDef api fill:#E8F5E9,stroke:#5D8A66,color:#1B4332,stroke-width:1.2px;
    classDef state fill:#E3F2FD,stroke:#5C6BC0,color:#1A237E,stroke-width:1.2px;
    classDef output fill:#FCE4EC,stroke:#AD5C7D,color:#6A1B4D,stroke-width:1.2px;

    U[用户输入] --> P1
    P1[经典生成界面] --> P2[问题规划]
    P1 --> P3[生成 / 修改请求]
    P2 --> A1[Workflow API]
    P3 --> A1
    A1 --> R1[上游路由 + AI 生成]
    R1 --> C1[静态检查 + 重试 / 修补循环]
    C1 --> B1[队列 + 任务状态]
    B1 --> B2[渲染流水线]
    B2 --> O1[视频 / 图片 / 代码 / 耗时]
    P1 -. 轮询 / 取消 .-> B1
    O1 --> P1

    class P1 ui;
    class P2,P3,R1,C1 logic;
    class A1 api;
    class B1,B2 state;
    class O1 output;
Loading

Agent Mode

flowchart LR
    classDef ui fill:#F6F7FB,stroke:#455A64,color:#263238,stroke-width:1.2px;
    classDef runtime fill:#FFF8E1,stroke:#A1887F,color:#4E342E,stroke-width:1.2px;
    classDef api fill:#E8F5E9,stroke:#5D8A66,color:#1B4332,stroke-width:1.2px;
    classDef state fill:#E3F2FD,stroke:#5C6BC0,color:#1A237E,stroke-width:1.2px;
    classDef event fill:#FCE4EC,stroke:#AD5C7D,color:#6A1B4D,stroke-width:1.2px;

    U[用户指令] --> S1
    S1[Studio 界面] --> A1[Session / Run API]
    A1 --> R1[Studio Runtime Service]
    R1 --> K1[Manim Studio / Plot Studio]
    K1 --> G1[Builder、Designer、Reviewer]
    G1 --> T1[工具、skills、渲染 / 审查动作]
    R1 --> S2[Session / Run / Task / Work 状态]
    R1 --> E1[SSE 实时事件 + 权限]
    S2 --> S1
    E1 --> S1

    class S1 ui;
    class A1 api;
    class R1,K1 runtime;
    class G1,T1,S2 state;
    class E1 event;
Loading

部署

请查看部署文档

在原项目基础上的主要扩展

这个项目是在原始基础上做的大幅重构与再开发。以下是我本人新增和重构的核心能力:

生成与渲染

  • 在视频生成之外,新增了独立的图片工作流
  • 新增 YON_IMAGE 锚点分块渲染,支持多图输出
  • 新增两阶段 AI 生成架构:概念设计者生成场景方案,再由代码生成者产出 Manim 代码
  • 新增静态检查守卫(py_compile + mypy),渲染前自动检查生成代码,并由 AI 自动修补,最多循环 3 轮
  • 新增 AI 驱动的代码重试:渲染失败后自动将错误反馈给模型,重新生成并再次渲染
  • 新增基于现有代码的重渲染,以及 AI 辅助修改后再渲染
  • 新增图片与视频共用的阶段耗时统计
  • 新增视频背景音乐自动混入
  • 新增渲染失败事件采集与导出能力,便于排错和稳定性改进

产品与界面

  • 将前端重建为独立的 React + TypeScript + Vite 应用
  • 新增生成前的问题规划能力,帮助整理用户请求
  • 新增参考图上传能力
  • 新增统一的工作空间页面,整合生成历史与用量视图
  • 新增用量仪表盘,提供每日调用量、成功率与耗时趋势图表
  • 新增提示词模板管理,可按角色查看和覆盖系统提示词
  • 新增暗色 / 亮色主题切换
  • 新增长等待过程中的 2048 小游戏
  • 新增整体视觉风格、设置面板与 provider 配置流程

基础设施与路由

  • 将后端重构为 Express + Bull + Redis 架构
  • 新增重试、超时、取消与状态查询链路
  • 新增对第三方 OpenAI-compatible API 与自定义 provider 的支持
  • 新增按 ManimCat key 的服务端上游路由能力
  • 保留并扩展前端多 profile provider 轮询能力,便于本地使用
  • 新增可选的 Supabase 持久化历史记录存储

Studio Agent

  • 新增独立的 Studio 模式,它不再只是经典生成流程的附属页面,而是单独的 agent 运行模式
  • 新增 session、run、task、work、work result 等长生命周期状态模型
  • 新增 builder、designer、reviewer 三种 Studio agent 角色
  • 新增工作区工具、渲染工具、本地 skills 与子代理编排能力
  • 新增基于 Server-Sent Events 的 Studio 实时更新,以及权限请求 / 回复链路
  • 新增 Studio 前端中的 review、pipeline、work、permission 等面板

开源与版权声明

本项目授权细则见 LICENSE_POLICY.md

  • 第三方来源与归属说明见 THIRD_PARTY_NOTICES.md
  • 中文版第三方来源与归属说明见 THIRD_PARTY_NOTICES.zh-CN.md
  • 贡献者许可协议见 CLA.md
  • 贡献说明见 CONTRIBUTING.md

CLA 目的说明

本项目引入 CLA,是为了让维护者能够集中管理项目的商业使用授权,避免每次商业授权都需要逐一联系所有贡献者。

这不代表项目会走向公司化商业运营。维护者始终以开发者身份维护项目,不以成为 ManimCat 公司的老板或经理为目标。项目将长期保持开源立场,反对垄断。

若存在商业授权收入,资金将优先回馈项目本身,包括对项目基础建设、文档与测试完善、社区活动组织,以及对作出重大贡献开发者的支持。对于乐于开源、愿意回馈社区的小型商业公司,授权条款与费用将以象征性为主。

维护说明

由于作者精力有限(个人业余兴趣开发者,非专业背景),目前完全无法对外部代码进行有效的审查和长期维护。因此,本项目欢迎 PR,不过代码审查周期长。感谢理解。

如果你有好的建议或发现了 Bug,欢迎提交 Issue 进行讨论,我会根据自己的节奏进行改进。如果你希望在本项目基础上进行大规模修改,欢迎 Fork 出属于你自己的版本。

如果你觉得有启发与帮助,那是我的荣幸。

如果你觉得这个作品很好,也欢迎请作者喝可乐🥤

中国大陆用户:

赞助 ManimCat

海外用户:

爱发电赞助

感谢你的支持,我会更有动力维护这个项目!

Star History

Star History Chart

致谢