Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
56 commits
Select commit Hold shift + click to select a range
28d0326
docs: 添加代码更新与维护章节到 README
claude Dec 3, 2025
edf4c60
feat: 支持 LLM 和嵌入模型使用不同的 API 配置
claude Dec 3, 2025
1e1db7c
feat: 添加完整的 Docker 部署支持
claude Dec 5, 2025
d717bdf
fix: 使 HanLP 成为可选依赖,添加简单分词器作为后备方案
claude Dec 5, 2025
b08d4f8
feat: 添加完整的 Web 管理界面
claude Dec 6, 2025
2ff6f8c
fix: 修复前端导入错误并添加系统启动脚本
claude Dec 6, 2025
608082c
fix: 避免前端启动时触发 Neo4j 连接
claude Dec 6, 2025
49ab60d
fix: 改进启动脚本,添加 Docker 状态检查
claude Dec 6, 2025
fb374f4
feat: 添加仅启动 Neo4j 的脚本
claude Dec 6, 2025
06a03bb
fix: 修复前端页面导航和构建状态显示问题
claude Dec 7, 2025
5af2a86
feat: 改进用户体验和操作反馈
claude Dec 8, 2025
8497462
feat: 将系统转换为通用图谱构建器,支持用户定义领域和桥接点
claude Dec 8, 2025
9267fe6
feat: 添加 AI Copilot 智能配置向导
claude Dec 8, 2025
0ebd132
docs: 更新 README 以反映最新功能
claude Dec 9, 2025
fbaa43d
fix: 修复多个前端和Agent问题
claude Dec 9, 2025
0b0e8e2
fix: 修复多个前端和后端问题(第二轮)
claude Dec 9, 2025
25ff77d
fix: 修复 fusion_agent 和 API 路径问题
claude Dec 9, 2025
37f9091
feat: 添加向量索引缺失的友好错误提示
claude Dec 9, 2025
1e06b7a
feat: 改进构建反馈机制,提升用户体验
claude Dec 9, 2025
481e929
feat: 添加构建完成自动提醒和进度跟踪功能
claude Dec 9, 2025
0c27111
fix: 修复 yaml CLoader 导入兼容性问题
claude Dec 9, 2025
8095658
fix: 修复 yaml CLoader 导入兼容性问题
claude Dec 9, 2025
9bba303
feat: 合并所有新功能从 01MD6Gw7G4xaAZQWD7qmTsWE 分支
claude Dec 10, 2025
f995376
fix: 修复 AgentManager 内存泄漏问题
claude Dec 13, 2025
0dcd3fe
refactor: 移除 ResearchExecutor 中不稳定的正则表达式
claude Dec 13, 2025
d3517c3
feat: 在 Orchestrator 中实现简单查询的快速路由
claude Dec 13, 2025
da41c5c
refactor: 使用多态移除 chat_service 中的 Agent 特定逻辑
claude Dec 13, 2025
31b7c92
test: 添加优化功能的集成测试和验证脚本
claude Dec 13, 2025
e90d062
feat: 实现 L0/L1 拆分管道 - 用户上传后立即可搜索
claude Dec 13, 2025
66bc711
feat: 实现三层自适应路由(FAST/SLOW/HEAVY)
claude Dec 13, 2025
9fa4cce
feat: 实现 WebSocket 实时进度推送系统
claude Dec 13, 2025
7a798a6
feat: 添加 SSE (Server-Sent Events) 实时进度推送
claude Dec 13, 2025
b541461
feat: 实现实体对齐 (Entity Resolution) 管道
claude Dec 13, 2025
6105c84
feat: 集成语义缓存 (Semantic Cache)
claude Dec 13, 2025
3f11820
feat: 实现图谱可视化交互 API (Graph Explorer)
claude Dec 13, 2025
3eb934b
feat: 建立 RAGAS 评估流水线
claude Dec 13, 2025
8e2d7d0
docs: 更新主文档以反映新功能
claude Dec 14, 2025
7edf7e7
fix: 修复服务启动的导入路径问题
claude Dec 14, 2025
750fc2c
fix: 为 Agent 方法添加 **kwargs 支持以接受灵活参数
claude Dec 14, 2025
872eeef
fix: 修复增量更新 V2 导入错误和文件权限问题
claude Dec 14, 2025
9d8f045
fix: 将 IncrementalUpdateManagerV2 方法改为全异步
claude Dec 14, 2025
c5da40f
feat: 集成 V2 引擎到 Admin API,实现真·全量构建
claude Dec 14, 2025
3f3fb44
feat: 增强后台任务日志输出以便调试
leoleo112s Dec 17, 2025
76721fa
docs: 更新说明文档以反映 V2 增量更新引擎特性
claude Dec 17, 2025
1f771ff
refactor: 重构 Vector Index 系统为工程级实践(第一阶段)
claude Dec 17, 2025
566cfc0
refactor: 重构 Retriever 为 Neo4j 原生 Vector Search(第二阶段)
claude Dec 17, 2025
f29588f
refactor: 统一返回结构与架构解耦(第三阶段)
claude Dec 17, 2025
4953832
fix: 修复 Tool._run() 返回类型导致的 500 错误
claude Dec 17, 2025
f37036e
feat: 双 Chunker 策略 + 实体频率约束(解决实体爆炸问题)
claude Dec 17, 2025
d29765f
feat: 生产级 GraphRAG 验证配置(三板斧组合拳)
claude Dec 17, 2025
a8187df
feat: 代码级实体抽取重构(生产级完整版)
claude Dec 17, 2025
7be947c
feat: Schema-aware Routing(最小改动版合并方案)
claude Dec 18, 2025
600a070
feat: 代码级实体抽取重构(生产级完整版)
claude Dec 18, 2025
82efc7e
docs: 更新项目文档(生产级实体抽取 + Schema-aware Routing)
claude Dec 18, 2025
85152be
feat: 添加知识图谱清理和重建工具
claude Dec 18, 2025
217b786
use configured vector indexes
leoleo112s Dec 18, 2025
File filter

Filter by extension

Filter by extension


Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
50 changes: 50 additions & 0 deletions .dockerignore
Original file line number Diff line number Diff line change
@@ -0,0 +1,50 @@
# Git
.git
.gitignore
.gitattributes

# Python
__pycache__
*.py[cod]
*$py.class
*.so
.Python
*.egg-info
dist
build
.venv
venv
env

# IDE
.vscode
.idea
*.swp
*.swo
*~

# 缓存和日志
cache/
*.log
.DS_Store

# 环境变量(会单独挂载)
.env
.env.local
.env.backup*

# 测试
.pytest_cache
.coverage
htmlcov

# 文档
*.md
docs/

# Neo4j 数据(会用 volume)
neo4j_data/
neo4j_logs/

# 文件注册表(会单独挂载)
file_registry.json
19 changes: 17 additions & 2 deletions .env.example
Original file line number Diff line number Diff line change
@@ -1,14 +1,25 @@
# === OpenAI 相关 ===
# OpenAI API 密钥
# 通用配置(如果不单独配置 LLM 和嵌入模型,则两者共用以下配置)
OPENAI_API_KEY = 'sk-xxx'
# OpenAI 兼容服务地址(可指向代理或本地兼容服务)
OPENAI_BASE_URL = 'http://localhost:13000/v1'

# 向量模型名称(用于嵌入检索)
OPENAI_EMBEDDINGS_MODEL = 'text-embedding-3-large'
# 生成模型名称(用于回答生成)
OPENAI_LLM_MODEL = 'gpt-4o'

# === 混合使用不同 API(可选配置)===
# 如果您想为 LLM 和嵌入模型使用不同的 API 服务,可以单独配置:
# 例如:LLM 用 DeepSeek(便宜),嵌入用 OpenAI(质量好)

# LLM 专用配置(如不设置则使用上面的 OPENAI_API_KEY 和 OPENAI_BASE_URL)
# OPENAI_LLM_API_KEY = 'sk-your-deepseek-key'
# OPENAI_LLM_BASE_URL = 'https://api.deepseek.com/v1'

# 嵌入模型专用配置(如不设置则使用上面的 OPENAI_API_KEY 和 OPENAI_BASE_URL)
# OPENAI_EMBEDDING_API_KEY = 'sk-your-openai-key'
# OPENAI_EMBEDDING_BASE_URL = 'https://api.openai.com/v1'

# 采样温度:越高越随机,建议 0~1
TEMPERATURE = 0
# 生成回答的最大 Token 限制
Expand Down Expand Up @@ -259,3 +270,7 @@ LANGSMITH_ENDPOINT="https://api.smith.langchain.com"
LANGSMITH_API_KEY="xxx"
# Langsmith 项目名称
LANGSMITH_PROJECT="xxx"

# === 其他配置 ===
# 禁用 tokenizers fork 警告
TOKENIZERS_PARALLELISM=false
Loading