一个旨在为《名侦探柯南》粉丝打造的开放式信息检索平台。
本项目致力于整理、处理并结构化柯南相关的访谈资料,搭建一个可以通过关键词快速搜索访谈内容的网站,帮助粉丝更方便地查找幕后信息、角色解析、创作细节等内容。
构建一个可在线访问的网站,让用户能输入关键词,快速定位柯南作者及制作团队的访谈资料、幕后信息,并支持后续接入大语言模型问答功能。
目前收集和整理的资料来源包括:
- 银色子弹:https://www.sbsub.com/posts/category/interviews/
- 名侦探柯南事务所论坛:https://bbs.aptx.cn/thread-296846-1-1.html
- B站:访谈视频、专栏文章等
- 贴吧访谈整理贴
- 柯南吧
- 柯哀分析文吧
- 外网博客与平台
- 日 fan 博客:http://bdamakuriimu.blog38.fc2.com/blog-entry-215.html
- 高山南博客、林原广播、X(原推特)等
- 印度蜜蜂和翎月推荐的平台:http://ww2.kenanapp.com/lander
- 其他官方消息来源
✅ 所有资料均存储为结构化文本,统一编码,便于后续处理与检索。
- 多页论坛文章自动爬取
- 超链接图片与标题的提取与归档
- 文本清洗与分段
- 关键词提取与语境抓取
- 搜索接口与预处理缓存优化
- 🔎 支持关键词检索(基于 Flask + HTML)
- 🧩 支持搜索来源高亮、跳转链接
- 🗃️ 漫画文本与访谈资料双模式切换
- 🧠 未来将支持接入 LLM 进行智能问答
- 将本地资料接入向量数据库(如 FAISS)
- 构建基于 Retrieval-Augmented Generation(RAG) 的问答系统
- 集成 OpenAI API / 本地 LLM 推理能力
- 加入多轮对话与回答出处定位
本项目所有资料均来自公开互联网,仅用于非商业学术研究及粉丝整理。若涉及版权问题请联系删除。
即将部署上线,敬请期待! 试用版:https://dconaninfosearch.onrender.com