Skip to content

一个为《名侦探柯南》粉丝打造的开放式信息检索平台。

License

Notifications You must be signed in to change notification settings

neyuki778/DConanInfoSearch

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

48 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DConanInfoSearch

一个旨在为《名侦探柯南》粉丝打造的开放式信息检索平台。

本项目致力于整理、处理并结构化柯南相关的访谈资料,搭建一个可以通过关键词快速搜索访谈内容的网站,帮助粉丝更方便地查找幕后信息、角色解析、创作细节等内容。


🔍 项目目标

构建一个可在线访问的网站,让用户能输入关键词,快速定位柯南作者及制作团队的访谈资料、幕后信息,并支持后续接入大语言模型问答功能。


📁 项目结构

1. 数据收集

目前收集和整理的资料来源包括:

✅ 所有资料均存储为结构化文本,统一编码,便于后续处理与检索。


2. 数据处理

  • 多页论坛文章自动爬取
  • 超链接图片与标题的提取与归档
  • 文本清洗与分段
  • 关键词提取与语境抓取
  • 搜索接口与预处理缓存优化

3. 前端 / 后端网站开发

  • 🔎 支持关键词检索(基于 Flask + HTML)
  • 🧩 支持搜索来源高亮、跳转链接
  • 🗃️ 漫画文本与访谈资料双模式切换
  • 🧠 未来将支持接入 LLM 进行智能问答

🧠 LLM 规划(To-do)

  • 将本地资料接入向量数据库(如 FAISS)
  • 构建基于 Retrieval-Augmented Generation(RAG) 的问答系统
  • 集成 OpenAI API / 本地 LLM 推理能力
  • 加入多轮对话与回答出处定位

📌 声明

本项目所有资料均来自公开互联网,仅用于非商业学术研究及粉丝整理。若涉及版权问题请联系删除。


🌐 在线体验(开发中)

即将部署上线,敬请期待! 试用版:https://dconaninfosearch.onrender.com

About

一个为《名侦探柯南》粉丝打造的开放式信息检索平台。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 63.6%
  • HTML 36.4%