Skip to content

ihower/zh-tw-embedding-model-benchmark

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Benchmark Embedding model and Reranker model

Dataset: 台達閱讀理解資料集 drcd from https://huggingface.co/datasets/MediaTek-Research/TCEval-v2

Code

  • migrate.py 建立 SQLite3 資料庫
  • index-*.py 各家進行 embeddings 索引,向量存入 DB
  • benchmark.py 向量檢索評測
  • reranker-*.py 二階段檢索評測

早期版本使用 Supabase 遠端資料庫,後來改用 SQlite3 本機跑

About

使用繁體中文資料集做的 Embedding 模型評測

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages