Merge pull request #13 from AnswerDotAI/feat/rankllm_

bclavie · web-flow · commit 01febd374a5d · 2024-05-17T16:11:37.000+02:00
RELEASE: 0.3.0, RankLLM, Document, QoL
diff --git a/README.md b/README.md
@@ -14,7 +14,8 @@ Welcome to `rerankers`! Our goal is to provide users with a simple API to use an
 
 ## Updates
 
-- v0.2.0: 🆕 [FlashRank](https://github.com/PrithivirajDamodaran/FlashRank) rerankers, Basic async support thanks to [@tarunamasa](https://github.com/tarunamasa), MixedBread.ai reranking API
+- v0.3.0: 🆕 Many changes! Experimental support for RankLLM, directly backed by the [rank-llm library](https://github.com/castorini/rank_llm). A new `Document` object, courtesy of joint-work by [@bclavie](https://github.com/bclavie) and [Anmol6](https://github.com/Anmol6). This object is transparent, but now offers support for `metadata` stored alongside each document. Many small QoL changes (RankedResults can be itered on directly...)
+- v0.2.0: [FlashRank](https://github.com/PrithivirajDamodaran/FlashRank) rerankers, Basic async support thanks to [@tarunamasa](https://github.com/tarunamasa), MixedBread.ai reranking API
 - v0.1.2: Voyage reranking API
 - v0.1.1: Langchain integration fixed!
 - v0.1.0: Initial release
@@ -59,6 +60,9 @@ pip install "rerankers[api]"
 # FlashRank rerankers (ONNX-optimised, very fast on CPU)
 pip install "rerankers[fastrank]"
 
+# RankLLM rerankers (better RankGPT + support for local models such as RankZephyr and RankVicuna)
+pip install "rerankers[rankllm]"
+
 # All of the above
 pip install "rerankers[all]"
 ```
@@ -105,12 +109,27 @@ ranker = Reranker("rankgpt3", api_key = API_KEY)
 # RankGPT with another LLM provider
 ranker = Reranker("MY_LLM_NAME" (check litellm docs), model_type = "rankgpt", api_key = API_KEY)
 
+# RankLLM with default GPT (GPT-4o)
+ranker = Reranker("rankllm", api_key = API_KEY)
+
+# RankLLM with specified GPT models
+ranker = Reranker('gpt-4-turbo', model_type="rankllm", api_key = API_KEY)
+
+# EXPERIMENTAL: RankLLM with RankZephyr
+ranker = Reranker('rankzephyr')
+
 # ColBERTv2 reranker
 ranker = Reranker("colbert")
 
 # ... Or a non-default colbert model:
 ranker = Reranker(model_name_or_path, model_type = "colbert")
 
+# Flashrank
+ranker = Reranker('flashrank')
+
+# ... Or a specific model
+ranker = Reranker('ms-marco-TinyBERT-L-2-v2', model_type='flashrank')
+
 ```
 
 _Rerankers will always try to infer the model you're trying to use based on its name, but it's always safer to pass a `model_type` argument to it if you can!_
@@ -180,18 +199,18 @@ Legend:
 
 Models:
 - ✅ Any standard SentenceTransformer or Transformers cross-encoder
-- 🟠 RankGPT (Implemented using original repo, but missing the rankllm's repo improvements)
+- ✅ RankGPT (Available both via the original RankGPT implementation and the improved RankLLM one)
 - ✅ T5-based pointwise rankers (InRanker, MonoT5...)
 - ✅ Cohere, Jina, Voyage and MixedBread API rerankers
 - ✅ [FlashRank](https://github.com/PrithivirajDamodaran/FlashRank) rerankers (ONNX-optimised models, very fast on CPU)
 - 🟠 ColBERT-based reranker - not a model initially designed for reranking, but quite strong (Implementation could be optimised and is from a third-party implementation.)
-- 📍 MixedBread API (Reranking API not yet released)
-- 📍⭐ RankLLM/RankZephyr (Proper RankLLM implementation will replace the RankGPT one, and introduce RankZephyr support)
+- 🟠⭐ RankLLM/RankZephyr: supported by wrapping the [rank-llm library](https://github.com/castorini/rank_llm) library! Support for RankZephyr/RankVicuna is untested, but RankLLM + GPT models fully works!
 - 📍 LiT5
 
 Features:
+- ✅ Metadata!
 - ✅ Reranking 
 - ✅ Consistency notebooks to ensure performance on `scifact` matches the litterature for any given model implementation (Except RankGPT, where results are harder to reproduce).
+- ✅ ONNX runtime support --> Offered through [FlashRank](https://github.com/PrithivirajDamodaran/FlashRank) -- in line with the philosophy of the lib, we won't reinvent the wheel when @PrithivirajDamodaran is doing amazing work!
 - 📍 Training on Python >=3.10 (via interfacing with other libraries)
-- 📍 ONNX runtime support --> Unlikely to be immediate
 - ❌(📍Maybe?) Training via rerankers directly
diff --git a/examples/overview.ipynb b/examples/overview.ipynb
diff --git a/pyproject.toml b/pyproject.toml
@@ -14,7 +14,7 @@ packages = [
 name = "rerankers" 
 
 
-version = "0.2.0"
+version = "0.3.0"
 
 description = "A unified API for various document re-ranking models."
 
@@ -52,12 +52,13 @@ dependencies = [
 ]
 
 [project.optional-dependencies]
-all = ["transformers", "torch", "litellm", "requests", "sentencepiece", "protobuf", "flashrank"]
-transformers = ["transformers", "torch", "sentencepiece", "protobuf"]
+all = ["transformers", "torch", "litellm", "requests", "sentencepiece", "protobuf", "flashrank", "rank-llm"]
+transformers = ["transformers", "torch", "sentencepiece",  "protobuf"]
 api = ["requests"]
 gpt = ["litellm"]
 flashrank = ["flashrank"]
+rankllm = ["rank-llm"]
 dev = ["ruff", "isort", "pytest", "ipyprogress", "ipython", "ranx", "ir_datasets", "srsly"]
 
 [project.urls]
-"Homepage" = "https://github.com/bclavie/rerankers"
+"Homepage" = "https://github.com/answerdotai/rerankers"
diff --git a/rerankers/__init__.py b/rerankers/__init__.py
@@ -2,4 +2,4 @@
 from rerankers.documents import Document
 
 __all__ = ["Reranker", "Document"]
-__version__ = "0.2.0"
+__version__ = "0.3.0"
diff --git a/rerankers/models/__init__.py b/rerankers/models/__init__.py
@@ -38,3 +38,10 @@
     AVAILABLE_RANKERS["FlashRankRanker"] = FlashRankRanker
 except ImportError:
     pass
+
+try:
+    from rerankers.models.rankllm_ranker import RankLLMRanker
+
+    AVAILABLE_RANKERS["RankLLMRanker"] = RankLLMRanker
+except ImportError:
+    pass
diff --git a/rerankers/models/flashrank_ranker.py b/rerankers/models/flashrank_ranker.py
@@ -4,12 +4,9 @@
 
 
 from typing import Union, List, Optional, Tuple
-from rerankers.utils import (
-    vprint,
-    ensure_docids,
-    ensure_docs_list,
-)
+from rerankers.utils import vprint, prep_docs
 from rerankers.results import RankedResults, Result
+from rerankers.documents import Document
 
 
 class FlashRankRanker(BaseRanker):
@@ -34,20 +31,21 @@ def tokenize(self, inputs: Union[str, List[str], List[Tuple[str, str]]]):
     def rank(
         self,
         query: str,
-        docs: List[str],
-        doc_ids: Optional[List[Union[str, int]]] = None,
+        docs: Union[str, List[str], Document, List[Document]],
+        doc_ids: Optional[Union[List[str], List[int]]] = None,
+        metadata: Optional[List[dict]] = None,
     ) -> RankedResults:
-        docs = ensure_docs_list(docs)
-        doc_ids = ensure_docids(doc_ids, len(docs))
-        passages = [{"id": doc_id, "text": doc} for doc_id, doc in zip(doc_ids, docs)]
+        docs = prep_docs(docs, doc_ids, metadata)
+        passages = [
+            {"id": doc_idx, "text": doc.text} for doc_idx, doc in enumerate(docs)
+        ]
 
         rerank_request = RerankRequest(query=query, passages=passages)
         flashrank_results = self.model.rerank(rerank_request)
 
         ranked_results = [
             Result(
-                doc_id=result["id"],
-                text=result["text"],
+                document=docs[idx],
                 score=result["score"],
                 rank=idx + 1,
             )
diff --git a/rerankers/models/rankgpt_rankers.py b/rerankers/models/rankgpt_rankers.py
@@ -126,7 +126,7 @@ def _query_llm(self, messages: List[Dict[str, str]]) -> str:
     def rank(
         self,
         query: str,
-        docs: Union[Document, List[Document]],
+        docs: Union[str, List[str], Document, List[Document]],
         doc_ids: Optional[Union[List[str], List[int]]] = None,
         metadata: Optional[List[dict]] = None,
         rank_start: int = 0,
diff --git a/rerankers/models/rankllm.py b/rerankers/models/rankllm.py
diff --git a/rerankers/models/rankllm_ranker.py b/rerankers/models/rankllm_ranker.py
@@ -0,0 +1,76 @@
+from typing import Optional, Union, List
+from rerankers.models.ranker import BaseRanker
+from rerankers.documents import Document
+from rerankers.results import RankedResults, Result
+from rerankers.utils import prep_docs
+
+from rank_llm.data import Candidate, Query, Request
+from rank_llm.rerank.vicuna_reranker import VicunaReranker
+from rank_llm.rerank.zephyr_reranker import ZephyrReranker
+from rank_llm.rerank.rank_gpt import SafeOpenai
+from rank_llm.rerank.reranker import Reranker as rankllm_Reranker
+
+
+class RankLLMRanker(BaseRanker):
+    def __init__(
+        self,
+        model: str,
+        api_key: Optional[str] = None,
+        lang: str = "en",
+        verbose: int = 1,
+    ) -> "RankLLMRanker":
+        self.api_key = api_key
+        self.model = model
+        self.verbose = verbose
+        self.lang = lang
+
+        if "zephyr" in self.model.lower():
+            self.rankllm_ranker = ZephyrReranker()
+        elif "vicuna" in self.model.lower():
+            self.rankllm_ranker = VicunaReranker()
+        elif "gpt" in self.model.lower():
+            self.rankllm_ranker = rankllm_Reranker(
+                SafeOpenai(model=self.model, context_size=4096, keys=self.api_key)
+            )
+
+    def rank(
+        self,
+        query: str,
+        docs: Union[str, List[str], Document, List[Document]],
+        doc_ids: Optional[Union[List[str], List[int]]] = None,
+        metadata: Optional[List[dict]] = None,
+        rank_start: int = 0,
+        rank_end: int = 0,
+    ) -> RankedResults:
+        docs = prep_docs(docs, doc_ids, metadata)
+
+        request = Request(
+            query=Query(text=query, qid=1),
+            candidates=[
+                Candidate(doc={"text": doc.text}, docid=doc_idx, score=1)
+                for doc_idx, doc in enumerate(docs)
+            ],
+        )
+
+        rankllm_results = self.rankllm_ranker.rerank(
+            request,
+            rank_end=len(docs) if rank_end == 0 else rank_end,
+            window_size=min(20, len(docs)),
+            step=10,
+        )
+
+        ranked_docs = []
+
+        for rank, result in enumerate(rankllm_results.candidates, start=rank_start):
+            ranked_docs.append(
+                Result(
+                    document=docs[result.docid],
+                    rank=rank,
+                )
+            )
+
+        return RankedResults(results=ranked_docs, query=query, has_scores=False)
+
+    def score(self):
+        print("Listwise ranking models like RankLLM cannot output scores!")
+        return None
diff --git a/rerankers/reranker.py b/rerankers/reranker.py
@@ -1,4 +1,5 @@
 from typing import Optional
+import warnings
 from rerankers.models import AVAILABLE_RANKERS
 from rerankers.models.ranker import BaseRanker
 from rerankers.utils import vprint
@@ -21,6 +22,7 @@
     "rankgpt": {"en": "gpt-4-turbo-preview", "other": "gpt-4-turbo-preview"},
     "rankgpt3": {"en": "gpt-3.5-turbo", "other": "gpt-3.5-turbo"},
     "rankgpt4": {"en": "gpt-4", "other": "gpt-4"},
+    "rankllm": {"en": "gpt-4o", "other": "gpt-4o"},
     "colbert": {
         "en": "colbert-ir/colbertv2.0",
         "fr": "bclavie/FraColBERTv2",
@@ -38,6 +40,7 @@
     "APIRanker": "api",
     "ColBERTRanker": "transformers",
     "FlashRankRanker": "flashrank",
+    "RankLLMRanker": "rankllm",
 }
 
 PROVIDERS = ["cohere", "jina", "voyage", "mixedbread.ai"]
@@ -72,6 +75,7 @@ def _get_model_type(model_name: str, explicit_model_type: Optional[str] = None)
             "colbert": "ColBERTRanker",
             "cross-encoder": "TransformerRanker",
             "flashrank": "FlashRankRanker",
+            "rankllm": "RankLLMRanker",
         }
         return model_mapping.get(explicit_model_type, explicit_model_type)
     else:
@@ -80,6 +84,8 @@ def _get_model_type(model_name: str, explicit_model_type: Optional[str] = None)
             "lit5": "LiT5Ranker",
             "t5": "T5Ranker",
             "inranker": "T5Ranker",
+            "rankllm": "RankLLMRanker",
+            "rankgpt": "RankGPTRanker",
             "gpt": "RankGPTRanker",
             "zephyr": "RankZephyr",
             "colbert": "ColBERTRanker",
@@ -88,9 +94,16 @@ def _get_model_type(model_name: str, explicit_model_type: Optional[str] = None)
             "voyage": "APIRanker",
             "ms-marco-minilm-l-12-v2": "FlashRankRanker",
             "ms-marco-multibert-l-12": "FlashRankRanker",
+            "vicuna": "RankLLMRanker",
+            "zephyr": "RankLLMRanker",
         }
         for key, value in model_mapping.items():
             if key in model_name:
+                if key == "gpt":
+                    warnings.warn(
+                        "The key 'gpt' currently defaults to the rough rankGPT implementation. From version 0.0.5 onwards, 'gpt' will default to RankLLM instead. Please specify the 'rankgpt' `model_type` if you want to keep the current behaviour",
+                        DeprecationWarning,
+                    )
                 return value
         if (
             any(