Add field to disable reseting between generations

abetlen · abetlen · commit 6595ad84bfd5 · 2023-04-13T00:28:00.000-04:00
diff --git a/llama_cpp/llama.py b/llama_cpp/llama.py
@@ -218,6 +218,7 @@ def generate(
         top_p: float,
         temp: float,
         repeat_penalty: float,
+        reset: bool = True,
     ) -> Generator[
         llama_cpp.llama_token, Optional[Sequence[llama_cpp.llama_token]], None
     ]:
@@ -235,12 +236,14 @@ def generate(
             top_p: The top-p sampling parameter.
             temp: The temperature parameter.
             repeat_penalty: The repeat penalty parameter.
+            reset: Whether to reset the model state.
 
         Yields:
             The generated tokens.
         """
         assert self.ctx is not None
-        self.reset()
+        if reset:
+            self.reset()
         while True:
             self.eval(tokens)
             token = self.sample(