Merge pull request #664 from joakimriedel/joakim/support-gpt4o

tom-englert · web-flow · commit a890246a7d51 · 2024-10-06T14:47:14.000+02:00
Use new tokenizer from Microsoft to support newer gpt4o model.
diff --git a/src/Directory.Packages.props b/src/Directory.Packages.props
@@ -12,7 +12,7 @@
     <PackageVersion Include="ILMerge.Fody" Version="1.24.0" />
     <PackageVersion Include="JetBrains.Annotations" Version="2024.2.0" />
     <PackageVersion Include="Microsoft.CSharp" Version="4.7.0" />
-    <PackageVersion Include="Microsoft.DeepDev.TokenizerLib" Version="[1.3.3]" />
+    <PackageVersion Include="Microsoft.ML.Tokenizers" Version="0.22.0-preview.24378.1" />
     <PackageVersion Include="Microsoft.NET.Test.Sdk" Version="17.11.1" />
     <PackageVersion Include="Microsoft.SourceLink.GitHub" Version="8.0.0" />
     <PackageVersion Include="Microsoft.VisualStudio.SDK" Version="[15.0.1]" />
diff --git a/src/ResXManager.Translators/AzureOpenAITranslator.cs b/src/ResXManager.Translators/AzureOpenAITranslator.cs
@@ -1,6 +1,6 @@
 ﻿namespace ResXManager.Translators;
 
-using global::Microsoft.DeepDev;
+using global::Microsoft.ML.Tokenizers;
 using Newtonsoft.Json;
 using ResXManager.Infrastructure;
 using System;
@@ -138,11 +138,11 @@ private sealed class ChatCompletionsResponse
 
     private async Task TranslateUsingChatModel(ITranslationSession translationSession, HttpClient client)
     {
-        const string ApiVersion = "2023-05-15";
+        const string ApiVersion = "2024-06-01";
         var endpointUri = new Uri($"/openai/deployments/{ModelDeploymentName}/chat/completions?api-version={ApiVersion}", UriKind.Relative);
-        var tokenizer = await TokenizerBuilder.CreateByModelNameAsync(
+        var tokenizer = TiktokenTokenizer.CreateForModel(
             ModelName ?? throw new InvalidOperationException("No model name provided in configuration!")
-            ).ConfigureAwait(false);
+            );
 
         var retries = 0;
 
@@ -200,7 +200,7 @@ private async Task TranslateUsingChatModel(ITranslationSession translationSessio
     }
 
     private IEnumerable<(ChatMessage message, ICollection<ITranslationItem> items)> PackChatModelMessagesIntoBatches(
-        ITranslationSession translationSession, IEnumerable<ITranslationItem> items, CultureInfo targetCulture, ITokenizer tokenizer
+        ITranslationSession translationSession, IEnumerable<ITranslationItem> items, CultureInfo targetCulture, TiktokenTokenizer tokenizer
         )
     {
         var batchItems = new List<ITranslationItem>();
@@ -209,7 +209,7 @@ private async Task TranslateUsingChatModel(ITranslationSession translationSessio
 
         foreach (var item in items)
         {
-            var currentBatch = batchItems.Concat(new[] { item }).ToList();
+            var currentBatch = batchItems.Concat([item]).ToList();
 
             var currentMessage = GenerateChatModelMessageForTranslations(translationSession, currentBatch, targetCulture);
             if (currentMessage?.Content is null)
@@ -218,7 +218,7 @@ private async Task TranslateUsingChatModel(ITranslationSession translationSessio
                 continue;
             }
 
-            var tokens = tokenizer.Encode(currentMessage.Content, new List<string>()).Count;
+            var tokens = tokenizer.CountTokens(currentMessage.Content);
             if (tokens > PromptTokens)
             {
                 translationSession.AddMessage($"Prompt for resource would exceed {PromptTokens} tokens: {item.Source.Substring(0, 20)}...");
@@ -235,7 +235,7 @@ private async Task TranslateUsingChatModel(ITranslationSession translationSessio
             {
                 yield return (batchMessage, batchItems);
 
-                batchItems = new List<ITranslationItem>();
+                batchItems = [];
                 batchTokens = 0;
             }
 
@@ -414,11 +414,11 @@ private sealed class CompletionsResponse
 
     private async Task TranslateUsingCompletionsModel(ITranslationSession translationSession, HttpClient client)
     {
-        const string ApiVersion = "2023-05-15";
+        const string ApiVersion = "2024-06-01";
         var endpointUri = new Uri($"/openai/deployments/{ModelDeploymentName}/completions?api-version={ApiVersion}", UriKind.Relative);
-        var tokenizer = await TokenizerBuilder.CreateByModelNameAsync(
+        var tokenizer = TiktokenTokenizer.CreateForModel(
             ModelName ?? throw new InvalidOperationException("No model name provided in configuration!")
-            ).ConfigureAwait(false);
+            );
 
         var retries = 0;
 
@@ -467,7 +467,7 @@ private async Task TranslateUsingCompletionsModel(ITranslationSession translatio
         }
     }
 
-    private IEnumerable<PromptList> PackCompletionModelPromptsIntoBatches(ITranslationSession translationSession, ITokenizer tokenizer)
+    private IEnumerable<PromptList> PackCompletionModelPromptsIntoBatches(ITranslationSession translationSession, TiktokenTokenizer tokenizer)
     {
         var batchItems = new PromptList();
         var batchTokens = 0;
@@ -481,7 +481,7 @@ private IEnumerable<PromptList> PackCompletionModelPromptsIntoBatches(ITranslati
                 continue;
             }
 
-            var tokens = tokenizer.Encode(prompt, new List<string>()).Count;
+            var tokens = tokenizer.CountTokens(prompt);
 
             if (tokens > PromptTokens)
             {
@@ -499,7 +499,7 @@ private IEnumerable<PromptList> PackCompletionModelPromptsIntoBatches(ITranslati
             {
                 yield return batchItems;
 
-                batchItems = new PromptList();
+                batchItems = [];
                 batchTokens = 0;
             }
 
@@ -634,12 +634,12 @@ public string? ModelName
 
     private static IList<ICredentialItem> GetCredentials()
     {
-        return new ICredentialItem[]
-        {
+        return
+        [
             new CredentialItem("AuthenticationKey", "Key"),
             new CredentialItem("Url", "Endpoint Url", false),
             new CredentialItem("ModelDeploymentName", "Model Deployment Name", false),
             new CredentialItem("ModelName", "Model Name", false),
-        };
+        ];
     }
 }
diff --git a/src/ResXManager.Translators/FodyWeavers.xml b/src/ResXManager.Translators/FodyWeavers.xml
@@ -2,5 +2,5 @@
 <Weavers xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="FodyWeavers.xsd">
   <Throttle />
   <PropertyChanged />
-  <ILMerge IncludeAssemblies="Microsoft.DeepDev.TokenizerLib" />
+  <ILMerge IncludeAssemblies="Microsoft.ML.Tokenizers" />
 </Weavers>
diff --git a/src/ResXManager.Translators/OpenAITranslator.cs b/src/ResXManager.Translators/OpenAITranslator.cs
@@ -1,6 +1,6 @@
 ﻿namespace ResXManager.Translators;
 
-using global::Microsoft.DeepDev;
+using global::Microsoft.ML.Tokenizers;
 using Newtonsoft.Json;
 using ResXManager.Infrastructure;
 using System;
@@ -145,9 +145,9 @@ private sealed class CompletionsResponse
     private async Task TranslateUsingCompletionsModel(ITranslationSession translationSession, HttpClient client)
     {
         var endpointUri = new Uri($"/v1/chat/completions", UriKind.Relative);
-        var tokenizer = await TokenizerBuilder.CreateByModelNameAsync(
+        var tokenizer = TiktokenTokenizer.CreateForModel(
             ModelName ?? throw new InvalidOperationException("No model name provided in configuration!")
-            ).ConfigureAwait(false);
+            );
 
         var retries = 0;
 
@@ -200,7 +200,7 @@ private async Task TranslateUsingCompletionsModel(ITranslationSession translatio
         }
     }
 
-    private IEnumerable<(ITranslationItem item, string prompt)> PackCompletionModelPrompts(ITranslationSession translationSession, ITokenizer tokenizer)
+    private IEnumerable<(ITranslationItem item, string prompt)> PackCompletionModelPrompts(ITranslationSession translationSession, TiktokenTokenizer tokenizer)
     {
         foreach (var item in translationSession.Items)
         {
@@ -211,7 +211,7 @@ private async Task TranslateUsingCompletionsModel(ITranslationSession translatio
                 continue;
             }
 
-            var tokens = tokenizer.Encode(prompt, new List<string>()).Count;
+            var tokens = tokenizer.CountTokens(prompt);
 
             if (tokens > PromptTokens)
             {
@@ -328,10 +328,10 @@ public string? ModelName
 
     private static IList<ICredentialItem> GetCredentials()
     {
-        return new ICredentialItem[]
-        {
+        return
+        [
             new CredentialItem("AuthenticationKey", "Key"),
             new CredentialItem("ModelName", "Model Name", false),
-        };
+        ];
     }
 }
diff --git a/src/ResXManager.Translators/ResXManager.Translators.csproj b/src/ResXManager.Translators/ResXManager.Translators.csproj
@@ -52,7 +52,7 @@
   <ItemGroup>
     <PackageReference Include="Fody" PrivateAssets="all" />
     <PackageReference Include="ILMerge.Fody" PrivateAssets="all" />
-    <PackageReference Include="Microsoft.DeepDev.TokenizerLib" />
+    <PackageReference Include="Microsoft.ML.Tokenizers" />
     <PackageReference Include="PropertyChanged.Fody" PrivateAssets="all" />
     <PackageReference Include="System.ComponentModel.Annotations" />
     <PackageReference Include="System.Net.Http" />

Original file line number	Diff line number	Diff line change
`@@ -1,6 +1,6 @@`
`1`	`1`	`namespace ResXManager.Translators;`
`2`	`2`
`3`		`-using global::Microsoft.DeepDev;`
	`3`	`+using global::Microsoft.ML.Tokenizers;`
`4`	`4`	`using Newtonsoft.Json;`
`5`	`5`	`using ResXManager.Infrastructure;`
`6`	`6`	`using System;`
`@@ -138,11 +138,11 @@ private sealed class ChatCompletionsResponse`
`138`	`138`
`139`	`139`	`private async Task TranslateUsingChatModel(ITranslationSession translationSession, HttpClient client)`
`140`	`140`	`{`
`141`		`- const string ApiVersion = "2023-05-15";`
	`141`	`+ const string ApiVersion = "2024-06-01";`
`142`	`142`	`var endpointUri = new Uri($"/openai/deployments/{ModelDeploymentName}/chat/completions?api-version={ApiVersion}", UriKind.Relative);`
`143`		`- var tokenizer = await TokenizerBuilder.CreateByModelNameAsync(`
	`143`	`+ var tokenizer = TiktokenTokenizer.CreateForModel(`
`144`	`144`	`ModelName ?? throw new InvalidOperationException("No model name provided in configuration!")`
`145`		`- ).ConfigureAwait(false);`
	`145`	`+ );`
`146`	`146`
`147`	`147`	`var retries = 0;`
`148`	`148`
`@@ -200,7 +200,7 @@ private async Task TranslateUsingChatModel(ITranslationSession translationSessio`
`200`	`200`	`}`
`201`	`201`
`202`	`202`	`private IEnumerable<(ChatMessage message, ICollection<ITranslationItem> items)> PackChatModelMessagesIntoBatches(`
`203`		`- ITranslationSession translationSession, IEnumerable<ITranslationItem> items, CultureInfo targetCulture, ITokenizer tokenizer`
	`203`	`+ ITranslationSession translationSession, IEnumerable<ITranslationItem> items, CultureInfo targetCulture, TiktokenTokenizer tokenizer`
`204`	`204`	`)`
`205`	`205`	`{`
`206`	`206`	`var batchItems = new List<ITranslationItem>();`
`@@ -209,7 +209,7 @@ private async Task TranslateUsingChatModel(ITranslationSession translationSessio`
`209`	`209`
`210`	`210`	`foreach (var item in items)`
`211`	`211`	`{`
`212`		`- var currentBatch = batchItems.Concat(new[] { item }).ToList();`
	`212`	`+ var currentBatch = batchItems.Concat([item]).ToList();`
`213`	`213`
`214`	`214`	`var currentMessage = GenerateChatModelMessageForTranslations(translationSession, currentBatch, targetCulture);`
`215`	`215`	`if (currentMessage?.Content is null)`
`@@ -218,7 +218,7 @@ private async Task TranslateUsingChatModel(ITranslationSession translationSessio`
`218`	`218`	`continue;`
`219`	`219`	`}`
`220`	`220`
`221`		`- var tokens = tokenizer.Encode(currentMessage.Content, new List<string>()).Count;`
	`221`	`+ var tokens = tokenizer.CountTokens(currentMessage.Content);`
`222`	`222`	`if (tokens > PromptTokens)`
`223`	`223`	`{`
`224`	`224`	`translationSession.AddMessage($"Prompt for resource would exceed {PromptTokens} tokens: {item.Source.Substring(0, 20)}...");`
`@@ -235,7 +235,7 @@ private async Task TranslateUsingChatModel(ITranslationSession translationSessio`
`235`	`235`	`{`
`236`	`236`	`yield return (batchMessage, batchItems);`
`237`	`237`
`238`		`- batchItems = new List<ITranslationItem>();`
	`238`	`+ batchItems = [];`
`239`	`239`	`batchTokens = 0;`
`240`	`240`	`}`
`241`	`241`
`@@ -414,11 +414,11 @@ private sealed class CompletionsResponse`
`414`	`414`
`415`	`415`	`private async Task TranslateUsingCompletionsModel(ITranslationSession translationSession, HttpClient client)`
`416`	`416`	`{`
`417`		`- const string ApiVersion = "2023-05-15";`
	`417`	`+ const string ApiVersion = "2024-06-01";`
`418`	`418`	`var endpointUri = new Uri($"/openai/deployments/{ModelDeploymentName}/completions?api-version={ApiVersion}", UriKind.Relative);`
`419`		`- var tokenizer = await TokenizerBuilder.CreateByModelNameAsync(`
	`419`	`+ var tokenizer = TiktokenTokenizer.CreateForModel(`
`420`	`420`	`ModelName ?? throw new InvalidOperationException("No model name provided in configuration!")`
`421`		`- ).ConfigureAwait(false);`
	`421`	`+ );`
`422`	`422`
`423`	`423`	`var retries = 0;`
`424`	`424`
`@@ -467,7 +467,7 @@ private async Task TranslateUsingCompletionsModel(ITranslationSession translatio`
`467`	`467`	`}`
`468`	`468`	`}`
`469`	`469`
`470`		`- private IEnumerable<PromptList> PackCompletionModelPromptsIntoBatches(ITranslationSession translationSession, ITokenizer tokenizer)`
	`470`	`+ private IEnumerable<PromptList> PackCompletionModelPromptsIntoBatches(ITranslationSession translationSession, TiktokenTokenizer tokenizer)`
`471`	`471`	`{`
`472`	`472`	`var batchItems = new PromptList();`
`473`	`473`	`var batchTokens = 0;`
`@@ -481,7 +481,7 @@ private IEnumerable<PromptList> PackCompletionModelPromptsIntoBatches(ITranslati`
`481`	`481`	`continue;`
`482`	`482`	`}`
`483`	`483`
`484`		`- var tokens = tokenizer.Encode(prompt, new List<string>()).Count;`
	`484`	`+ var tokens = tokenizer.CountTokens(prompt);`
`485`	`485`
`486`	`486`	`if (tokens > PromptTokens)`
`487`	`487`	`{`
`@@ -499,7 +499,7 @@ private IEnumerable<PromptList> PackCompletionModelPromptsIntoBatches(ITranslati`
`499`	`499`	`{`
`500`	`500`	`yield return batchItems;`
`501`	`501`
`502`		`- batchItems = new PromptList();`
	`502`	`+ batchItems = [];`
`503`	`503`	`batchTokens = 0;`
`504`	`504`	`}`
`505`	`505`
`@@ -634,12 +634,12 @@ public string? ModelName`
`634`	`634`
`635`	`635`	`private static IList<ICredentialItem> GetCredentials()`
`636`	`636`	`{`
`637`		`- return new ICredentialItem[]`
`638`		`- {`
	`637`	`+ return`
	`638`	`+ [`
`639`	`639`	`new CredentialItem("AuthenticationKey", "Key"),`
`640`	`640`	`new CredentialItem("Url", "Endpoint Url", false),`
`641`	`641`	`new CredentialItem("ModelDeploymentName", "Model Deployment Name", false),`
`642`	`642`	`new CredentialItem("ModelName", "Model Name", false),`
`643`		`- };`
	`643`	`+ ];`
`644`	`644`	`}`
`645`	`645`	`}`