donvito
diff --git a/‎src/app.ts‎
Lines changed: 16 additions & 1 deletion b/‎src/app.ts‎
Lines changed: 16 additions & 1 deletion
diff --git a/‎src/config/models.json‎
Lines changed: 29 additions & 30 deletions b/‎src/config/models.json‎
Lines changed: 29 additions & 30 deletions
diff --git a/‎src/config/models.ts‎
Lines changed: 2 additions & 1 deletion b/‎src/config/models.ts‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎src/routes/jsoneditor.ts‎ ‎src/routes/tools/jsoneditor.ts‎src/routes/jsoneditor.ts renamed to src/routes/tools/jsoneditor.ts
Lines changed: 1 addition & 1 deletion b/‎src/routes/jsoneditor.ts‎ ‎src/routes/tools/jsoneditor.ts‎src/routes/jsoneditor.ts renamed to src/routes/tools/jsoneditor.ts
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/routes/models.ts‎ ‎src/routes/tools/models.ts‎src/routes/models.ts renamed to src/routes/tools/models.ts b/‎src/routes/models.ts‎ ‎src/routes/tools/models.ts‎src/routes/models.ts renamed to src/routes/tools/models.ts
diff --git a/‎src/routes/v1/compose.ts‎
Lines changed: 136 additions & 0 deletions b/‎src/routes/v1/compose.ts‎
Lines changed: 136 additions & 0 deletions
diff --git a/‎src/routes/askTextDemo.ts‎ ‎src/routes/v1/demos/askTextDemo.ts‎src/routes/askTextDemo.ts renamed to src/routes/v1/demos/askTextDemo.ts b/‎src/routes/askTextDemo.ts‎ ‎src/routes/v1/demos/askTextDemo.ts‎src/routes/askTextDemo.ts renamed to src/routes/v1/demos/askTextDemo.ts
@@ -33,10 +33,25 @@ function configureApiSecurity(app: OpenAPIHono, tokenConfig: string) {
                 path === '/api/sentiment-demo' ||
                 path === '/api/keywords-demo' ||
                 path === '/api/email-reply-demo' ||
+                path === '/api/rewrite-demo' ||
+                path === '/api/compose-demo' ||
                 path === '/api/translate-demo' ||
                 path === '/api/meeting-notes-demo' ||
                 path === '/api/asktext-demo' ||
                 path === '/api/project-planner-demo' ||
+                // Versioned demo pages (v1)
+                path === '/api/v1/demos' ||
+                path === '/api/v1/highlighter-demo' ||
+                path === '/api/v1/summarize-demo' ||
+                path === '/api/v1/sentiment-demo' ||
+                path === '/api/v1/keywords-demo' ||
+                path === '/api/v1/email-reply-demo' ||
+                path === '/api/v1/rewrite-demo' ||
+                path === '/api/v1/compose-demo' ||
+                path === '/api/v1/translate-demo' ||
+                path === '/api/v1/meeting-notes-demo' ||
+                path === '/api/v1/asktext-demo' ||
+                path === '/api/v1/project-planner-demo' ||
                 path === '/api/models' ||
                 path === '/api/jsoneditor' ||
                 // Public read-only service catalog for demos
@@ -196,4 +211,4 @@ const initialize = async () => {
     return app;
 };
 
-export default initialize;
+export default initialize;
@@ -3,65 +3,64 @@
     "ollama": {
       "enabled": true,
       "models": [
-        { "name": "llama3.2:latest", "capabilities": ["summarize", "planning", "keywords", "sentiment", "emailReply", "translate"], "notes": "Meta Llama 3.2 general-purpose model." },
-        { "name": "qwen2.5-coder:latest", "capabilities": ["summarize", "planning", "keywords", "emailReply"], "notes": "Qwen 2.5 coder-optimized variant for code tasks." },
-        { "name": "gemma2:2b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "emailReply", "meetingNotes"], "notes": "Gemma 2 small variant for lightweight tasks." },
-        { "name": "gemma3:4b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "emailReply", "askText", "translate", "meetingNotes"], "notes": "Gemma 3 small variant for lightweight tasks with Q&A support." },
-        { "name": "qwen2.5:0.5b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "emailReply"], "notes": "Qwen 2.5 0.5B parameter model for ultra-light workloads." },
-        { "name": "qwen2.5:1.5b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "emailReply"], "notes": "Qwen 2.5 1.5B parameter model; balanced speed/quality." },
-        { "name": "qwen2.5:3b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate"], "notes": "Qwen 2.5 3B parameter model for stronger quality." },
-        { "name": "qwen2.5:7b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "emailReply"], "notes": "Qwen 2.5 7B parameter model for higher quality." },        
-        { "name": "llama3.2:1b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Llama 3.2 1B tiny variant for edge/light usage." },
-        { "name": "llama3.2:3b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Llama 3.2 3B small variant." },
-        { "name": "gemma3:270m", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply"], "notes": "Gemma 3 270M instruct tuned; great for ultra-fast summarization on CPU." }
+        { "name": "llama3.2:latest", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "emailReply", "translate"], "notes": "Meta Llama 3.2 general-purpose model." },
+        { "name": "qwen2.5-coder:latest", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "emailReply"], "notes": "Qwen 2.5 coder-optimized variant for code tasks." },
+        { "name": "gemma2:2b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "emailReply", "meetingNotes"], "notes": "Gemma 2 small variant for lightweight tasks." },
+        { "name": "gemma3:4b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "emailReply", "askText", "translate", "meetingNotes"], "notes": "Gemma 3 small variant for lightweight tasks with Q&A support." },
+        { "name": "qwen2.5:0.5b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "emailReply"], "notes": "Qwen 2.5 0.5B parameter model for ultra-light workloads." },
+        { "name": "qwen2.5:1.5b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "emailReply"], "notes": "Qwen 2.5 1.5B parameter model; balanced speed/quality." },
+        { "name": "qwen2.5:3b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate"], "notes": "Qwen 2.5 3B parameter model for stronger quality." },
+        { "name": "qwen2.5:7b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "emailReply"], "notes": "Qwen 2.5 7B parameter model for higher quality." },        
+        { "name": "llama3.2:1b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Llama 3.2 1B tiny variant for edge/light usage." },
+        { "name": "llama3.2:3b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Llama 3.2 3B small variant." },
+        { "name": "gemma3:270m", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply"], "notes": "Gemma 3 270M instruct tuned; great for ultra-fast summarization on CPU." }
       ]
     },
     "lmstudio": {
       "enabled": true,
       "models": [
-        { "name": "gemma-3-270m-it", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply"], "notes": "Gemma 3 270M instruct tuned; great for ultra-fast summarization on CPU." },
-        { "name": "llama-3.2-3b-instruct", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Llama 3.2 3B instruct; strong small model for summarization." }
+        { "name": "gemma-3-270m-it", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply"], "notes": "Gemma 3 270M instruct tuned; great for ultra-fast summarization on CPU." },
+        { "name": "llama-3.2-3b-instruct", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Llama 3.2 3B instruct; strong small model for summarization." }
       ]
     },
     "openai": {
       "enabled": true,
       "models": [
-        { "name": "gpt-4o-mini", "capabilities": ["summarize", "planning", "keywords", "sentiment", "vision", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI multimodal small model with vision support." },
-        { "name": "gpt-4.1-nano", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI lightweight model for fast, low-cost text tasks." },
-        { "name": "gpt-5-mini", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI next-gen mini model with Q&A capabilities." },
-        { "name": "gpt-5-nano", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI next-gen nano model with Q&A capabilities." },
-        { "name": "gpt-5", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI next-gen model with Q&A capabilities." },
-        { "name": "gpt-4o", "capabilities": ["summarize", "planning", "keywords", "sentiment", "vision", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI next-gen vision model with Q&A capabilities." }
+        { "name": "gpt-4o-mini", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "vision", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI multimodal small model with vision support." },
+        { "name": "gpt-4.1-nano", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI lightweight model for fast, low-cost text tasks." },
+        { "name": "gpt-5-mini", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI next-gen mini model with Q&A capabilities." },
+        { "name": "gpt-5-nano", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI next-gen nano model with Q&A capabilities." },
+        { "name": "gpt-5", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI next-gen model with Q&A capabilities." },
+        { "name": "gpt-4o", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "vision", "emailReply", "translate", "meetingNotes"], "notes": "OpenAI next-gen vision model with Q&A capabilities." }
       ]
     },
     "openrouter": {
       "enabled": true,
       "models": [
-        { "name": "anthropic/claude-3.5-sonnet", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Claude 3.5 Sonnet via OpenRouter; strong reasoning." },
-        { "name": "openai/gpt-4o-mini", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenRouter proxy to GPT-4o mini." },
-        { "name": "google/gemini-2.0-flash-lite-001", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Google Gemini 2.0 Flash Lite via OpenRouter with Q&A capabilities." },
-        { "name": "google/gemini-2.5-flash-lite", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Google Gemini 2.5 Flash Lite via OpenRouter with 1M token context window for large document Q&A." },
-        { "name": "openai/gpt-oss-20b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenRouter proxy to GPT OSS 20B" },
-        { "name": "openai/gpt-oss-120b", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenRouter proxy to GPT OSS 120B" }
+        { "name": "anthropic/claude-3.5-sonnet", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Claude 3.5 Sonnet via OpenRouter; strong reasoning." },
+        { "name": "openai/gpt-4o-mini", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenRouter proxy to GPT-4o mini." },
+        { "name": "google/gemini-2.0-flash-lite-001", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Google Gemini 2.0 Flash Lite via OpenRouter with Q&A capabilities." },
+        { "name": "google/gemini-2.5-flash-lite", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Google Gemini 2.5 Flash Lite via OpenRouter with 1M token context window for large document Q&A." },
+        { "name": "openai/gpt-oss-20b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenRouter proxy to GPT OSS 20B" },
+        { "name": "openai/gpt-oss-120b", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "OpenRouter proxy to GPT OSS 120B" }
       ]
     },
     "anthropic": {
       "enabled": true,
       "models": [
-        { "name": "claude-3-haiku-20240307", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Anthropic Claude 3 Haiku; fast and cost-effective with Q&A support." }
+        { "name": "claude-3-haiku-20240307", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Anthropic Claude 3 Haiku; fast and cost-effective with Q&A support." }
       ]
     },
     "aigateway": {
       "enabled": true,
       "models": [
-        { "name": "openai/gpt-5-nano", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "GPT-5 nano is a high throughput model that excels at simple instruction or classification tasks." },
-        { "name": "gemini-2.0-flash-lite-preview-02-05", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Gemini 2.0 Flash Lite Preview 02-05" },
-        { "name": "mistral-small-2503", "capabilities": ["summarize", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Mistral Small" }
+        { "name": "openai/gpt-5-nano", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "GPT-5 nano is a high throughput model that excels at simple instruction or classification tasks." },
+        { "name": "gemini-2.0-flash-lite-preview-02-05", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Gemini 2.0 Flash Lite Preview 02-05" },
+        { "name": "mistral-small-2503", "capabilities": ["summarize", "rewrite", "compose", "planning", "keywords", "sentiment", "askText", "emailReply", "translate", "meetingNotes"], "notes": "Mistral Small" }
 
 
       ]
     }
   }
 }
 
-
@@ -3,6 +3,8 @@ import * as path from 'path'
 
 export type ModelCapability =
   | 'summarize'
+  | 'rewrite'
+  | 'compose'
   | 'keywords'
   | 'sentiment'
   | 'planning'
@@ -66,4 +68,3 @@ export function getModelsCatalogByProvider(): Record<string, ProviderModelConfig
   return result
 }
 
-
 
@@ -418,4 +418,4 @@ router.openapi(jsonEditorRoute, (c) => {
 export default {
   handler: router,
   mountPath: 'jsoneditor'
-}; 
+}; 
@@ -0,0 +1,136 @@
+import { OpenAPIHono, createRoute, z } from '@hono/zod-openapi'
+import { Context } from 'hono'
+import { streamSSE } from 'hono/streaming'
+import { composePrompt } from '../../utils/prompts'
+import { handleError } from '../../utils/errorHandler'
+import { composeRequestSchema, composeResponseSchema, createComposeResponse } from '../../schemas/v1/compose'
+import { processTextOutputRequest } from '../../services/ai'
+import { apiVersion } from './versionConfig'
+import { createFinalResponse } from './finalResponse'
+
+const router = new OpenAPIHono()
+
+async function handleComposeRequest(c: Context) {
+  try {
+    const { payload, config } = await c.req.json()
+    const provider = config.provider
+    const model = config.model
+    const isStreaming = config.stream || false
+
+    const prompt = composePrompt(payload.topic, payload.maxLength)
+
+    if (isStreaming) {
+      const result = await processTextOutputRequest(prompt, config)
+
+      c.header('Content-Type', 'text/event-stream')
+      c.header('Cache-Control', 'no-cache')
+      c.header('Connection', 'keep-alive')
+
+      return streamSSE(c, async (stream) => {
+        try {
+          const textStream = result.textStream
+          if (!textStream) {
+            throw new Error('Streaming not supported for this provider/model')
+          }
+
+          for await (const chunk of textStream) {
+            await stream.writeSSE({
+              data: JSON.stringify({
+                chunk: chunk,
+                provider: provider,
+                model: model,
+                version: apiVersion
+              })
+            })
+          }
+
+          const usage = await result.usage
+          if (usage) {
+            await stream.writeSSE({
+              data: JSON.stringify({
+                done: true,
+                usage: {
+                  input_tokens: usage.promptTokens,
+                  output_tokens: usage.completionTokens,
+                  total_tokens: usage.totalTokens
+                },
+                provider: provider,
+                model: model,
+                version: apiVersion
+              })
+            })
+          }
+        } catch (error) {
+          try {
+            await stream.writeSSE({
+              data: JSON.stringify({
+                error: error instanceof Error ? error.message : 'Streaming error',
+                done: true
+              })
+            })
+          } catch {}
+        } finally {
+          try { await stream.close() } catch {}
+        }
+      })
+    }
+
+    const result = await processTextOutputRequest(prompt, config)
+    const finalResponse = createComposeResponse(result.text, provider, model, {
+      input_tokens: result.usage.promptTokens,
+      output_tokens: result.usage.completionTokens,
+      total_tokens: result.usage.totalTokens,
+    })
+
+    const finalResponseWithVersion = createFinalResponse(finalResponse, apiVersion)
+    return c.json(finalResponseWithVersion, 200)
+  } catch (error) {
+    return handleError(c, error, 'Failed to compose text')
+  }
+}
+
+router.openapi(
+  createRoute({
+    path: '/',
+    method: 'post',
+    security: [ { BearerAuth: [] } ],
+    request: {
+      body: {
+        content: {
+          'application/json': {
+            schema: composeRequestSchema
+          }
+        }
+      }
+    },
+    responses: {
+      200: {
+        description: 'Returns composed text for the provided topic.',
+        content: {
+          'application/json': {
+            schema: composeResponseSchema
+          }
+        }
+      },
+      401: {
+        description: 'Unauthorized - Bearer token required',
+        content: {
+          'application/json': {
+            schema: z.object({
+              error: z.string()
+            })
+          }
+        }
+      }
+    },
+    summary: 'Compose text',
+    description: 'This endpoint receives a topic and uses an LLM to compose text about it.',
+    tags: ['API']
+  }),
+  handleComposeRequest as any
+)
+
+export default {
+  handler: router,
+  mountPath: 'compose'
+}