Skip to content

Commit 16d1a58

Browse files
committed
📝 Model deployment has arguments now 📝
1 parent f1008ec commit 16d1a58

5 files changed

Lines changed: 18 additions & 6 deletions

File tree

-9.99 KB
Loading

documentation/modules/ROOT/pages/0.adoc

Lines changed: 3 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -17,10 +17,11 @@ Un modelo sólo responde en base a lo que conoce. Es ahí donde entran en juego
1717
[#01]
1818
=== Objetivo
1919

20-
El objetivo de este taller es desplegar un **asistente** que ayude a los usuarios a calcular la penalización por un pago pendiente. Lo haremos utilizando un agente basado en Llama Stack, RAG y servidores MCP. Conocerás paso a paso cómo es el flujo de trabajo dentro de OpenShift AI para tanto el desarrollo como el despliegue del agente.
20+
El objetivo de este taller es desplegar un **asistente** para ayudar a los ciudadanos de un país ficticio, Lysmark. A través del chat, los usuarios podrán pedir información sobre la leyes del país. En este caso, nos centraremos en ofrecer información precisa sobre las penalizaciones por impago.
2121

22-
image::workshop.png[]
22+
La aplicación estará basada en un agente de IA basado en Llama Stack, RAG y servidores MCP. Conocerás paso a paso cómo es el flujo de trabajo dentro de OpenShift AI para tanto el desarrollo como el despliegue del agente.
2323

24+
image::workshop.png[]
2425

2526
[#02]
2627
=== Entorno

documentation/modules/ROOT/pages/2.adoc

Lines changed: 12 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -45,7 +45,18 @@ En el segundo paso, vamos a definir el **proyecto** con el nombre `{namespace}`.
4545

4646
image::deploy-model-2.png[]
4747

48-
En el tercer paso tenemos opciones de configuración avanzada. Modifica el formulario como se muestra en la siguiente imagen.
48+
En el tercer paso tenemos opciones de configuración avanzada. Modifica el formulario de la siguiente forma:
49+
50+
* Habilita la casilla `Add as AI asset endpoint`.
51+
* Habilita la casilla `Add custom runtime arguments` y pega abajo estos argumentos:
52+
53+
[.console-input]
54+
[source,bash,subs="+macros,+attributes"]
55+
----
56+
--enable-auto-tool-choice
57+
--tool-call-parser
58+
hermes
59+
----
4960

5061
image::deploy-model-3.png[]
5162

documentation/modules/ROOT/pages/5.adoc

Lines changed: 2 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -38,16 +38,15 @@ En `MCP Tools`, selecciona `all`. De esta forma habilitamos la comunicación a l
3838

3939
image::app.png[]
4040

41-
¡Genial! Primero vamos a verificar que el agente puede extraer información de la documentación con RAG. Escribe lo siguiente:
42-
41+
¡Genial! Primero vamos a verificar que el agente tiene acceso a la documentación gracias al RAG. Vamos a preguntar si conoce algo sobre el país para el que estamos creando el agente. Escribe lo siguiente:
4342

4443
[.console-input]
4544
[source,bash,subs="+macros,+attributes"]
4645
----
4746
Based on the documents that have been provided, what is Lysmark?
4847
----
4948

50-
*Lysmark* es el nombre ficticio del país que ha decidido poner en marcha a este agente de inteligencia artificial. Por lo que debería de ser capaz de dar una respuesta como esta:
49+
Debería de ser capaz de dar una respuesta como esta:
5150

5251
image::app-rag.png[]
5352

documentation/modules/ROOT/pages/7.adoc

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -11,6 +11,7 @@ Antes de terminar, vamos a hacer un repaso de todo lo que se ha hecho en este ta
1111
* Hemos desplegado un modelo Qwen3 en nuestro cluster y hemos comprobado sus respuestas desde el Playground.
1212
* Hemos visto más de cerca qué compone a un servidor MCP y qué es necesario para garantizar que funcione correctamente.
1313
* Hemos unificado la comunicación de nuestro stack desplegando una distribución de LlamaStack y sus respectivos componentes.
14+
* Hemos utilizado automatizaciones a través de pipelines para la ingestión de documentación y realizar RAG.
1415
* Hemos terminado desplegando la aplicación agéntica que usa todas las piezas de nuestra arquitectura.
1516
* Como paso final, hemos habilitado la observabilidad de trazas de nuestra aplicación agéntica.
1617

0 commit comments

Comments
 (0)