¿Qué son los Tests?
Los Tests son pruebas de regresión automatizadas que validan el comportamiento de tu agente. A diferencia de las Evaluaciones (que se ejecutan después de cada llamada real), los Tests se ejecutan bajo demanda en el Editor Avanzado para verificar que tu agente responde correctamente a escenarios específicos antes de desplegar cambios.Ejecuta tests después de modificar prompts, base de conocimiento o acciones para detectar regresiones antes de que afecten a clientes reales.
Accediendo a los Tests
Los Tests están ubicados en el panel derecho del Editor Avanzado. Haz clic en la pestaña Tests (icono de portapapeles) para acceder.Tests vs Evaluaciones
| Característica | Tests | Evaluaciones |
|---|---|---|
| Cuándo se ejecutan | Bajo demanda en el editor | Después de cada llamada real |
| Propósito | Validar escenarios específicos antes de desplegar | Medir calidad de llamadas en el tiempo |
| Configuración | Flujo de conversación + criterios de éxito | Preguntas sí/no |
| Resultado | Aprobado/fallo por test | Aprobado/fallo por evaluación por llamada |
Tipos de Tests
Tests de Escenario
Un test de Escenario define un flujo de conversación fijo. Especificas los mensajes exactos (usuario y agente) y una condición de éxito. El sistema evalúa si la respuesta del agente cumple tus criterios.| Propiedad | Descripción | Ejemplo |
|---|---|---|
| Historial de chat | Mensajes alternados usuario/agente | Usuario: “Hola” → Agente: “Buenos días…” |
| Condición de éxito | Lo que el agente debe lograr | ”El agente responde de manera profesional y útil” |
| Ejemplos de éxito | Respuestas de ejemplo que deben pasar | ”Buenos días, ¿en qué puedo ayudarle?” |
| Ejemplos de fallo | Respuestas de ejemplo que deben fallar | ”No tengo idea” |
Tests de Simulación
Un test de Simulación usa IA para simular un usuario. Defines una persona, objetivo y primer mensaje. El sistema ejecuta una conversación completa y evalúa el resultado.| Propiedad | Descripción | Ejemplo |
|---|---|---|
| Primer mensaje | Cómo empieza el usuario simulado | ”Hola, buenos días” |
| Persona | Perfil del usuario simulado | ”Cliente interesado en información” |
| Objetivo | Lo que quiere el usuario simulado | ”Obtener información sobre el servicio” |
Crear un Test
Paso 2 - Conversación
Para Escenario: Añade el flujo de conversación (mensajes usuario/agente). Para Simulación: Configura primer mensaje, persona y objetivo.
Paso 3 - Criterios
Define la condición de éxito y añade ejemplos de éxito/fallo para guiar la evaluación.
Variables de Contexto
Los tests pueden usar variables dinámicas que reemplazan marcadores en los prompts del agente durante la ejecución. Casos de uso comunes:| Variable | Propósito | Ejemplo |
|---|---|---|
fecha_y_hora_actual | Fecha y hora actual en español | ”Hoy es Miércoles 12 de Febrero de 2026 a las 14:30” |
| Parámetros de entrada | Variables específicas del agente | Nombre del cliente, número de pedido, etc. |
Configurar Variables de Contexto
- Haz clic en el icono Variables de contexto (llaves de código) en el encabezado de Tests
- Introduce valores para cada variable
- Haz clic en el icono de actualizar junto a
fecha_y_hora_actualpara actualizar la hora actual - Ejecuta tests - las variables se inyectan en el contexto del agente
Ejecutar Tests
Ejecutar Todos los Tests
Haz clic en Ejecutar todo para ejecutar cada test. Los resultados aparecen en la pestaña Historial.Ejecutar Tests Seleccionados
- Selecciona tests con las casillas de verificación
- Haz clic en Ejecutar todo (ejecuta los seleccionados cuando hay alguno marcado) o en el botón de reproducción en las tarjetas individuales
Ejecutar un Solo Test
Haz clic en el icono de reproducción (▶) en cualquier tarjeta de test para ejecutar solo ese test.Pestaña Historial
La pestaña Historial muestra ejecuciones anteriores:| Columna | Descripción |
|---|---|
| Fecha | Cuándo se ejecutó |
| Estado | Aprobados, fallos, o ejecutándose |
| Acciones | Ver detalles, reintentar fallidos, reintentar todo |
Ver Detalles de una Ejecución
- Cambia a la pestaña Historial
- Haz clic en una ejecución para abrir el modal de detalles
- Consulta los resultados individuales con respuestas del agente y razones de evaluación
- Usa Reintentar fallidos para volver a ejecutar solo los tests fallidos
- Usa Reintentar todo para volver a ejecutar todo el lote
Simular Conversación
La función Simular permite ejecutar una simulación única sin crear un test:- Haz clic en el icono de burbuja de chat en el encabezado de Tests
- Configura primer mensaje, persona y objetivo
- Establece el límite de turnos (por defecto 10)
- Haz clic para iniciar - observa la conversación simulada en tiempo real
Simular es útil para pruebas exploratorias rápidas. Usa tests de Escenario/Simulación cuando necesites validación automatizada y repetible.
Gestionar Tests
Editar un Test
Haz clic en el menú (⋮) en una tarjeta de test → Editar. Modifica la conversación, criterios o ejemplos.Clonar un Test
Haz clic en el menú (⋮) → Clonar para crear una copia. Útil para crear variaciones (ej. diferente primer mensaje, mismos criterios).Eliminar un Test
Haz clic en el menú (⋮) → Eliminar y confirma.Filtrar Tests
Usa el desplegable de filtro para mostrar:- Todos los tests - Cada test
- Aprobados - Solo tests que pasaron la última ejecución
- Fallidos - Solo tests que fallaron la última ejecución
Resultados de Tests
Cada tarjeta de test muestra su último resultado:| Icono | Estado | Significado |
|---|---|---|
| ✓ | Aprobado | La respuesta del agente cumplió los criterios de éxito |
| ✗ | Fallido | La respuesta del agente no cumplió los criterios |
| ⟳ | Ejecutando | El test se está ejecutando actualmente |
| ○ | Pendiente | Aún no ejecutado |
Mejores Prácticas
Prueba Rutas Críticas
Prueba Rutas Críticas
Crea tests para tus flujos más importantes: saludos, caso de uso principal, objeciones y cumplimiento.
Usa Ejemplos de Éxito/Fallo
Usa Ejemplos de Éxito/Fallo
Proporciona ejemplos claros para que el evaluador LLM entienda qué respuestas son “buenas” y “malas”.
Configura Variables de Contexto
Configura Variables de Contexto
Si tu agente usa o parámetros de entrada, configúralos en el panel de contexto antes de ejecutar tests.
Ejecuta Antes de Publicar
Ejecuta Antes de Publicar
Ejecuta tu suite de tests antes de publicar cambios para detectar regresiones temprano.
Combina con Copilot
Combina con Copilot
Después de que Copilot sugiera cambios, crea tests para validar esas mejoras.

