Synapse Studio: Una Oficina Virtual 2D Donde los Agentes IA Hacen el Trabajo Real
Gonzalo Monzón
Fundador & Arquitecto Principal
¿Y si tu IA no fuera una ventana de chat sino una oficina virtual? Un espacio visual donde puedes ver agentes caminando entre escritorios, sentándose a trabajar en tareas, pensando, colaborando — y entregando resultados reales. Eso es Synapse Studio: una oficina animada 2D (piensa en SimTower + IA) donde equipos multi-agente con 7 capacidades multimodales procesan tareas reales de forma autónoma.
Sin React. Sin frameworks. Zero dependencias npm. Solo Vanilla JS, animaciones CSS e infraestructura edge de Cloudflare. Este artículo cubre la arquitectura, la orquestación multi-agente y el sistema de evolución iterativa de imágenes que lo hace único.
El Concepto: ¿Por Qué una Oficina Virtual?
La IA es abstracta. Envías un prompt, recibes una respuesta. Pero cuando estás orquestando múltiples agentes IA trabajando en paralelo en una tarea compleja — investigación, análisis, generación de imágenes, revisión de calidad, compilación final — la abstracción se rompe. ¿Quién hace qué? ¿Cuál es el estado? ¿Dónde está el cuello de botella?
Convertimos la abstracción en una metáfora espacial:
- Cada agente tiene un escritorio en un edificio de oficinas 2D
- Los departamentos ocupan pisos diferentes (Marketing, Ventas, Soporte, Creativo)
- Los agentes se mueven físicamente para colaborar — los ves caminar al escritorio de un colega
- Estados visuales: idle (en su mesa), pensando (animación), trabajando (tecleando), colaborando (en otro escritorio)
- El progreso de las tareas es visible en tiempo real a través de la actividad de la oficina
No es un gimmick — es una solución UX genuina al problema de observabilidad multi-agente. Cuando tienes 4 agentes trabajando en una tarea, ves el trabajo ocurriendo.
7 Capacidades Multimodales
Cada agente puede configurarse con cualquier combinación de estas capacidades:
| Capacidad | Código | Qué Hace | Proveedor |
|---|---|---|---|
| LLM (Texto) | Base | Chat, razonamiento, análisis | Gemini / Claude / GPT-4o / Groq |
| Búsqueda Web | F1 | Búsqueda en internet en tiempo real | Groq Compound Beta |
| Visión (ITT) | F2 | Analizar y entender imágenes | Gemini 2.0 Flash |
| Texto-a-Imagen (TTI) | F3 | Generar imágenes desde texto | FLUX Schnell / SDXL Lightning |
| Imagen-a-Imagen (I2I) | F6 | Transformar imágenes iterativamente | Stable Diffusion 1.5 / SDXL |
| Voz-a-Texto (STT) | F4 | Transcribir audio | ElevenLabs Scribe / Whisper |
| Texto-a-Voz (TTS) | F5 | Generar narración de voz | ElevenLabs |
El insight clave: los agentes no son chatbots con extras. Son trabajadores multimodales. Un "Diseñador Visual" tiene TTI + I2I + Visión. Un "Investigador" tiene LLM + Búsqueda Web. Un agente "Fullstack Media" tiene las 7 capacidades. El rol define el cinturón de herramientas, no al revés.
Orquestación Multi-Agente
Cuando llega una tarea — de Cadences, un formulario público, un scraper o un webhook — el motor de orquestación toma el control:
Tarea entrante
│
├── IA Orquestadora analiza la tarea
│ └── Genera plan de ejecución multi-agente
│
├── Asignación de roles
│ ├── Agente 1: Investigación (recopilación, búsqueda web)
│ ├── Agente 2: Expertise (análisis profundo con IA premium)
│ ├── Agente 3: Revisión (control de calidad, verificación)
│ └── Agente 4: Compilación (entregable final)
│
├── Ejecución con IA Dual
│ ├── IA Rápida: respuestas rápidas (Groq, DeepSeek)
│ └── IA Profunda: análisis exhaustivo (Gemini 2.5, Claude)
│
└── Entrega
├── Email
├── WhatsApp
└── Webhook
El sistema de IA Dual es crítico para optimización de costes. La IA Rápida gestiona el análisis inicial, routing y subtareas simples a coste casi cero (Groq es esencialmente gratis a nuestro volumen). La IA Profunda solo se activa para razonamiento complejo, generación creativa o outputs de calidad crítica — ahorrando ~70% en costes IA vs. ejecutar todo con modelos premium.
1-8 Agentes Por Tarea
No toda tarea necesita 8 agentes. Un simple "investiga este tema" puede usar 1 agente con LLM + Búsqueda Web. Un complejo "crea una campaña de marketing con visuales" puede usar 5 agentes en roles de Investigación, Copy, Diseño, Revisión y Compilación. El orquestador decide según la complejidad.
I2I: Evolución Iterativa de Imágenes
Esta es la feature más innovadora. En lugar de generar una imagen y esperar que sea correcta, Synapse Studio evoluciona imágenes a través de cadenas de transformaciones:
Imagen original → Transformación I2I (strength: 0.7) → Resultado v1
│
IA propone siguiente paso
│
Subtarea automática creada
│
Resultado v1 → I2I Transform → v2
│
...continúa
Cada transformación tiene dos parámetros clave:
- Strength (0.0-1.0): Cuánto cambia la imagen. 0.3 = refinamiento sutil. 0.9 = reimaginación dramática.
- Guidance (1-20): Cuán literalmente la IA sigue el prompt de texto. Mayor = más literal.
Después de cada transformación, la IA analiza el resultado y propone la siguiente iteración — qué cambiar, qué mantener, qué strength usar. La cadena continúa hasta alcanzar max_depth o la IA decide que el resultado es óptimo.
Casos de uso: refinamiento de logos, iteración de concept art, evolución de transferencia de estilo, mejora progresiva de detalles. Cada paso construye sobre el anterior, manteniendo consistencia visual mientras explora direcciones creativas.
Dos Bots Integrados
SynapseBot (El Arquitecto)
Un wizard conversacional que crea agencias completas desde lenguaje natural:
"Necesito una agencia de marketing con 5 agentes especializados en redes sociales, copywriting y diseño visual"
SynapseBot genera toda la estructura: nombre de agencia, departamentos, agentes con roles y capacidades predefinidos. Setup instantáneo de equipo multi-agente.
CommandBot (El CEO)
Un CEO IA que supervisa operaciones en tiempo real:
- Aprueba/rechaza subtareas propuestas por agentes
- Monitoriza el progreso de ejecución
- Toma decisiones de priorización cuando los agentes compiten por recursos
- Puede anular decisiones de agentes cuando la calidad no cumple estándares
Sistema de 3 Niveles de Calidad
Cada organización puede elegir su nivel de calidad, equilibrando coste vs. calidad del output:
| Nivel | Proveedor IA | Modelo Imagen | Coste |
|---|---|---|---|
| L1 | Workers AI (gratis) | FLUX Schnell (gratis) | $0 |
| L2 | Groq / DeepSeek | FLUX Schnell | ~$0,001/tarea |
| L3 | Gemini / Claude / GPT-4 | SDXL Lightning | ~$0,02-0,10/tarea |
L1 es completamente gratis — usando modelos de Workers AI de Cloudflare. Suficiente para tareas internas, borradores y experimentación. L3 es calidad premium para entregables a clientes. La mayoría de organizaciones usan L2 para trabajo rutinario y escalan a L3 para outputs finales.
Fuentes de Entrada/Salida
Las tareas pueden venir de cualquier sitio y los resultados ir a cualquier destino:
| Fuentes de Entrada | Destinos de Salida |
|---|---|
| Cadences Bridge (flujo automático) | |
| Formularios públicos DATA_TABLE | |
| Web scrapers | Webhook (cualquier URL) |
| Webhooks (APIs externas) | De vuelta a Cadences |
El Cadences Bridge es lo más interesante: las tareas creadas en Cadences fluyen automáticamente a Synapse Studio para procesamiento IA. Los resultados vuelven. El usuario nunca sale de Cadences — solo ve su tarea completada con los entregables generados por IA adjuntos.
El Sistema de Subtareas: Agentes que Piensan por Adelantado
Los agentes no solo completan su trabajo asignado — proponen trabajo adicional cuando identifican gaps:
- El agente detecta que necesita información adicional o un output complementario
- Propone una subtarea con tipo y parámetros
- CommandBot (CEO IA) valida la propuesta
- La subtarea se ejecuta con su propio pipeline
- El resultado alimenta la tarea original
Tipos de subtarea: investigación adicional, generación de imagen, evolución I2I, análisis de datos, redacción complementaria. Esto significa que un simple "escribe un post sobre Marruecos" puede expandirse orgánicamente a: investigar tendencias de viaje actuales → generar imagen hero → escribir el post → evolucionar la imagen con I2I → revisar calidad → compilar output final con imágenes integradas.
Zero Dependencias, Máximo Control
Synapse Studio está construido con zero dependencias npm. Sin React, sin Vue, sin paso de build. Vanilla JS + CSS puros.
¿Por qué? Porque el sistema de animación — agentes caminando entre pisos, sentándose en escritorios, mostrando burbujas de pensamiento, indicadores de estado — requiere control preciso sobre manipulación DOM y transiciones CSS. Sin overhead de frameworks, sin delays de reconciliación de virtual DOM. Cada animación corre a 60fps porque no hay nada entre nuestro código y el navegador.
Los 5 archivos JS principales:
- synapse-canvas.js — El renderizador de la oficina 2D (edificio, pisos, escritorios, agentes)
- synapse-engine.js — Orquestación de tareas, asignación de agentes, pipeline de ejecución
- synapse-ui.js — Paneles, interacciones, layout responsive
- config-panel.js — Configuración de agencia/agentes/capacidades
- detail-panel.js — Visualización rich de resultados (imágenes, comparaciones I2I, texto)
Backend: una sola ruta catch-all [[path]].js en Cloudflare Workers. Storage: R2 para imágenes, D1 para agencias/agentes/tareas/resultados. ¿Coste total de infraestructura? Parte de la factura de $65/mes de Cloudflare que detallamos en nuestro artículo de Cloudflare.
Conclusiones Clave
1. Las metáforas espaciales resuelven la observabilidad. Cuando tienes múltiples agentes IA trabajando en paralelo, un log de chat no es suficiente. Una oficina visual donde ves agentes moverse, pensar y colaborar hace visible lo invisible.
2. IA Dual es el sweet spot de costes. IA Rápida para routing y tareas simples, IA Profunda para outputs de calidad crítica. El ahorro del 70% hace que los sistemas multi-agente sean económicamente viables incluso para equipos pequeños.
3. Evolución de imágenes > generación de un solo intento. El sistema de cadenas I2I produce resultados dramáticamente mejores que la generación de imagen con un solo prompt, porque cada iteración refina manteniendo consistencia visual.
4. El sistema de propuesta de subtareas es comportamiento emergente. Agentes que pueden identificar gaps y proponer trabajo adicional crean resultados que superan lo que obtendrías con asignación rígida de tareas. El Bot CEO previene la explosión de scope mientras permite expansión orgánica.
5. Zero dependencias no es una limitación — es libertad. Sin lock-in de frameworks, sin vulnerabilidades de dependencias, sin complejidad de build. Todo el estudio se envía como archivos estáticos a Cloudflare Pages. Se despliega en segundos.
Etiquetas
Sobre el Autor
Gonzalo Monzón
Fundador & Arquitecto Principal
Gonzalo Monzón es Arquitecto de Soluciones Senior e Ingeniero IA con más de 26 años construyendo sistemas críticos en Sanidad, Automatización Industrial e IA empresarial. Fundador de Cadences Lab, está especializado en conectar infraestructura legacy con tecnología de vanguardia.
Artículos Relacionados
Cómo un Equipo de 3 Personas Gestiona 200+ Leads al Mes con IA
Una agencia de viajes se ahogaba en mensajes de WhatsApp y hojas de cálculo. Construimos un storefront digital completo con scoring ML de leads, chat IA, workflows automatizados y agentes de voz — todo en Cloudflare a €0/mes de hosting. Ahora gestionan 5x más leads sin contratar.
Por Qué Usamos 7 Proveedores de IA (No Solo Uno) — Y Cómo Rastreamos Cada Céntimo
11.200+ llamadas/mes, ~$184 de coste total, 2.4% de errores. Así es como nuestro AI Gateway en Cloudflare Workers enruta entre Gemini, GPT-4o, Claude y más — con fallback automático, rate limiting por tiers y tracking de costes en tiempo real.
Perspectiva Studio: 19.000 Líneas de Vanilla JS Que Crean Audiolibros, Blogs y Sesiones con AI Coach
Construimos un motor completo de creación de contenido — audiolibros con 15+ voces de ElevenLabs, artículos de blog con imágenes generadas por IA de 5 proveedores, documentos PDF y sesiones interactivas con AI Coach en tiempo real — todo en Vanilla JS sin dependencias corriendo en Cloudflare.