IA & LLMs 8 de septiembre de 2025 · 11 min lectura

Synapse Studio: Una Oficina Virtual 2D Donde los Agentes IA Hacen el Trabajo Real

Gonzalo Monzón

Fundador & Arquitecto Principal

¿Y si tu IA no fuera una ventana de chat sino una oficina virtual? Un espacio visual donde puedes ver agentes caminando entre escritorios, sentándose a trabajar en tareas, pensando, colaborando — y entregando resultados reales. Eso es Synapse Studio: una oficina animada 2D (piensa en SimTower + IA) donde equipos multi-agente con 7 capacidades multimodales procesan tareas reales de forma autónoma.

Sin React. Sin frameworks. Zero dependencias npm. Solo Vanilla JS, animaciones CSS e infraestructura edge de Cloudflare. Este artículo cubre la arquitectura, la orquestación multi-agente y el sistema de evolución iterativa de imágenes que lo hace único.

El Concepto: ¿Por Qué una Oficina Virtual?

La IA es abstracta. Envías un prompt, recibes una respuesta. Pero cuando estás orquestando múltiples agentes IA trabajando en paralelo en una tarea compleja — investigación, análisis, generación de imágenes, revisión de calidad, compilación final — la abstracción se rompe. ¿Quién hace qué? ¿Cuál es el estado? ¿Dónde está el cuello de botella?

Convertimos la abstracción en una metáfora espacial:

Cada agente tiene un escritorio en un edificio de oficinas 2D
Los departamentos ocupan pisos diferentes (Marketing, Ventas, Soporte, Creativo)
Los agentes se mueven físicamente para colaborar — los ves caminar al escritorio de un colega
Estados visuales: idle (en su mesa), pensando (animación), trabajando (tecleando), colaborando (en otro escritorio)
El progreso de las tareas es visible en tiempo real a través de la actividad de la oficina

No es un gimmick — es una solución UX genuina al problema de observabilidad multi-agente. Cuando tienes 4 agentes trabajando en una tarea, ves el trabajo ocurriendo.

7 Capacidades Multimodales

Cada agente puede configurarse con cualquier combinación de estas capacidades:

Capacidad	Código	Qué Hace	Proveedor
LLM (Texto)	Base	Chat, razonamiento, análisis	Gemini / Claude / GPT-4o / Groq
Búsqueda Web	F1	Búsqueda en internet en tiempo real	Groq Compound Beta
Visión (ITT)	F2	Analizar y entender imágenes	Gemini 2.0 Flash
Texto-a-Imagen (TTI)	F3	Generar imágenes desde texto	FLUX Schnell / SDXL Lightning
Imagen-a-Imagen (I2I)	F6	Transformar imágenes iterativamente	Stable Diffusion 1.5 / SDXL
Voz-a-Texto (STT)	F4	Transcribir audio	ElevenLabs Scribe / Whisper
Texto-a-Voz (TTS)	F5	Generar narración de voz	ElevenLabs

El insight clave: los agentes no son chatbots con extras. Son trabajadores multimodales. Un "Diseñador Visual" tiene TTI + I2I + Visión. Un "Investigador" tiene LLM + Búsqueda Web. Un agente "Fullstack Media" tiene las 7 capacidades. El rol define el cinturón de herramientas, no al revés.

Orquestación Multi-Agente

Cuando llega una tarea — de Cadences, un formulario público, un scraper o un webhook — el motor de orquestación toma el control:

Tarea entrante
  │
  ├── IA Orquestadora analiza la tarea
  │     └── Genera plan de ejecución multi-agente
  │
  ├── Asignación de roles
  │     ├── Agente 1: Investigación (recopilación, búsqueda web)
  │     ├── Agente 2: Expertise (análisis profundo con IA premium)
  │     ├── Agente 3: Revisión (control de calidad, verificación)
  │     └── Agente 4: Compilación (entregable final)
  │
  ├── Ejecución con IA Dual
  │     ├── IA Rápida: respuestas rápidas (Groq, DeepSeek)
  │     └── IA Profunda: análisis exhaustivo (Gemini 2.5, Claude)
  │
  └── Entrega
        ├── Email
        ├── WhatsApp
        └── Webhook

El sistema de IA Dual es crítico para optimización de costes. La IA Rápida gestiona el análisis inicial, routing y subtareas simples a coste casi cero (Groq es esencialmente gratis a nuestro volumen). La IA Profunda solo se activa para razonamiento complejo, generación creativa o outputs de calidad crítica — ahorrando ~70% en costes IA vs. ejecutar todo con modelos premium.

1-8 Agentes Por Tarea

No toda tarea necesita 8 agentes. Un simple "investiga este tema" puede usar 1 agente con LLM + Búsqueda Web. Un complejo "crea una campaña de marketing con visuales" puede usar 5 agentes en roles de Investigación, Copy, Diseño, Revisión y Compilación. El orquestador decide según la complejidad.

I2I: Evolución Iterativa de Imágenes

Esta es la feature más innovadora. En lugar de generar una imagen y esperar que sea correcta, Synapse Studio evoluciona imágenes a través de cadenas de transformaciones:

Imagen original → Transformación I2I (strength: 0.7) → Resultado v1
                                                          │
                                               IA propone siguiente paso
                                                          │
                                            Subtarea automática creada
                                                          │
                                       Resultado v1 → I2I Transform → v2
                                                                       │
                                                             ...continúa

Cada transformación tiene dos parámetros clave:

Strength (0.0-1.0): Cuánto cambia la imagen. 0.3 = refinamiento sutil. 0.9 = reimaginación dramática.
Guidance (1-20): Cuán literalmente la IA sigue el prompt de texto. Mayor = más literal.

Después de cada transformación, la IA analiza el resultado y propone la siguiente iteración — qué cambiar, qué mantener, qué strength usar. La cadena continúa hasta alcanzar max_depth o la IA decide que el resultado es óptimo.

Casos de uso: refinamiento de logos, iteración de concept art, evolución de transferencia de estilo, mejora progresiva de detalles. Cada paso construye sobre el anterior, manteniendo consistencia visual mientras explora direcciones creativas.

Dos Bots Integrados

SynapseBot (El Arquitecto)

Un wizard conversacional que crea agencias completas desde lenguaje natural:

"Necesito una agencia de marketing con 5 agentes especializados en redes sociales, copywriting y diseño visual"

SynapseBot genera toda la estructura: nombre de agencia, departamentos, agentes con roles y capacidades predefinidos. Setup instantáneo de equipo multi-agente.

CommandBot (El CEO)

Un CEO IA que supervisa operaciones en tiempo real:

Aprueba/rechaza subtareas propuestas por agentes
Monitoriza el progreso de ejecución
Toma decisiones de priorización cuando los agentes compiten por recursos
Puede anular decisiones de agentes cuando la calidad no cumple estándares

Sistema de 3 Niveles de Calidad

Cada organización puede elegir su nivel de calidad, equilibrando coste vs. calidad del output:

Nivel	Proveedor IA	Modelo Imagen	Coste
L1	Workers AI (gratis)	FLUX Schnell (gratis)	$0
L2	Groq / DeepSeek	FLUX Schnell	~$0,001/tarea
L3	Gemini / Claude / GPT-4	SDXL Lightning	~$0,02-0,10/tarea

L1 es completamente gratis — usando modelos de Workers AI de Cloudflare. Suficiente para tareas internas, borradores y experimentación. L3 es calidad premium para entregables a clientes. La mayoría de organizaciones usan L2 para trabajo rutinario y escalan a L3 para outputs finales.

Fuentes de Entrada/Salida

Las tareas pueden venir de cualquier sitio y los resultados ir a cualquier destino:

Fuentes de Entrada	Destinos de Salida
Cadences Bridge (flujo automático)	Email
Formularios públicos DATA_TABLE	WhatsApp
Web scrapers	Webhook (cualquier URL)
Webhooks (APIs externas)	De vuelta a Cadences

El Cadences Bridge es lo más interesante: las tareas creadas en Cadences fluyen automáticamente a Synapse Studio para procesamiento IA. Los resultados vuelven. El usuario nunca sale de Cadences — solo ve su tarea completada con los entregables generados por IA adjuntos.

El Sistema de Subtareas: Agentes que Piensan por Adelantado

Los agentes no solo completan su trabajo asignado — proponen trabajo adicional cuando identifican gaps:

El agente detecta que necesita información adicional o un output complementario
Propone una subtarea con tipo y parámetros
CommandBot (CEO IA) valida la propuesta
La subtarea se ejecuta con su propio pipeline
El resultado alimenta la tarea original

Tipos de subtarea: investigación adicional, generación de imagen, evolución I2I, análisis de datos, redacción complementaria. Esto significa que un simple "escribe un post sobre Marruecos" puede expandirse orgánicamente a: investigar tendencias de viaje actuales → generar imagen hero → escribir el post → evolucionar la imagen con I2I → revisar calidad → compilar output final con imágenes integradas.

Zero Dependencias, Máximo Control

Synapse Studio está construido con zero dependencias npm. Sin React, sin Vue, sin paso de build. Vanilla JS + CSS puros.

¿Por qué? Porque el sistema de animación — agentes caminando entre pisos, sentándose en escritorios, mostrando burbujas de pensamiento, indicadores de estado — requiere control preciso sobre manipulación DOM y transiciones CSS. Sin overhead de frameworks, sin delays de reconciliación de virtual DOM. Cada animación corre a 60fps porque no hay nada entre nuestro código y el navegador.

Los 5 archivos JS principales:

synapse-canvas.js — El renderizador de la oficina 2D (edificio, pisos, escritorios, agentes)
synapse-engine.js — Orquestación de tareas, asignación de agentes, pipeline de ejecución
synapse-ui.js — Paneles, interacciones, layout responsive
config-panel.js — Configuración de agencia/agentes/capacidades
detail-panel.js — Visualización rich de resultados (imágenes, comparaciones I2I, texto)

Backend: una sola ruta catch-all [[path]].js en Cloudflare Workers. Storage: R2 para imágenes, D1 para agencias/agentes/tareas/resultados. ¿Coste total de infraestructura? Parte de la factura de $65/mes de Cloudflare que detallamos en nuestro artículo de Cloudflare.

Conclusiones Clave

1. Las metáforas espaciales resuelven la observabilidad. Cuando tienes múltiples agentes IA trabajando en paralelo, un log de chat no es suficiente. Una oficina visual donde ves agentes moverse, pensar y colaborar hace visible lo invisible.

2. IA Dual es el sweet spot de costes. IA Rápida para routing y tareas simples, IA Profunda para outputs de calidad crítica. El ahorro del 70% hace que los sistemas multi-agente sean económicamente viables incluso para equipos pequeños.

3. Evolución de imágenes > generación de un solo intento. El sistema de cadenas I2I produce resultados dramáticamente mejores que la generación de imagen con un solo prompt, porque cada iteración refina manteniendo consistencia visual.

4. El sistema de propuesta de subtareas es comportamiento emergente. Agentes que pueden identificar gaps y proponer trabajo adicional crean resultados que superan lo que obtendrías con asignación rígida de tareas. El Bot CEO previene la explosión de scope mientras permite expansión orgánica.

5. Zero dependencias no es una limitación — es libertad. Sin lock-in de frameworks, sin vulnerabilidades de dependencias, sin complejidad de build. Todo el estudio se envía como archivos estáticos a Cloudflare Pages. Se despliega en segundos.

Etiquetas

Agentes IA Multi-Agente Multimodal Generación de Imágenes Vanilla JS Cloudflare Workers

← Artículo Anterior Edge Computing: Por Qué lo Apostamos Todo a Cloudflare (Y Qué Consigues por $65/Mes) Siguiente Artículo → Perspectiva Studio: 19.000 Líneas de Vanilla JS Que Crean Audiolibros, Blogs y Sesiones con AI Coach

Sobre el Autor

Gonzalo Monzón

Fundador & Arquitecto Principal

Gonzalo Monzón es Arquitecto de Soluciones Senior e Ingeniero IA con más de 26 años construyendo sistemas críticos en Sanidad, Automatización Industrial e IA empresarial. Fundador de Cadences Lab, está especializado en conectar infraestructura legacy con tecnología de vanguardia.

Ver perfil completo → Conectar en LinkedIn

Cómo un Equipo de 3 Personas Gestiona 200+ Leads al Mes con IA

Una agencia de viajes se ahogaba en mensajes de WhatsApp y hojas de cálculo. Construimos un storefront digital completo con scoring ML de leads, chat IA, workflows automatizados y agentes de voz — todo en Cloudflare a €0/mes de hosting. Ahora gestionan 5x más leads sin contratar.

26 de febrero de 2026

Leer Artículo →

IA & LLMs

9 min lectura

Por Qué Usamos 7 Proveedores de IA (No Solo Uno) — Y Cómo Rastreamos Cada Céntimo

11.200+ llamadas/mes, ~$184 de coste total, 2.4% de errores. Así es como nuestro AI Gateway en Cloudflare Workers enruta entre Gemini, GPT-4o, Claude y más — con fallback automático, rate limiting por tiers y tracking de costes en tiempo real.

12 de febrero de 2026

Leer Artículo →

IA & LLMs

12 min lectura

Perspectiva Studio: 19.000 Líneas de Vanilla JS Que Crean Audiolibros, Blogs y Sesiones con AI Coach

Construimos un motor completo de creación de contenido — audiolibros con 15+ voces de ElevenLabs, artículos de blog con imágenes generadas por IA de 5 proveedores, documentos PDF y sesiones interactivas con AI Coach en tiempo real — todo en Vanilla JS sin dependencias corriendo en Cloudflare.

22 de septiembre de 2025

Leer Artículo →

Synapse Studio: Una Oficina Virtual 2D Donde los Agentes IA Hacen el Trabajo Real

El Concepto: ¿Por Qué una Oficina Virtual?

7 Capacidades Multimodales

Orquestación Multi-Agente

1-8 Agentes Por Tarea

I2I: Evolución Iterativa de Imágenes

Dos Bots Integrados

SynapseBot (El Arquitecto)

CommandBot (El CEO)

Sistema de 3 Niveles de Calidad

Fuentes de Entrada/Salida

El Sistema de Subtareas: Agentes que Piensan por Adelantado

Zero Dependencias, Máximo Control

Conclusiones Clave

Etiquetas

Sobre el Autor

Mantente al día

Artículos Relacionados

Cómo un Equipo de 3 Personas Gestiona 200+ Leads al Mes con IA

Por Qué Usamos 7 Proveedores de IA (No Solo Uno) — Y Cómo Rastreamos Cada Céntimo

Perspectiva Studio: 19.000 Líneas de Vanilla JS Que Crean Audiolibros, Blogs y Sesiones con AI Coach