Back to sh0
sh0

De chatbot de docs a agente de soporte en vivo

Cómo convertimos el asistente IA de docs existente de sh0 en un widget de helpdesk público con 9 archivos, cero infraestructura nueva, y el mismo pipeline de streaming SSE.

Juste A. Gnimavo (Thales) & Claude | March 28, 2026 2 min sh0
EN/ FR/ ES
aihelpdeskarchitecturessestreamingsvelte-5prismaanthropicrate-limitingsveltekit

sh0.dev ya tenía tres rutas IA: modo MCP para usuarios del dashboard con servidor conectado, modo heredado para ejecución de herramientas del dashboard, y modo docs para el sitio de marketing. El helpdesk es una cuarta ruta, pero comparte el 90% de su implementación con el modo docs.

La capa de prompt: una función, un overlay

El prompt de docs es un prompt de sistema de 4.000 palabras. El helpdesk necesitaba el mismo conocimiento. La diferencia es la persona. La solución fue una función que envuelve el prompt existente con un overlay de 15 líneas que modifica el comportamiento manteniendo toda la capa de conocimiento.

Este es el principio de arquitectura que hizo viable el helpdesk: superponer comportamiento sobre conocimiento, nunca duplicar conocimiento.

El endpoint: una ruta de docs simplificada

/api/ai/helpdesk es un endpoint público dedicado que toma cada decisión estáticamente: sin autenticación, siempre Haiku, max tokens fijo, solo herramientas de docs.

El widget: 490 líneas de Svelte 5

El widget de chat es un solo componente: HelpdeskWidget.svelte. Todo el estado está en runes de Svelte 5. Sin stores. Sin contexto. Sin estado global. El widget es auto-contenido.

El consumidor SSE usa un lector ReadableStream, no EventSource (que solo soporta solicitudes GET). El buffer de acumulación maneja el caso donde un paquete TCP divide un evento SSE entre dos lecturas.

El renderizado de markdown usa marked + DOMPurify para prevenir XSS.

La base de datos: dos tablas

HelpdeskConversation y HelpdeskMessage con conteos de tokens tanto a nivel de conversación (agregados para evitar consultas SUM() costosas) como a nivel de mensaje (para desglose de costo por intercambio).

Limitación de velocidad: en memoria, tres dimensiones

Tres Maps independientes rastrean diferentes dimensiones: tasa por sesión (30 msg/10 min), tasa por IP (60 msg/10 min), y tasa de creación de conversaciones por IP (5 nuevas/hora).

Lo reutilizado vs. lo construido

La columna "reutilizado" es la razón por la que esta funcionalidad tomó horas en lugar de semanas. La infraestructura IA no fue construida para el helpdesk, pero fue construida de una manera que hizo trivial agregar el helpdesk.


Siguiente en la serie: Dos bugs críticos en un widget IA público -- Lo que dos sesiones de auditoría independientes encontraron en la implementación del helpdesk, y por qué el constructor no podría haberlos detectado.

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude deblo

El Step Zero no bastó: cómo validar un constructor pero no el runtime tumbó cada sesión de voz de Déblo la hora en que enviamos streaming de cámara en tiempo real

La Fase 14 envió Déblo Eyes — streaming de cámara en tiempo real por LiveKit hacia Gemini Live native audio. El primer despliegue tumbó cada sesión de voz en producción en noventa segundos porque nuestro Step 0 había validado el constructor sin ejercitar el runtime. El build log de cómo Déblo obtuvo ojos, lo que costó un pre-vuelo incompleto, y qué pulidos enviamos versus aplazamos.

33 min May 20, 2026
debloclaude-opus-4.7claude-codegemini-live +25
Thales & Claude deblo

La raya que mató producción: cómo un eslogan de marketing en un encabezado HTTP tumbó el chat de Déblo durante 24 horas

Dos días antes del envío a la App Store, todo el producto de chat de Déblo se rompió en silencio. Sin spinner, sin toast, sin error en la UI — solo aire muerto. La interrupción de 24 horas se reducía a una sola « é » en el valor de un encabezado HTTP que lanzaba UnicodeEncodeError antes de que cualquier petición a OpenRouter saliera del backend. El post-mortem de una falsa hipótesis, una traza de Sentry, y un fix de seis líneas que desbloqueó el lanzamiento.

29 min May 19, 2026
debloclaude-opus-4.7claude-codeincident +19
Thales & Claude deblo

Seis horas, de página en blanco a Apple Review — Cómo enviamos Déblo a la App Store, en vivo

Recorrido en vivo del envío de Déblo a la App Store iOS en seis horas: lo que rechazaron los validadores de Apple (un superíndice Unicode), lo que corregimos (un Promotional Text desperdiciado en marcas de terceros), y los mecanismos del ASO de iOS que casi todos se pierden.

30 min May 13, 2026
debloclaude-opus-4.7claude-codeapp-store +16