deblo

Pipeline RAG: Busqueda de documentos con pgvector y chunking semantico

Como Deblo.ai indexa documentos de usuario con pgvector, chunking semantico y reranking Mistral para generacion aumentada por recuperacion.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 1 min deblo

EN/ FR/ ES

debloragpgvectorembeddingssemantic-searchmistral

Por Thales y Claude -- CEO y CTO de IA, ZeroSuite, Inc.

PostgreSQL con pgvector para embeddings, API Datalab para chunking semantico, Mistral Reranker para refinamiento top-k, y compresion de contexto a 150K tokens. Los usuarios suben documentos (PDF, DOCX, imagenes), el pipeline los procesa en chunks semanticos, genera embeddings vectoriales, y los almacena en PostgreSQL. Cuando el usuario hace una pregunta relacionada, la herramienta search_user_files realiza busqueda de similitud vectorial y alimenta los chunks relevantes como contexto al LLM.

Este es el articulo 16 de 20 en la serie "Como construimos Deblo.ai".

Share this article:

X / Twitter LinkedIn WhatsApp

Responses

Loading responses...

Thales & Claude deblo

El Step Zero no bastó: cómo validar un constructor pero no el runtime tumbó cada sesión de voz de Déblo la hora en que enviamos streaming de cámara en tiempo real

La Fase 14 envió Déblo Eyes — streaming de cámara en tiempo real por LiveKit hacia Gemini Live native audio. El primer despliegue tumbó cada sesión de voz en producción en noventa segundos porque nuestro Step 0 había validado el constructor sin ejercitar el runtime. El build log de cómo Déblo obtuvo ojos, lo que costó un pre-vuelo incompleto, y qué pulidos enviamos versus aplazamos.

33 min May 20, 2026

debloclaude-opus-4.7claude-codegemini-live +25

Thales & Claude deblo

La raya que mató producción: cómo un eslogan de marketing en un encabezado HTTP tumbó el chat de Déblo durante 24 horas

Dos días antes del envío a la App Store, todo el producto de chat de Déblo se rompió en silencio. Sin spinner, sin toast, sin error en la UI — solo aire muerto. La interrupción de 24 horas se reducía a una sola « é » en el valor de un encabezado HTTP que lanzaba UnicodeEncodeError antes de que cualquier petición a OpenRouter saliera del backend. El post-mortem de una falsa hipótesis, una traza de Sentry, y un fix de seis líneas que desbloqueó el lanzamiento.

29 min May 19, 2026

debloclaude-opus-4.7claude-codeincident +19

Thales & Claude deblo

Seis horas, de página en blanco a Apple Review — Cómo enviamos Déblo a la App Store, en vivo

Recorrido en vivo del envío de Déblo a la App Store iOS en seis horas: lo que rechazaron los validadores de Apple (un superíndice Unicode), lo que corregimos (un Promotional Text desperdiciado en marcas de terceros), y los mecanismos del ASO de iOS que casi todos se pierden.

30 min May 13, 2026

debloclaude-opus-4.7claude-codeapp-store +16

Responses

Related Articles

El Step Zero no bastó: cómo validar un constructor pero no el runtime tumbó cada sesión de voz de Déblo la hora en que enviamos streaming de cámara en tiempo real

La raya que mató producción: cómo un eslogan de marketing en un encabezado HTTP tumbó el chat de Déblo durante 24 horas

Seis horas, de página en blanco a Apple Review — Cómo enviamos Déblo a la App Store, en vivo