Back to flin
flin

Chunking consciente del código para RAG

Cómo la función chunk_text() de FLIN divide documentos en segmentos apropiados para embeddings respetando límites de párrafos, bloques de código, encabezados y coherencia semántica.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 2 min flin
EN/ FR/ ES
flinrust

Los modelos de embedding tienen una ventana de contexto fija. La mayoría acepta 512 tokens (aproximadamente 400 palabras). Algunos aceptan 8,192 tokens. Ninguno acepta un documento completo de 50 páginas como entrada. Para embeber un documento largo, debe dividirlo en chunks que quepan en la ventana de contexto del modelo.

El chunking ingenuo -- dividir cada 500 caracteres sin importar el contenido -- produce embeddings terribles. Un chunk que comienza en medio de una oración y termina en medio de un bloque de código no tiene significado coherente.

La función chunk_text() de FLIN es consciente de la estructura del documento. Divide texto en límites semánticos: saltos de párrafo, límites de encabezados, delimitadores de bloques de código y finales de oración. El resultado son chunks que cada uno representa una sola idea coherente, produciendo embeddings enfocados que recuperan con precisión.

La función chunk_text()

flinchunks = chunk_text(text, {
    max_size: 500,        // Máximo de caracteres por chunk
    overlap: 50,          // Caracteres de solapamiento entre chunks
    strategy: "semantic"  // "fixed", "paragraph", "semantic", "code"
})

Estrategias de chunking

Tamaño fijo La estrategia más simple. Divide en límites de caracteres exactos. Use solo para texto no estructurado.

Consciente de párrafos Divide en límites de párrafo (dobles saltos de línea), manteniendo los párrafos intactos cuando sea posible.

Semántico (predeterminado) La estrategia más sofisticada. Respeta encabezados, párrafos, listas y límites semánticos naturales con una jerarquía de prioridad: 1. Nunca dividir en medio de un bloque de código. 2. Preferir dividir en encabezados. 3. Preferir dividir en límites de párrafos. 4. Preferir dividir en límites de oraciones. 5. Como último recurso, dividir en límites de palabras.

Consciente de código Una estrategia especializada para código fuente y documentación técnica con contenido pesado de código.

El chunking es el puente entre documentos crudos y embeddings buscables. Si se hace mal, el sistema RAG retorna resultados irrelevantes independientemente de cuán bueno sea el modelo de embedding o el LLM.


Esta es la Parte 122 de la serie "Cómo construimos FLIN", que documenta cómo un CEO en Abidjan y un CTO de IA diseñaron y construyeron un lenguaje de programación desde cero.

Navegación de la serie: - [121] Análisis de documentos: PDF, DOCX, CSV, JSON, YAML - [122] Chunking consciente del código para RAG (estás aquí) - [123] Búsqueda híbrida de documentos: BM25 + semántica - [124] Diseño de lenguaje AI-first

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude deblo

El Step Zero no bastó: cómo validar un constructor pero no el runtime tumbó cada sesión de voz de Déblo la hora en que enviamos streaming de cámara en tiempo real

La Fase 14 envió Déblo Eyes — streaming de cámara en tiempo real por LiveKit hacia Gemini Live native audio. El primer despliegue tumbó cada sesión de voz en producción en noventa segundos porque nuestro Step 0 había validado el constructor sin ejercitar el runtime. El build log de cómo Déblo obtuvo ojos, lo que costó un pre-vuelo incompleto, y qué pulidos enviamos versus aplazamos.

33 min May 20, 2026
debloclaude-opus-4.7claude-codegemini-live +25
Thales & Claude deblo

La raya que mató producción: cómo un eslogan de marketing en un encabezado HTTP tumbó el chat de Déblo durante 24 horas

Dos días antes del envío a la App Store, todo el producto de chat de Déblo se rompió en silencio. Sin spinner, sin toast, sin error en la UI — solo aire muerto. La interrupción de 24 horas se reducía a una sola « é » en el valor de un encabezado HTTP que lanzaba UnicodeEncodeError antes de que cualquier petición a OpenRouter saliera del backend. El post-mortem de una falsa hipótesis, una traza de Sentry, y un fix de seis líneas que desbloqueó el lanzamiento.

29 min May 19, 2026
debloclaude-opus-4.7claude-codeincident +19
Thales & Claude deblo

Seis horas, de página en blanco a Apple Review — Cómo enviamos Déblo a la App Store, en vivo

Recorrido en vivo del envío de Déblo a la App Store iOS en seis horas: lo que rechazaron los validadores de Apple (un superíndice Unicode), lo que corregimos (un Promotional Text desperdiciado en marcas de terceros), y los mecanismos del ASO de iOS que casi todos se pierden.

30 min May 13, 2026
debloclaude-opus-4.7claude-codeapp-store +16