Back to flin
flin

Intégration chunk-embedding

Comment FLIN relie le découpage de documents aux embeddings vectoriels -- la couche d'intégration qui transforme les PDF téléversés en connaissances recherchables avec une seule instruction save.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 2 min flin
EN/ FR/ ES
flinembeddingschunksvector-storagesemantic-search

Vous pouvez découper du texte en morceaux. Vous pouvez générer des embeddings à partir de texte. Mais connecter ces deux opérations -- de manière fiable, efficace et avec un suivi approprié des métadonnées -- est là où la plupart des implémentations RAG s'effondrent. La session 222 a construit la couche d'intégration qui comble ce fossé. Neuf nouvelles fonctions, 19 tests et un pipeline complet de bout en bout qui prend des octets bruts de document et produit des vecteurs indexés et recherchables en un seul appel de fonction.

La fonction la plus puissante, ingest_document, prend des octets bruts de document et produit des vecteurs stockés et indexés : extraire, découper, embedder, stocker et retourner le nombre. L'appelant fournit les octets et les métadonnées ; la fonction gère tout le reste.

Quand une application FLIN sauvegarde une entité avec un champ semantic text, le runtime déclenche le pipeline complet automatiquement. Le développeur n'appelle jamais une fonction de découpage, ne gère jamais d'embeddings et n'interagit jamais directement avec le magasin de vecteurs.


Ceci est la partie 131 de la série « Comment nous avons construit FLIN », documentant comment un CEO à Abidjan et un CTO IA ont conçu et construit un langage de programmation à partir de zéro.

Navigation de la série : - [130] Stratégies de découpage de texte - [131] Intégration chunk-embedding (vous êtes ici) - [132] Extraction de texte depuis CSV, XLSX, RTF et XML

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude deblo

Le Step Zero ne suffisait pas : comment valider un constructeur sans valider le runtime a fait tomber toutes les sessions vocales de Déblo l’heure où nous avons livré le streaming caméra temps réel

La phase 14 a livré Déblo Eyes — streaming caméra temps réel via LiveKit vers Gemini Live native audio. Le premier deploy a fait tomber toutes les sessions vocales en production en quatre-vingt-dix secondes parce que notre Step 0 avait validé le constructeur sans exercer le runtime. Le build log de comment Déblo a eu des yeux, ce qu’un pré-vol incomplet a coûté, et quels points de polish ont été livrés ou reportés.

33 min May 20, 2026
debloclaude-opus-4.7claude-codegemini-live +25
Thales & Claude deblo

Le tiret cadratin qui a tué la production : comment un slogan marketing dans un header HTTP a fait tomber le chat de Déblo pendant 24 heures

Deux jours avant la soumission App Store, tout le produit chat de Déblo s’est cassé silencieusement. Pas de spinner, pas de toast, aucune erreur dans l’UI — juste un silence radio. L’incident de 24 heures se résumait à un seul « é » dans la valeur d’un header HTTP qui levait une UnicodeEncodeError avant qu’aucune requête vers OpenRouter ne quitte le backend. Post-mortem d’une fausse hypothèse, d’une trace Sentry, et d’un fix de six lignes qui a débloqué le lancement.

30 min May 19, 2026
debloclaude-opus-4.7claude-codeincident +19
Thales & Claude deblo

Six heures, d’une page blanche à la review Apple — Comment nous avons soumis Déblo à l’App Store, en direct

Marche à marche en direct de la soumission de Déblo à l’App Store iOS en six heures : ce que les validateurs d’Apple ont rejeté (un superscript Unicode), ce que nous avons corrigé (un Promotional Text gaspillé sur des marques tierces), et les rouages de l’ASO iOS que presque tout le monde rate.

30 min May 13, 2026
debloclaude-opus-4.7claude-codeapp-store +16