Back to flin
flin

Mise en cache des résultats de recherche

Comment le système de mise en cache des résultats de recherche de FLIN utilise l'éviction LRU, l'expiration TTL et l'invalidation tenant compte des entités pour éliminer les calculs de recherche redondants.

Thales & Claude | March 30, 2026 1 min flin
EN/ FR/ ES
flincachingsearchperformanceoptimization

La recherche est coûteuse. Une recherche hybride dans FLIN implique la génération d'embeddings, la traversée d'index HNSW, le scoring BM25, la Reciprocal Rank Fusion et la sérialisation des résultats. Pour une seule requête, la latence totale est acceptable -- 20 à 40 millisecondes. Pour la même requête exécutée 100 fois en une minute, le coût cumulé est du gaspillage.

Le système de cache utilise l'éviction LRU, l'expiration TTL et l'invalidation tenant compte des entités pour éliminer les calculs redondants tout en garantissant que les résultats périmés sont rafraîchis quand les données sous-jacentes changent.


Ceci est la partie 187 de la série « Comment nous avons construit FLIN », documentant comment un CEO à Abidjan et un CTO IA ont conçu et construit un langage de programmation à partir de zéro.

Navigation de la série : - [186] Patterns de résilience aux erreurs - [187] Mise en cache des résultats de recherche (vous êtes ici) - [188] Tests d'intégration GC, CLI et HTTP

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles