El graf de coneixement com a context ambient dels agents
Un agent sense context és només un model. La recuperació vectorial clàssica tracta el coneixement com una bossa de fragments independents — i per això falla en les preguntes que més importen a una empresa. Repassem els problemes reals que viuen els desenvolupadors de RAG (amb dades), per què l'estructura de graf guanya on el vector es queda curt, com es posiciona el panorama (Pinecone, LangChain, LlamaIndex, Neo4j, Microsoft GraphRAG) i com pensem ser els millors en el context que de debò compta: l'operació d'una empresa.

La promesa del RAG (generació augmentada per recuperació) és simple: dona al model els documents correctes i respondrà bé (Lewis et al., 2020). La realitat de qui el porta a producció és més aspra. El coneixement d'una empresa no és una pila de textos solts: és una xarxa de casos, clients, factures, tasques i agents connectats entre si. Aplanar això a fragments independents perd justament el que dona sentit — i els números ho confirmen.
Aquest article és la nostra tesi tècnica: per què tractem el coneixement com un graf i l'utilitzem com a context ambient dels agents, no com una bossa de fragments.
El problema que viuen els desenvolupadors
Qualsevol que hagi construït un RAG real ha topat amb la mateixa paret: afegir més context no millora la resposta, de vegades l'empitjora. No és una anècdota, està mesurat. Liu et al. van mostrar que els models utilitzen bé la informació al principi i al final del context, però la perden quan cau al mig (Liu et al., 2023).
Mateix dato, mateixa pregunta: només canvia la posició del document rellevant dins del context. La caiguda al mig supera els 20 punts.
Fuente: Liu et al., 2023 — Lost in the Middle (arXiv:2307.03172)
Amb 30 documents l'efecte és tan sever que posar el dato al mig (50,5%) rendeix per sota de respondre sense cap document (56,1%): el context mal ordenat resta (Liu et al., 2023). I això és només un dels diversos errors que documenta la literatura.
Barnett et al. van catalogar set punts de fallada recurrents en portar un RAG a producció (Barnett et al., 2024): contingut absent, el document rellevant no entra al top‑k, es perd en consolidar el prompt, no s'extreu tot i ser present, format incorrecte, especificitat equivocada i resposta incompleta. I RAGTruth va mesurar que fins i tot amb recuperació, una fracció gens menyspreable de respostes al·lucina — fins al 27% en tasques de dades a text amb GPT‑4 (Wu et al., 2024).
L'arrel comuna
Gairebé totes aquestes fallades comparteixen una causa: la recuperació per similitud porta fragments semblants a la pregunta, però cecs entre si. Si la resposta exigeix connectar diverses peces (multi‑hop) o sintetitzar tot un corpus, la similitud vectorial no té com veure-ho (Tang & Yang, 2024).
A això s'hi suma la fragmentació pel troceig: partir documents en chunks de mida fixa talla un mateix fet entre dos fragments, i cap conté la resposta completa (Gao et al., 2023).
Tres maneres de recuperar (i per què importa l'estructura)
No totes les arquitectures de recuperació són iguals. Convé distingir tres paradigmes:
| Paradigma | Com recupera | Fort en | Punt cec |
|---|---|---|---|
| RAG vectorial | k veïns més propers per similitud d'embeddings | Significat, sinònims, rapidesa | Multi‑hop, relacions, síntesi global |
| Híbrid (BM25 + vector) | Fusiona lèxic exacte + semàntic (p. ex. RRF) | Termes exactes (codis, noms) + semàntica | Continua sent rànquing de passatges inconnexos |
| RAG de graf | Traça relacions explícites + difusió pel graf | Multi‑hop, context relacional, sensemaking | Cost de construir el graf |
L'híbrid arregla "els vectors no veuen el terme exacte"; no arregla "la recuperació ignora com es connecten els fets". Per a això cal estructura. I aquí és on el graf canvia les regles.
El graf com a context ambient
Modelem l'operació com un graf dirigit on els nodes són entitats —casos, documents, clients, tasques, agents— i les arestes són les relacions reals entre elles. Alguns nodes concentren moltíssimes connexions; els anomenem god nodes, i solen ser els punts pels quals passa tota l'operació.
Per mesurar la importància d'un node fem servir PageRank (Page et al., 1999), que la defineix de manera recursiva: un node és important si l'apunten nodes importants.
Quan un agent necessita context no llancem només una cerca per similitud: sembrem el graf amb els nodes més afins a la consulta i deixem que la rellevància es difongui als seus veïns a través de l'adjacència normalitzada :
Això no és una intuïció: és exactament el mecanisme que HippoRAG va demostrar per resoldre preguntes multi‑hop en un sol pas de recuperació, fent servir Personalized PageRank sobre un graf de coneixement (Gutiérrez et al., 2024). L'evidència és contundent.
Recuperació densa vectorial (ColBERTv2) enfront de graf + Personalized PageRank, mateix lector. L'estructura recupera el doble d'evidència útil en preguntes que exigeixen encadenar fets.
Fuente: Gutiérrez et al., 2024 — HippoRAG (arXiv:2405.14831)
I per a les preguntes globals —"quins són els temes que travessen tota l'operació?"—, que no tenen un únic passatge‑resposta, Microsoft GraphRAG va mostrar que detectar comunitats al graf i resumir-les guanya de manera sistemàtica al RAG vectorial quan un jutge LLM avalua exhaustivitat i diversitat (Edge et al., 2024). Les comunitats s'obtenen optimitzant la modularitat —Louvain (Blondel et al., 2008) i el seu successor Leiden (Traag et al., 2019), que és el que fa servir GraphRAG:
Honestedat intel·lectual
El graf no guanya sempre. En preguntes d'un sol salt, o quan es valora la concisió literal, el RAG vectorial és suficient — i fins i tot millor (Edge et al., 2024). Per això no substituïm el vector: el combinem amb el graf i amb un reranking de precisió. L'estructura es fa servir on aporta: relacions, multi‑hop i visió de conjunt.
Com es posiciona el panorama
L'ecosistema és excel·lent en el seu àmbit, però gairebé tot està construït al voltant del passatge, no de la relació:
| Eina | Què és | Mecanisme de recuperació | Punt cec relacional |
|---|---|---|---|
| Pinecone | Base vectorial gestionada | Similitud vectorial (+ híbrid) | Sense noció nativa de relacions |
| Weaviate | Base vectorial (no de graf) | Vector + BM25F | Cross‑refs desaconsellades per a travessia profunda |
| LangChain | Framework d'orquestració | Delega en el backend que connectis | No aporta recuperació relacional pròpia |
| LlamaIndex | Framework de dades per a RAG | Vector + PropertyGraphIndex | El graf depèn de l'extracció per LLM |
| Neo4j | Base de dades de graf | Cypher + índex vectorial | Cal construir i modelar el graf abans |
| Microsoft GraphRAG | Pipeline de graf | Graf + comunitats (Leiden) | Indexat car i intensiu en LLM |
| Elastic / OpenSearch | Motors de cerca | BM25 + kNN (RRF) | Sense travessia de relacions entre documents |
La conclusió no és que aquestes eines siguin dolentes — són peces magnífiques. És que el graf de coneixement com a context ambient viu de l'operació no és el cas d'ús per al qual gairebé cap va ser dissenyada.
Com pensem ser els millors
No competim per tenir el millor índex vectorial: competim per entendre l'operació d'una empresa millor que ningú. Allà enfoquem l'avantatge, per àmbits:
L'enfocament habitual
BiVelio
- Context de l'operació, no només de documents. El nostre graf no neix de trocejar PDFs: neix de com funciona l'empresa. Això dona relacions precises i actualitzades, no inferides.
- Multi‑hop i visió de conjunt de sèrie. PageRank personalitzat per recuperar veïnats coherents (Gutiérrez et al., 2024) i comunitats per raonar a la granularitat correcta (Edge et al., 2024) — els dos modes que l'evidència premia.
- Context coherent, no fragments. Recuperem el cas més el seu client més les seves factures relacionades, no tres trossos que comparteixen una paraula. Ataquem directament el "perdut al mig" (Liu et al., 2023) lliurant menys context però més ben connectat.
- Precisió i cost. Combinem el graf amb un reranking efímer perquè només el millor arribi a la finestra de l'agent — la idea que desenvolupem a Reranking efímer.
- Governança i traçabilitat. Cada peça de context té origen al graf: es pot auditar d'on va sortir una decisió. En operacions d'empresa, això no és un extra, és un requisit.
Nota: les xifres d'aquest article provenen de la literatura citada (Liu et al., Edge et al., Gutiérrez et al., Barnett et al., Wu et al.) i descriuen enfocaments de graf en general. Són la motivació del nostre disseny, no un benchmark tancat de producte.
Referències
- #grafs
- #knowledge graph
- #graphrag
- #agents
- #pagerank
- #rag