El grafo de conocimiento como contexto ambiente de los agentes
Un agente sin contexto es solo un modelo. La recuperación vectorial clásica trata el conocimiento como una bolsa de fragmentos independientes — y por eso falla en las preguntas que más importan a una empresa. Repasamos los problemas reales que viven los desarrolladores de RAG (con datos), por qué la estructura de grafo gana donde el vector se queda corto, cómo se posiciona el panorama (Pinecone, LangChain, LlamaIndex, Neo4j, Microsoft GraphRAG) y cómo pensamos ser los mejores en el contexto que de verdad cuenta: la operación de una empresa.

La promesa del RAG (generación aumentada por recuperación) es simple: dale al modelo los documentos correctos y responderá bien (Lewis et al., 2020). La realidad de quien lo lleva a producción es más áspera. El conocimiento de una empresa no es una pila de textos sueltos: es una red de casos, clientes, facturas, tareas y agentes conectados entre sí. Aplanar eso a fragmentos independientes pierde justo lo que da sentido — y los números lo confirman.
Este artículo es nuestra tesis técnica: por qué tratamos el conocimiento como un grafo y lo usamos como contexto ambiente de los agentes, no como una bolsa de fragmentos.
El problema que viven los desarrolladores
Cualquiera que haya construido un RAG real ha chocado con la misma pared: añadir más contexto no mejora la respuesta, a veces la empeora. No es una anécdota, está medido. Liu et al. mostraron que los modelos usan bien la información al principio y al final del contexto, pero la pierden cuando cae en el medio (Liu et al., 2023).
Mismo dato, misma pregunta: solo cambia la posición del documento relevante dentro del contexto. La caída al medio supera los 20 puntos.
Fuente: Liu et al., 2023 — Lost in the Middle (arXiv:2307.03172)
Con 30 documentos el efecto es tan severo que poner el dato en el medio (50,5%) rinde por debajo de responder sin documento alguno (56,1%): el contexto mal ordenado resta (Liu et al., 2023). Y esto es solo un fallo de los varios que documenta la literatura.
Barnett et al. catalogaron siete puntos de fallo recurrentes al llevar un RAG a producción (Barnett et al., 2024): contenido ausente, el documento relevante no entra en el top‑k, se pierde al consolidar el prompt, no se extrae pese a estar presente, formato incorrecto, especificidad equivocada y respuesta incompleta. Y RAGTruth midió que incluso con recuperación, una fracción nada despreciable de respuestas alucina — hasta el 27% en tareas de datos a texto con GPT‑4 (Wu et al., 2024).
La raíz común
Casi todos estos fallos comparten una causa: la recuperación por similitud trae fragmentos parecidos a la pregunta, pero ciegos entre sí. Si la respuesta exige conectar varias piezas (multi‑hop) o sintetizar todo un corpus, la similitud vectorial no tiene cómo verlo (Tang & Yang, 2024).
A esto se suma la fragmentación por troceado: partir documentos en chunks de tamaño fijo corta un mismo hecho entre dos fragmentos, y ninguno contiene la respuesta completa (Gao et al., 2023).
Tres formas de recuperar (y por qué importa la estructura)
No todas las arquitecturas de recuperación son iguales. Conviene distinguir tres paradigmas:
| Paradigma | Cómo recupera | Fuerte en | Punto ciego |
|---|---|---|---|
| RAG vectorial | k vecinos más cercanos por similitud de embeddings | Significado, sinónimos, rapidez | Multi‑hop, relaciones, síntesis global |
| Híbrido (BM25 + vector) | Fusiona léxico exacto + semántico (p. ej. RRF) | Términos exactos (códigos, nombres) + semántica | Sigue siendo ranking de pasajes inconexos |
| RAG de grafo | Traza relaciones explícitas + difusión sobre el grafo | Multi‑hop, contexto relacional, sensemaking | Coste de construir el grafo |
El híbrido arregla "los vectores no ven el término exacto"; no arregla "la recuperación ignora cómo se conectan los hechos". Para eso hace falta estructura. Y aquí es donde el grafo cambia las reglas.
El grafo como contexto ambiente
Modelamos la operación como un grafo dirigido donde los nodos son entidades —casos, documentos, clientes, tareas, agentes— y las aristas son las relaciones reales entre ellas. Algunos nodos concentran muchísimas conexiones; los llamamos god nodes, y suelen ser los puntos por los que pasa toda la operación.
Para medir la importancia de un nodo usamos PageRank (Page et al., 1999), que la define de forma recursiva: un nodo es importante si lo apuntan nodos importantes.
Cuando un agente necesita contexto no lanzamos solo una búsqueda por similitud: sembramos el grafo con los nodos más afines a la consulta y dejamos que la relevancia se difunda a sus vecinos a través de la adyacencia normalizada :
Esto no es una corazonada: es exactamente el mecanismo que HippoRAG demostró para resolver preguntas multi‑hop en un solo paso de recuperación, usando Personalized PageRank sobre un grafo de conocimiento (Gutiérrez et al., 2024). La evidencia es contundente.
Recuperación densa vectorial (ColBERTv2) frente a grafo + Personalized PageRank, mismo lector. La estructura recupera el doble de evidencia útil en preguntas que exigen encadenar hechos.
Fuente: Gutiérrez et al., 2024 — HippoRAG (arXiv:2405.14831)
Y para las preguntas globales —"¿cuáles son los temas que atraviesan toda la operación?"—, que no tienen un único pasaje‑respuesta, Microsoft GraphRAG mostró que detectar comunidades en el grafo y resumirlas gana de forma sistemática al RAG vectorial cuando un juez LLM evalúa exhaustividad y diversidad (Edge et al., 2024). Las comunidades se obtienen optimizando la modularidad —Louvain (Blondel et al., 2008) y su sucesor Leiden (Traag et al., 2019), que es el que usa GraphRAG:
Honestidad intelectual
El grafo no gana siempre. En preguntas de un solo salto, o cuando se valora la concisión literal, el RAG vectorial es suficiente — e incluso mejor (Edge et al., 2024). Por eso no sustituimos el vector: lo combinamos con el grafo y con un reranking de precisión. La estructura se usa donde aporta: relaciones, multi‑hop y visión de conjunto.
Cómo se posiciona el panorama
El ecosistema es excelente en lo suyo, pero casi todo está construido alrededor del pasaje, no de la relación:
| Herramienta | Qué es | Mecanismo de recuperación | Punto ciego relacional |
|---|---|---|---|
| Pinecone | Base vectorial gestionada | Similitud vectorial (+ híbrido) | Sin noción nativa de relaciones |
| Weaviate | Base vectorial (no de grafo) | Vector + BM25F | Cross‑refs desaconsejadas para travesía profunda |
| LangChain | Framework de orquestación | Delega en el backend que conectes | No aporta recuperación relacional propia |
| LlamaIndex | Framework de datos para RAG | Vector + PropertyGraphIndex | El grafo depende de la extracción por LLM |
| Neo4j | Base de datos de grafo | Cypher + índice vectorial | Hay que construir y modelar el grafo antes |
| Microsoft GraphRAG | Pipeline de grafo | Grafo + comunidades (Leiden) | Indexado caro e intensivo en LLM |
| Elastic / OpenSearch | Motores de búsqueda | BM25 + kNN (RRF) | Sin travesía de relaciones entre documentos |
La conclusión no es que estas herramientas sean malas — son piezas magníficas. Es que el grafo de conocimiento como contexto ambiente vivo de la operación no es el caso de uso para el que casi ninguna fue diseñada.
Cómo pensamos ser los mejores
No competimos por tener el mejor índice vectorial: competimos por entender la operación de una empresa mejor que nadie. Ahí enfocamos la ventaja, por ámbitos:
El enfoque habitual
BiVelio
- Contexto de la operación, no solo de documentos. Nuestro grafo no nace de trocear PDFs: nace de cómo funciona la empresa. Eso da relaciones precisas y actualizadas, no inferidas.
- Multi‑hop y visión de conjunto de serie. PageRank personalizado para recuperar vecindades coherentes (Gutiérrez et al., 2024) y comunidades para razonar a la granularidad correcta (Edge et al., 2024) — los dos modos que la evidencia premia.
- Contexto coherente, no fragmentos. Recuperamos el caso más su cliente más sus facturas relacionadas, no tres trozos que comparten una palabra. Atacamos directamente el "perdido en el medio" (Liu et al., 2023) entregando menos contexto pero mejor conectado.
- Precisión y coste. Combinamos el grafo con un reranking efímero para que solo lo mejor llegue a la ventana del agente — la idea que desarrollamos en Reranking efímero.
- Gobernanza y trazabilidad. Cada pieza de contexto tiene origen en el grafo: se puede auditar de dónde salió una decisión. En operaciones de empresa, eso no es un extra, es un requisito.
Nota: las cifras de este artículo provienen de la literatura citada (Liu et al., Edge et al., Gutiérrez et al., Barnett et al., Wu et al.) y describen enfoques de grafo en general. Son la motivación de nuestro diseño, no un benchmark cerrado de producto.
Referencias
- #grafos
- #knowledge graph
- #graphrag
- #agentes
- #pagerank
- #rag