Fonaments

El human-in-the-loop no és una funció: és un model operatiu

El human-in-the-loop no és un botó d'aprovació penjat sobre un model: és un model operatiu complet. És una Capa de Confiança de permisos, llindars d'autoritat, aprovacions, auditoria total i rollback que governa com s'executa el treball autònom. Ara que els agents actuen —no només suggereixen— la diferència entre funció i model operatiu decideix si l'autonomia és governada o descontrolada. Aquest article defineix aquest model, el compara amb la supervisió com a característica, en descriu els cinc components i explica com BiVelio el materialitza en la seva Capa de Confiança dins d'una capa d'operacions autònomes governades.

BiVelio Research2 de juliol del 202612 min de lectura

El human-in-the-loop no és una funció. És un model operatiu. Un popup d'aprovació és una casella dins d'un flux; un model operatiu defineix qui pot fer què, on s'atura l'autonomia i com qualsevol acció es pot auditar i revertir. A la pràctica, és una Capa de Confiança —permisos, llindars d'autoritat, aprovacions, auditoria total i rollback— que governa la manera com s'executa el treball autònom. La regla que ho resumeix és simple: la IA executa el repetible i les persones decideixen el crític.

Aquesta distinció va deixar de ser acadèmica el dia que els agents van començar a actuar —enviar el correu, actualitzar el CRM, emetre el reemborsament— en lloc de només suggerir text. Quan la sortida d'un sistema era una recomanació que un humà copiava a mà, la supervisió passava per defecte. Quan la sortida és una acció irreversible executada als teus sistemes, la supervisió s'ha de dissenyar.

Definició

Human-in-the-loop (HITL) com a model operatiu és el conjunt de regles i mecanismes —permisos i rols, llindars d'autoritat, aprovacions i escalats, auditoria amb traçabilitat d'origen, i rollback— que determina com el treball autònom s'executa, s'atura i es reverteix, de manera que cada acció sigui governada, explicable i reversible.

No és el mateix que "revisió humana". La revisió és un moment; el model operatiu és l'estructura permanent que decideix quan cal aquest moment, qui està autoritzat a intervenir i què passa si alguna cosa surt malament. El human-in-the-loop és un paradigma tècnic establert en què el coneixement i el judici humà s'integren al llarg del cicle de vida del sistema, no un ornament d'interfície (Wu et al., 2022).

Per què importa ara que els agents actuen, no només suggereixen

Un agent és una entitat de programari autònoma que actua pel seu compte per assolir objectius (Wooldridge, 2009). Aquesta autonomia és exactament el que aporta valor —i exactament el que cal acotar. Sense autoritat humana explícita ni coordinació, l'autonomia en operacions d'empresa esdevé un risc sense sostre. La supervisió, quan és un model operatiu, és el que converteix aquesta autonomia en autonomia governada.

Funció davant de model operatiu: el canvi de fons

La versió "funció" del human-in-the-loop és un diàleg de confirmació: "Aprovar aquesta acció? Sí / No". S'afegeix a un flux concret, gairebé sempre al final, i no canvia res estructural. Funciona fins que el volum creix: l'humà aprova en pilot automàtic, no pot raonar sobre el que aprova, i la casella es converteix en teatre de supervisió.

HITL-com-a-model-operatiu: permisos, llindars, aprovacions, auditoria, rollback

La versió "model operatiu" no viu dins d'un flux: viu per damunt de tots els fluxos. Defineix qui està autoritzat, en quin punt l'autonomia ha d'escalar, com queda registrada cada acció i com es desfà. El risc de la IA és sociotècnic, i la funció transversal de govern és la que estableix responsabilitat, polítiques i línies d'autoritat al llarg del cicle de vida (National Institute of Standards and Technology, 2023). Això no és una casella: és arquitectura.

Taula comparativa

Dimensió	HITL com a funció	HITL com a model operatiu
Abast	Un flux concret	Tota l'operació, transversal
Governança	Aprovar / rebutjar	Permisos, rols i llindars d'autoritat
Auditoria	Log del clic, si de cas	Traça completa amb traçabilitat d'origen
Fallada	Acció executada, sense marxa enrere	Rollback i reversibilitat dissenyats
Mesura	Cap	Autonomy Rate governada en una consola
Biaix	Aprovació automàtica (rubber-stamping)	Llindars que forcen decisió real

La frase que ho resumeix

Una funció afegeix una casella a un flux; un model operatiu defineix qui pot fer què, on s'atura l'autonomia i com qualsevol acció es pot auditar i revertir.

Els cinc components d'un model operatiu human-in-the-loop

Permisos i rols: qui pot fer què

El primer component respon la pregunta més bàsica de qualsevol operació governada: què està autoritzat a fer cada actor —humà o agent. Sense permisos i rols explícits, no hi ha manera de raonar sobre autoritat, i tota aprovació posterior descansa sobre sorra.

Llindars d'autoritat: on s'atura l'autonomia

Els llindars d'autoritat codifiquen el punt exacte en què una decisió deixa de ser autònoma i ha d'escalar a una persona: un import, una categoria de client, una acció irreversible, un nivell de confiança del model. Són el mecanisme que separa l'autonomia governada de l'automatització sense sostre.

Llindars d'autoritat

Els llindars d'autoritat són el que separa l'autonomia governada de l'automatització descontrolada: codifiquen el punt exacte en què una decisió ha d'escalar a una persona.

Aprovacions i escalat: la IA executa el repetible, les persones decideixen el crític

Quan es creua un llindar, el treball es pausa i escala. Aquest és el cor de la divisió del treball. La pregunta fundacional de l'automatització de processos ha estat sempre "què s'hauria d'automatitzar i què haurien de fer les persones?" (van der Aalst et al., 2018). Un model operatiu human-in-the-loop respon aquesta pregunta de manera explícita i per cas, no de manera implícita i esperant el millor.

Auditoria total amb traçabilitat d'origen: cada acció explicable

Tota acció autònoma ha de ser reconstruïble: què s'ha fet, per què, amb quines dades i sota quina autoritat. La traçabilitat d'origen —de tornada al document, correu, regla o sistema que va originar la decisió— és el que fa que una operació autònoma sigui explicable i, per tant, defensable davant d'un client, un auditor o un regulador.

Rollback i reversibilitat: execució segura davant la fallada

L'últim component assumeix que alguna cosa sortirà malament i dissenya per a això. Si tota acció es pot revertir, el cost d'un error autònom baixa d'"incident" a "anotació a la traça". Mecanismes deliberats de correcció, invocació i descart no són un extra: són eleccions de disseny al llarg de tota la interacció (Amershi et al., 2019).

No és opcional

Cada acció autònoma ha de ser explicable i reversible: l'auditoria total amb traçabilitat d'origen i el rollback són prerequisits, no afegits posteriors.

On encaixa BiVelio: la Capa de Confiança

BiVelio tracta el human-in-the-loop com la seva Capa de Confiança (Trust Layer) dins d'una capa d'operacions autònomes governades. No és una funció d'un producte: és el pilar que governa els altres. BiVelio es connecta per damunt de les eines que ja fas servir —correu, WhatsApp, CRM, ERP, calendari— en lloc de reemplaçar-les.

Com la Capa de Confiança connecta Brain, Workers, Agents i l'Autonomy Console

Els cinc pilars de BiVelio treballen junts, i la Capa de Confiança és el que imposa les regles sobre la resta:

Brain és la memòria operativa viva de l'empresa: ingereix documents, correus, trucades, sistemes i regles amb traçabilitat d'origen —la matèria primera que fa que cada acció sigui explicable.
Workers —els 8 treballadors predissenyats— fan la due diligence operativa i detecten la fricció que mereix automatitzar-se.
Velio i els agents: Velio, el consultor autònom, fa la due diligence; els agents governats executen el treball repetible.
La Capa de Confiança aplica permisos, llindars, aprovacions, auditoria i rollback sobre tot l'anterior.
L'Autonomy Console mesura i governa quant de l'operació corre de manera autònoma i governada.

Mesurar-ho: l'Autonomy Rate com a sortida d'un model operatiu que funciona

Un model operatiu que funciona produeix una mètrica. L'Autonomy Rate —quant de l'operació corre de manera autònoma i governada— és la sortida observable d'un human-in-the-loop ben dissenyat, i se segueix en una sola consola. Puja quan els llindars estan ben calibrats i la confiança creix; s'estabilitza on el judici humà continua sent imprescindible. Desenvolupem aquesta idea a Per què la teva empresa necessita una Autonomy Rate.

Casos d'ús

Back-office on una acció equivocada costa cara

En operacions administratives —conciliacions, reemborsaments, altes i baixes— la majoria del treball és repetible però un subconjunt és sensible. El model operatiu deixa que els agents processin el gruix i escala a una persona quan es creua un llindar: un import elevat, una excepció a la política, un client marcat com a crític. La IA executa el repetible; la persona decideix el crític.

Operacions de client sobre correu, WhatsApp i CRM (sobre les teves eines)

BiVelio es connecta sobre el correu, WhatsApp i el CRM que l'empresa ja té —no els proveeix ni els substitueix. Un agent pot redactar i enviar respostes rutinàries de manera autònoma, però escalar a un humà una negociació, una queixa formal o qualsevol missatge que creui el llindar d'autoritat. Tota interacció queda a la traça, amb el seu origen.

Decisions regulades o d'alt risc amb supervisió documentada

On hi ha obligació de supervisió humana, el model operatiu la fa demostrable. Els sistemes d'IA d'alt risc s'han de dissenyar perquè persones físiques puguin supervisar-los de manera efectiva, inclosa la capacitat d'ignorar la sortida o decidir no fer servir el sistema, i de contrarestar el biaix d'automatització (European Parliament and Council of the European Union, 2024). L'auditoria total i el rollback converteixen "hi va haver supervisió humana" d'una afirmació en un fet registrat.

Com adoptar un model operatiu human-in-the-loop (pas a pas)

Mapeja el treball per reversibilitat i risc. Separa el repetible-segur del crític-irreversible abans d'automatitzar res.
Defineix permisos i rols. Estableix què està autoritzat cada actor, humà o agent, abans d'encendre autonomia.
Calibra llindars d'autoritat. Fixa els punts concrets d'escalat: imports, categories, nivells de confiança.
Connecta l'auditoria amb traçabilitat d'origen. Assegura't que cada acció es reconstrueix fins a la seva font.
Dissenya el rollback. Fes que les accions siguin reversibles per defecte.
Mesura l'Autonomy Rate i puja per evidència. Amplia l'autonomia només on la traça demostra que és segur.

Modes de fallada i antipatrons

Biaix d'automatització i excés de confiança

El risc més silenciós és que la persona confiï massa en la IA i aprovi sense pensar. Per això la regulació exigeix explícitament la capacitat de contrarestar el biaix d'automatització (European Parliament and Council of the European Union, 2024): els llindars han de forçar decisions reals, no confirmacions reflexes.

Teatre de supervisió: aprovacions que ningú pot raonar

L'antipatró bessó és l'"oversight theater": aprovacions que existeixen sobre el paper però que l'humà no pot avaluar de veritat perquè li falta context, temps o traçabilitat. Una aprovació sense la informació per raonar-la no és governança; és una signatura en blanc.

Glossari

Brain: la memòria operativa viva de l'empresa; ingereix documents, correus, trucades, sistemes i regles amb traçabilitat d'origen.
Workers: els 8 treballadors predissenyats que fan due diligence operativa i detecten fricció.
Agents: entitats de programari autònomes que executen el treball repetible de manera governada (Wooldridge, 2009).
Velio: el consultor/entrevistador autònom que realitza la due diligence de l'operació.
Capa de Confiança (Trust Layer): el conjunt de permisos, llindars d'autoritat, aprovacions, auditoria i rollback que governa el treball autònom.
Autonomy Rate: quant de l'operació corre de manera autònoma i governada; la sortida mesurable del model operatiu.
Autonomy Console: la consola única on es mesura i governa l'Autonomy Rate.
HITL (human-in-the-loop): paradigma en què el judici humà s'integra en el cicle de vida del sistema (Wu et al., 2022); aquí, entès com a model operatiu.
Llindar d'autoritat: el punt exacte en què una decisió ha d'escalar d'un agent a una persona.
Autonomia governada: autonomia acotada per autoritat humana, auditoria i reversibilitat.

FAQ

El human-in-the-loop és el mateix que la revisió humana?

No. La revisió humana és un moment —algú mira una sortida. El human-in-the-loop com a model operatiu és l'estructura que decideix quan cal aquesta revisió, qui està autoritzat a fer-la i què passa si l'acció s'ha de revertir. La revisió és un esdeveniment; el model operatiu és l'arquitectura.

El human-in-the-loop alenteix l'automatització?

No quan està ben dissenyat. Els llindars d'autoritat fan que la majoria del treball repetible corri de manera autònoma i que només el crític escali a una persona. El resultat és més automatització sostenible, no menys: l'Autonomy Rate puja perquè la confiança està recolzada per auditoria i rollback.

En què es diferencia HITL de human-on-the-loop i human-in-command?

En el grau d'intervenció. En human-in-the-loop, la persona intervé en el llaç de decisió abans que certes accions s'executin. En human-on-the-loop, la persona supervisa i pot intervenir, però el sistema actua per defecte. En human-in-command, la persona manté l'autoritat última sobre si el sistema es fa servir. Un model operatiu madur combina els tres segons el llindar d'autoritat de cada acció.

Com es mesura si el model operatiu funciona?

Amb l'Autonomy Rate: la proporció de l'operació que corre de manera autònoma i governada, seguida a l'Autonomy Console. Una Autonomy Rate que puja amb la taxa d'error controlada i la traça intacta indica un model que funciona; una que puja a costa d'incidents o d'aprovacions buides indica teatre de supervisió.

BiVelio reemplaça el meu CRM, ERP o correu?

No. BiVelio es connecta per damunt de les eines que ja fas servir —correu, WhatsApp, CRM, ERP, calendari— i opera sobre elles de manera governada. No les proveeix ni les substitueix. Vegeu la plataforma i el diagnòstic.

Com es relaciona això amb governar agents en processos de negoci?

El model operatiu human-in-the-loop és precisament el mecanisme de govern dels agents. Ho tractem en detall a Com governar agents d'IA en processos de negoci, a De l'automatització a l'autonomia governada i a Què és un sistema operatiu de processos governats.

Referencias

Amershi, S., Weld, D., Vorvoreanu, M., Fourney, A., Nushi, B., Collisson, P., Suh, J., Iqbal, S., Bennett, P. N., Inkpen, K., Teevan, J., Kikin-Gil, R., & Horvitz, E. (2019). Guidelines for Human-AI Interaction. Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems, 1–13. https://doi.org/10.1145/3290605.3300233

European Parliament and Council of the European Union. (2024). Regulation (EU) 2024/1689 (Artificial Intelligence Act), Article 14: Human Oversight. Official Journal of the European Union. https://artificialintelligenceact.eu/article/14/

National Institute of Standards and Technology. (2023). Artificial Intelligence Risk Management Framework (AI RMF 1.0) (Techreport NIST AI 100-1). U.S. Department of Commerce, NIST. https://doi.org/10.6028/NIST.AI.100-1

van der Aalst, W. M. P., Bichler, M., & Heinzl, A. (2018). Robotic Process Automation. Business & Information Systems Engineering, 60(4), 269–272. https://doi.org/10.1007/s12599-018-0542-4

Wooldridge, M. (2009). An Introduction to MultiAgent Systems (2nd ed.). John Wiley & Sons. https://www.cs.ox.ac.uk/people/michael.wooldridge/pubs/imas/IMAS2e.html

Wu, X., Xiao, L., Sun, Y., Zhang, J., Ma, T., & He, L. (2022). A Survey of Human-in-the-loop for Machine Learning. Future Generation Computer Systems, 135, 364–381. https://doi.org/10.1016/j.future.2022.05.014

#human-in-the-loop
#governanca
#autonomia-governada
#trust-layer
#supervisio-humana
#agents