Self-Harness 2026: gli agenti IA si riscrivono da soli
Che un’azienda sviluppi il proprio modello linguistico di frontiera è una scelta rara e complessa. Quello che invece la maggior parte delle imprese può e dovrebbe fare è personalizzare il harness — il sistema di controllo intorno al modello — per adattarlo ai propri specifici bisogni operativi.

Il problema è che questa ottimizzazione rimane ancora largamente affidata a tentativi manuali e improvvisati, un processo che dipende più dall’intuito umano che da cicli di feedback sistematici. Mantenere il passo con l’evoluzione rapida dei modelli linguistici in questo modo diventa sempre più difficile e dispendioso.
Ricercatori del Shanghai Artificial Intelligence Laboratory hanno presentato Self-Harness, un paradigma nuovo dove un agente basato su LLM migliora sistematicamente le proprie regole operative. Analizzando le tracce della sua esecuzione per apportare modifiche, il sistema sostituisce il puro guesswork con l’evidenza empirica. Gli sviluppatori possono così dispiegare agenti personalizzati che si adattano continuamente ai propri protocolli, compensando i limiti specifici del modello sottostante.
Il collo di bottiglia dell’ingegneria dei harness
La performance di un agente basato su LLM non dipende soltanto dal modello base, ma anche dal suo harness: l’infrastruttura circostante che fornisce contesto e consente interazione con l’ambiente. Un harness comprende componenti come i system prompt, gli strumenti disponibili, la memoria, le regole di verifica, le politiche di runtime, la logica di orchestrazione e le procedure di ripristino dai fallimenti.
Questo livello è cruciale perché molti fallimenti comuni degli agenti derivano proprio dall’harness, non dal modello. Un agente potrebbe segnalare successo senza verificare realmente la risposta del modello, oppure riprovare indefinitamente un’azione fallita. L’harness è anche responsabile di prevenire il cosiddetto context rot, il degrado che si verifica quando la cronologia di interazioni cresce eccessivamente. Sistemi come SWE-agent, Claude Code e OpenHands rappresentano harness ben noti in questo ambito.
L’engineering del harness rimane una sfida significativa, ma il vero collo di bottiglia non è che gli umani siano troppo lenti o incapaci. Hangfan Zhang, autore principale del paper su Self-Harness, ha spiegato che spesso un ingegnere esperto con profonda conoscenza del dominio propone ancora modifiche migliori di quelle che un LLM potrebbe generare autonomamente. Il vero limite della progettazione manuale risiede piuttosto nella mancanza di un ciclo di feedback verificabile e sistematico. Molti aggiustamenti vengono fatti per intuizione, basandosi su alcuni fallimenti osservati o su debug improvvisati. Con nuovi modelli rilasciati a ritmo serrato, dipendere dall’intuizione umana per sintonizzare manualmente harness specifici per ogni modello diventa sempre più costoso e insostenibile.
Come Self-Harness trasforma l’auto-miglioramento
Self-Harness consente a un agente basato su LLM di migliorare il proprio harness senza dipendere da ingegneri umani o da modelli esterni più potenti. Questo ciclo di auto-evoluzione continua si articola in tre fasi iterative che convertono l’evidenza comportamentale in aggiornamenti del harness.
La prima fase, weakness mining, parte da un harness iniziale. L’agente esegue una serie di task, generando tracce di esecuzione con risultati verificabili. Categorizza gli insuccessi e individua pattern specifici di fallimento legati al modello. Nella fase di harness proposal, basandosi su questi pattern, l’agente assume il ruolo di “proposer” generando un insieme diversificato ma minimale di modifiche all’harness, ognuna collegata a un meccanismo di fallimento specifico per evitare correzioni troppo generiche.
Infine, nella fase di proposal validation, il sistema valuta le modifiche candidate attraverso regression test. Un’edit viene promossa solo se migliora la performance senza causare degrado misurabile su task di controllo. Se più modifiche superano i test, vengono integrate nella versione successiva dell’harness, che diventa il punto di partenza per l’iterazione seguente.
Per comprendere il valore pratico, consideriamo un agente automatizzato per la correzione di bug che legge documentazione interna, scrive patch e apre pull request. Se l’azienda aggiorna lo stile della documentazione, l’agente potrebbe improvvisamente fallire, estraendo il contesto sbagliato o generando patch difettose. In apparenza, l’agente sembra semplicemente rotto. Ma Self-Harness trasforma questo fallimento ambiguo in un problema risolvibile: le tracce di fallimento espongono dove l’agente mal interpreta il nuovo formato; il proposer genera un’edit mirata all’harness; l’evaluator decide se quell’edit migliora i casi problematici senza compromettere gli altri.
I ricercatori hanno testato il framework su Terminal-Bench-2.0, un benchmark che valuta l’esecuzione generica basata su strumenti, includendo gestione di artefatti, uso di comandi, comportamento di verifica e recovery automatici. I risultati hanno mostrato miglioramenti significativi nella capacità degli agenti di adattarsi a nuovi modelli e ambienti senza intervento umano continuo.
Questo approccio rappresenta un passaggio concettuale importante: invece di richiedere un ingegnere che osservi fallimenti e intuisca soluzioni, Self-Harness crea un ciclo automatico dove l’evidenza empirica guida l’evoluzione. Per le aziende che dispiegano agenti in ambienti dinamici — come assistenti che interagiscono con codice in evoluzione o sistemi che adattano le loro risposte a dati mutevoli — significa manutenzione significativamente ridotta e adattabilità superiore.
Se però anche gli agenti stessi iniziano a riscrivere le proprie regole operative, come facciamo a mantenere il controllo umano sui processi critici? La domanda non è tanto sulla capacità tecnica, quanto su quale livello di autonomia decidiamo di delegare alle macchine.
Ripreso da: VentureBeat