AI

2026: lo storage legacy blocca le GPU, l’IA paga il prezzo

Daniele Messi · 24 Giugno 2026 · 4 min di lettura
2026: lo storage legacy blocca le GPU, l'IA paga il prezzo
Immagine: Tom's Hardware Italia

Le GPU più potenti del mercato rimangono spesso sottoutilizzate, ma non sempre per colpa del silicio. Secondo quanto emerso dalle analisi del settore, il collo di bottiglia risiede altrove: nell’infrastruttura di storage legacy che alimenta i sistemi di intelligenza artificiale. Un dettaglio tecnico che, apparentemente marginale, incide significativamente sulla redditività dei data center e sulla capacità di scalare i progetti AI.

2026: lo storage legacy blocca le GPU, l'IA paga il prezzo
Crediti immagine: Tom’s Hardware Italia

HPE ha portato questa problematica al centro del dibattito tecnico, evidenziando come la velocità di elaborazione delle GPU sia frequentemente frenata dall’impossibilità di accedere ai dati con la rapidità necessaria. Quando un acceleratore attende il trasferimento dati, il collo di bottiglia non risiede nella capacità computazionale, ma nel percorso infrastrutturale che collega storage, rete e memoria.

Il gap infrastrutturale che nessuno risolve

I sistemi di storage tradizionali, spesso basati su architetture consolidate da anni, non sono stati progettati per servire carichi di lavoro AI in tempo reale. La latenza introdotta dal passaggio attraverso layer legacy di rete e archiviazione rappresenta un’inefficienza strutturale che si amplifica quando si moltiplicano le GPU in parallelo.

In un cluster con decine o centinaia di acceleratori, il problema dell’accesso ai dati non rappresenta più un’eccezione, ma la regola. Una singola GPU che attende è un’anomalia; decine di GPU che rimangono idle è un costo operativo consistente. HPE stima che questo scenario sia comune nelle implementazioni aziendali, dove i vincoli infrastrutturali ereditati da anni di evoluzioni tecnologiche precedenti bloccano la piena espressione della potenza computazionale disponibile.

Il problema si aggrava quando si considerano gli algoritmi di machine learning moderni, che richiedono accesso frequente e parallelo a dataset di dimensioni sempre maggiori. Le architetture storage pensate per carichi OLTP o per applicazioni tradizionali semplicemente non reggono il passo. Il risultato è una situazione dove investire in GPU ulteriori diventa economicamente irrazionale finché l’infrastruttura sottostante non viene riprogettata.

Verso architetture di storage pensate per l’AI

La consapevolezza del problema sta spingendo il mercato verso soluzioni alternative. Non si tratta necessariamente di strappi rivoluzionari, ma di un’evoluzione architettonica dove storage, calcolo e rete sono co-progettati anziché assemblati in sequenza. Alcune aziende stanno esplorando configurazioni dove i dati risiedono più vicini ai sistemi di elaborazione, riducendo la distanza logica e fisica che le GPU devono attraversare.

L’approccio non è nuovo in sé—il concetto di locality nell’accesso ai dati è noto da decenni—ma la sua applicazione sistemica ai workload AI rappresenta un cambiamento di paradigma rispetto alle infrastrutture tradizionali. Modificare storage legacy significa investimenti significativi, che spiegano come mai molti data center convivono ancora con questi vincoli pur consapevoli del loro costo.

La questione pone interrogativi che vanno oltre l’aspetto puramente tecnico. Se il vero limite dei progetti AI risiede nell’infrastruttura piuttosto che nella capacità computazionale, allora le organizzazioni devono riconsiderare come allocano il budget tecnologico. Continuare a investire in GPU senza affrontare il problema dello storage significa alimentare un’inefficienza strutturale. D’altro canto, riprogettare completamente l’infrastruttura richiede tempi lunghi e risorse significative, creando un equilibrio precario tra necessità tecnica e vincoli economici.

Secondo me, quello che HPE evidenzia è un segnale importante per il mercato italiano: le aziende che accumulano GPU senza interrogarsi sulla capacità infrastrutturale di supportarle stanno potenzialmente sprecando risorse. La vera sfida non è più procurarsi acceleratori, ma costruire ambienti dove questi possono esprimere il loro potenziale senza attese dovute a sistemi legacy.

Quale aspetto della vostra infrastruttura AI rappresenta il vincolo reale che frena i vostri progetti?

Fonte: Tom’s Hardware Italia