Bertrand 4 novembre 2025

I tuoi dati non sono la loro piattaforma

14 min di lettura

Ogni volta che il tuo team di servizio clienti invia una richiesta a una piattaforma IA di terze parti, stai inviando i dati dei tuoi clienti, il tuo linguaggio operativo, la tua competenza di dominio e la tua intelligence competitiva a un server che non controlli. La risposta torna. I dati restano.

Non è un argomento sulla privacy. È un argomento sull’architettura.

Il problema della piattaforma in affitto

Il percorso standard di adozione IA per una PMI europea nel 2025 è questo: iscriversi a un servizio IA gestito, alimentarlo con i dati aziendali, lasciarlo imparare i tuoi pattern, dipendere dai suoi output. La configurazione richiede una settimana. La dipendenza richiede un trimestre.

Il GDPR — specificamente l’Articolo 28, che disciplina gli obblighi del responsabile del trattamento — richiede un quadro contrattuale tra il titolare del trattamento (tu) e il responsabile del trattamento (la piattaforma). La maggior parte delle aziende spunta questa casella. Poche aziende capiscono cosa succede al valore derivato dai loro dati una volta che la piattaforma li elabora.

La distinzione conta. I dati dei tuoi clienti, in isolamento, sono tuoi. I pattern estratti dai dati dei tuoi clienti, combinati con i pattern dei dati di diecimila altre aziende, diventano un segnale di addestramento. Quel segnale di addestramento migliora il modello generale della piattaforma. Il modello generale viene poi rivenduto a te — e ai tuoi concorrenti — come funzionalità.

Stai sovvenzionando un prodotto che verrà usato contro di te. Con i tuoi stessi dati.

Cosa significa realmente sovranità dei dati

La sovranità dei dati non significa tenere i dati in una cassaforte. Significa controllare la catena di estrazione del valore. Tre livelli.

Livello uno: sovranità di storage. Sai dove risiedono fisicamente i tuoi dati. È la baseline GDPR. Gli Articoli da 44 a 49 disciplinano i trasferimenti internazionali di dati. La maggior parte delle aziende UE ha affrontato questo punto — o pensa di averlo fatto. Le linee guida dell’EDPB sui fornitori di servizi cloud hanno aggiunto specificità: sapere il paese non basta. Devi conoscere i data center specifici, i sub-responsabili e le condizioni in cui i dati possono essere accessibili da entità terze.

Livello due: sovranità di elaborazione. Controlli come i tuoi dati vengono elaborati. Va oltre la limitazione delle finalità dell’Articolo 5 del GDPR. La sovranità di elaborazione significa che quando i tuoi dati vengono usati per addestrare, fare fine-tuning o adeguare un modello, i miglioramenti del modello risultanti sono attribuibili e controllabili. La maggior parte delle piattaforme IA gestite non offre questo livello di trasparenza. L’elaborazione avviene in una scatola nera. L’estrazione di valore è opaca.

Livello tre: sovranità delle insight. I pattern, le previsioni e le decisioni derivate dai tuoi dati restano tuoi. Non come pretesa legale — come architettura tecnica. Le insight generate dai tuoi dati operativi alimentano i tuoi sistemi, non un modello general-purpose che serve i tuoi concorrenti.

La maggior parte delle aziende opera al livello uno e presume di aver risolto il problema. Non l’ha fatto.

L’architettura dell’indipendenza

Integrare la sovranità dei dati in un deployment IA non è filosofico. È architetturale. Quattro decisioni tecniche.

Decisione uno: dove gira il modello. Un modello che gira sulla tua infrastruttura (o su infrastruttura cloud dedicata con garanzie contrattuali) elabora i tuoi dati senza trasmetterli a una piattaforma condivisa. Non si tratta di costruire il tuo GPT. Si tratta di distribuire modelli fine-tuned — modelli open-weight come Mistral, Llama o Qwen — su infrastruttura che controlli. Il costo di calcolo è più alto di un’API gestita. La sovranità è assoluta.

Per la maggior parte delle PMI, il compromesso pratico è un’istanza dedicata di un modello gestito con garanzie contrattuali che i tuoi dati non vengano usati per l’addestramento, non vengano combinati con i dati di altri clienti e vengano cancellati dopo l’elaborazione. Anthropic, OpenAI e Mistral offrono tutte queste garanzie — ma devi leggere il contratto specifico, non la pagina marketing. La model card (un documento di cui scriverò separatamente) ti dice di più su cosa fa realmente il modello rispetto al deck commerciale.

Decisione due: dove avviene il fine-tuning. Se fai il fine-tuning di un modello sui tuoi dati di dominio — le trascrizioni del tuo supporto clienti, le specifiche dei tuoi prodotti, le tue procedure operative — il modello adattato risultante contiene la tua intelligence competitiva nei suoi pesi. Quel modello deve vivere su infrastruttura che controlli. Fare fine-tuning su una piattaforma in affitto significa che la tua competenza di dominio è incorporata in un sistema che non possiedi. Se la piattaforma cambia i termini, alza i prezzi o interrompe il servizio, il tuo modello fine-tuned se ne va con essa.

Decisione tre: dove vivono i vettori. Le architetture RAG (retrieval-augmented generation) usano database vettoriali per memorizzare gli embedding dei tuoi documenti. Quegli embedding sono una rappresentazione compressa della tua base di conoscenza. Devono vivere su infrastruttura che controlli — non su un servizio vettoriale gestito che mischia i tuoi embedding con i dati di altri clienti. Ospitare il proprio database vettoriale (Qdrant, Milvus, pgvector in un’istanza PostgreSQL gestita) costa tra 50 e 300 € al mese per un carico di lavoro PMI tipico. È il costo di possedere la propria architettura della conoscenza.

Decisione quattro: dove si chiude il ciclo di feedback. Quando gli utenti interagiscono con il tuo strumento IA, il loro feedback — correzioni, preferenze, suggerimenti rifiutati — è il dato più prezioso nel sistema. Ti dice dove il modello fallisce sui tuoi compiti specifici. Questo ciclo di feedback deve chiudersi all’interno dei tuoi sistemi. Se il feedback fluisce verso una piattaforma gestita, la piattaforma impara dalle correzioni dei tuoi utenti. Tu hai pagato per il deployment. Loro ottengono l’apprendimento.

L’Articolo 22 del GDPR dà agli individui il diritto di non essere sottoposti a decisioni basate unicamente su un trattamento automatizzato. Di solito viene discusso come un requisito di conformità. È anche un requisito architetturale.

Se il tuo strumento IA prende decisioni che riguardano gli individui — credit scoring, screening per l’assunzione, idoneità ai servizi — l’Articolo 22 richiede una supervisione umana significativa. “Significativa” è la parola chiave. L’azione di enforcement dell’HmbBfDI di Amburgo del 2025 (una sanzione di 492.000 € per decisioni automatizzate sul credito senza supervisione umana significativa) ha dimostrato che “significativa” significa che il revisore umano deve avere la capacità tecnica e l’autorità operativa di sovrascrivere la decisione automatizzata. Un processo di revisione a timbro di gomma non si qualifica.

Quando questo processo decisionale automatizzato gira su una piattaforma di terze parti, l’architettura tecnica per una supervisione umana significativa diventa più complessa. Il revisore umano ha bisogno di accesso al ragionamento del modello (o almeno ai suoi segnali di confidenza), ai dati di input e alle decisioni alternative che il modello ha considerato. Se questi vengono generati su una piattaforma in affitto, il processo di revisione dipende dalle funzionalità di spiegabilità della piattaforma — che possono essere limitate, possono cambiare senza preavviso e possono non soddisfare la definizione di “significativa” dell’autorità di protezione dati.

Sulla tua infrastruttura, controlli lo strato di spiegabilità. Tu decidi cosa vede il revisore umano, quali meccanismi di sovrascrittura esistono e come le decisioni vengono registrate.

Canali di proprietà: il parallelo con i contenuti

L’argomento sulla sovranità dei dati ha un parallelo con i contenuti che è altrettanto importante e altrettanto sottovalutato.

La maggior parte delle aziende produce contenuti su piattaforme in affitto: post su LinkedIn, storie su Instagram, articoli su Medium. La piattaforma controlla la distribuzione. L’algoritmo determina la portata. I termini di servizio definiscono cosa puoi dire. Il tuo pubblico è a un cambio di algoritmo dalla sparizione.

I canali di proprietà — il tuo sito web, la tua mailing list, le tue relazioni dirette con i clienti — sono l’equivalente contenutistico della sovranità dei dati. Tu controlli la distribuzione. Tu possiedi la relazione. Il pubblico appartiene a te, non alla piattaforma.

In Bluewaves, ogni contenuto che produciamo vive prima sul nostro dominio. Può essere distribuito altrove, ma la versione canonica vive su infrastruttura che controlliamo. Ogni relazione con gli iscritti è diretta — nessun algoritmo tra noi e il lettore. Ogni dato sulle performance fluisce nella nostra analitica, non nella dashboard di una piattaforma che può essere deprecata senza preavviso.

Lo stesso principio si applica al deployment IA. Il tuo strumento IA deve girare su canali che possiedi, servire utenti con cui hai una relazione diretta e generare dati che alimentano i tuoi sistemi. Affittare la portata è tentante perché è veloce. Possedere la portata è più difficile perché richiede infrastruttura. Ma la portata affittata è affittata, e il proprietario può cambiare i termini in qualsiasi momento.

Il confronto dei costi che nessuno fa onestamente

Le piattaforme IA gestite prezzano a consumo: per token, per query, per chiamata API. Il costo marginale sembra basso. A scala, si accumula.

Un’azienda da 200 persone che gestisce uno strumento IA di servizio clienti che elabora 500 query al giorno con una media di 2.000 token per query sta elaborando 1 milione di token al giorno. Ai prezzi attuali delle API gestite (circa 3-15 $ per milione di token di input a seconda del modello e del fornitore), sono 90-450 $ al mese per la sola inferenza. Accessibile.

Ma aggiungi i costi di fine-tuning, hosting del database vettoriale, monitoraggio e il costo implicito dei dati che fluiscono verso terzi, e il confronto cambia. Un deployment dedicato su un cluster Kubernetes gestito con un modello open-weight costa 400-1.200 € al mese per lo stesso carico di lavoro — con piena sovranità dei dati, nessun prezzo per token e nessuna dipendenza dalle decisioni di prezzo di un fornitore.

Il costo iniziale è più alto. Il costo continuativo è più basso. Il costo strategico — il costo della dipendenza da una piattaforma che controlla la tua pipeline dati — è zero.

La maggior parte delle aziende non fa mai questo confronto perché l’API gestita è più veloce da configurare. La velocità di configurazione non è un vantaggio strategico. La velocità di configurazione è una comodità tattica che diventa una responsabilità strategica.

La dimensione BCE

La Financial Stability Review della BCE di novembre 2025 ha osservato che “il rischio di concentrazione nei fornitori di servizi cloud e IA rappresenta una preoccupazione sistemica per la stabilità finanziaria dell’UE.” Il report ha specificamente segnalato la dipendenza delle istituzioni finanziarie UE da un piccolo numero di fornitori di infrastruttura IA con sede negli Stati Uniti.

È la versione macro dello stesso argomento. Quando migliaia di aziende dipendono dalle stesse tre piattaforme IA, un cambio di prezzo, un’interruzione del servizio o un cambio di policy li colpisce tutti simultaneamente. Il rischio di concentrazione a livello di singola azienda è dipendenza. Il rischio di concentrazione a livello UE è una vulnerabilità sistemica.

Per una singola PMI, la risposta non è costruire il proprio cloud. È assicurarsi che la propria architettura IA sia portabile — che tu possa spostare i tuoi modelli, i tuoi dati e i tuoi flussi di lavoro verso un diverso fornitore (o verso la tua infrastruttura) senza ricostruire da zero. La portabilità è l’espressione architetturale della sovranità.

I modelli open-weight sono portabili per definizione. Un modello che hai fine-tuned su Mistral può girare su qualsiasi infrastruttura che supporti il formato del modello. Un modello che hai fine-tuned su una piattaforma gestita potrebbe o non potrebbe essere esportabile — controlla il contratto.

Il tuo database vettoriale è portabile se usa formati aperti e protocolli aperti. La tua pipeline RAG è portabile se è costruita su componenti open-source. I tuoi dati di feedback sono portabili se sono memorizzati in un formato che controlli.

La portabilità non è una funzionalità. È una decisione architetturale presa prima della prima riga di codice.

Cosa significa operativamente

Per una PMI UE con 50-500 dipendenti, la sovranità dei dati nel deployment IA significa:

Usa le API gestite per la sperimentazione, non per la produzione. Testa i modelli, valuta le capacità, prototipa i casi d’uso su piattaforme gestite. Quando il caso d’uso è validato, costruisci il deployment di produzione su infrastruttura che controlli. Il pilota gira sulla loro piattaforma. Il prodotto gira sulla tua.

Fai il fine-tuning sulla tua infrastruttura. Se il tuo strumento IA ha bisogno di conoscenza specifica del dominio, fai il fine-tuning di un modello open-weight sui tuoi dati, sulla tua infrastruttura. Il modello risultante è tuo — i pesi, gli adattamenti, l’intelligence competitiva incorporata in quegli adattamenti.

Possiedi il ciclo di feedback. Ogni interazione degli utenti con il tuo strumento IA genera dati. Correzioni, preferenze, pattern di utilizzo, modalità di fallimento — questi dati sono più preziosi dei dati di addestramento originali perché rappresentano ciò di cui i tuoi utenti specifici hanno realmente bisogno. Memorizzali nei tuoi sistemi. Usali per migliorare il tuo modello. Non inviarli a una piattaforma gestita dove diventano parte del loro segnale di addestramento generale.

Costruisci per la portabilità. Usa formati aperti, protocolli aperti, modelli aperti. Quando puoi cambiare fornitore in una settimana anziché un trimestre, hai la sovranità. Quando il cambio richiede sei mesi di re-ingegnerizzazione, sei un inquilino, non un proprietario.

Leggi il contratto, non il marketing. I termini di servizio delle piattaforme IA non sono documenti di marketing — sono strumenti giuridici che definiscono cosa succede ai tuoi dati. Leggili. Specificamente: il fornitore usa i tuoi dati per l’addestramento del modello? A quali condizioni? Puoi esportare il tuo modello fine-tuned? I tuoi embedding vettoriali? I tuoi log di utilizzo? Se la risposta è no, sai cosa stai comprando.

La decisione build-vs-buy, riformulata

La decisione convenzionale build-vs-buy nell’IA si concentra sulla capacità: puoi costruire un modello buono quanto il servizio gestito? La risposta, per la maggior parte delle PMI, è no. I modelli gestiti sono addestrati su più dati, con più calcolo, da più ricercatori di quanto qualsiasi PMI possa replicare.

Ma la decisione non riguarda la capacità. Riguarda il controllo.

Compra la capacità. Possiedi i dati. È il compromesso pratico che la maggior parte delle discussioni sulla sovranità manca.

Usa l’API del modello gestito per l’inferenza — per generare output, rispondere a domande, classificare input. La capacità del modello è in affitto. I dati che fluiscono attraverso il modello non lo sono.

Possiedi la pipeline dati: gli input, gli output, il feedback, le correzioni, i pattern di utilizzo. Memorizzali nei tuoi sistemi. Analizzali con i tuoi strumenti. Usali per valutare, migliorare e alla fine sostituire il modello gestito con un’alternativa open-weight fine-tuned.

Possiedi il database vettoriale: gli embedding della tua base di conoscenza, dei tuoi documenti, delle tue procedure operative. Sono la tua conoscenza organizzativa in forma compressa. Non devono vivere su una piattaforma condivisa.

Possiedi il framework di valutazione: i benchmark, i casi di test, i criteri di qualità che determinano se gli output del modello sono abbastanza buoni per il tuo caso d’uso specifico. I benchmark generici della piattaforma gestita non catturano i requisiti del tuo dominio.

La sequenza è: affitta la capacità, possiedi i dati, costruisci l’indipendenza. L’indipendenza non avviene il primo giorno. Avviene nel corso dei mesi, man mano che i tuoi dati posseduti si accumulano, il tuo framework di valutazione matura e la tua comprensione di ciò di cui hai bisogno da un modello IA diventa specifica abbastanza da giustificare un deployment dedicato.

L’API gestita è un punto di partenza. Non deve essere l’architettura.

Il principio

I tuoi dati non sono materia prima neutra che acquisisce valore solo quando elaborata da una piattaforma. I tuoi dati sono il tuo vantaggio competitivo, la tua intelligence operativa, le tue relazioni con i clienti espresse come informazione. Sono il prodotto di anni di lavoro, migliaia di interazioni, milioni di decisioni.

Quando li invii a una piattaforma che non controlli, stai scambiando sovranità per comodità. La comodità è reale. Il costo è nascosto — finché la piattaforma non cambia i suoi prezzi, i suoi termini o la sua API, e scopri che la base della tua capacità IA appartiene a qualcun altro.

Possiedi i tuoi dati. Possiedi i tuoi modelli. Possiedi i tuoi canali. Possiedi l’infrastruttura che trasforma la tua conoscenza in vantaggio competitivo.

L’alternativa è costruire la tua casa su un terreno in affitto e sperare che il proprietario non alzi mai l’affitto.

Il proprietario alza sempre l’affitto.

Possiedi i tuoi dati. Possiedi i tuoi modelli. Possiedi i tuoi canali. L’architettura dell’indipendenza richiede più lavoro iniziale. Richiede meno lavoro in totale. E il lavoro produce qualcosa che la comodità in affitto non produce mai: un asset che si accumula.

I tuoi dati, i tuoi modelli, i tuoi cicli di feedback — questi si accumulano. Ogni mese di operatività rende il mese successivo più prezioso. Ogni interazione utente migliora l’interazione successiva. Ogni correzione rende il sistema più accurato.

Su una piattaforma in affitto, l’accumulo beneficia la piattaforma. Sulla tua infrastruttura, l’accumulo beneficia te.

Possiedi l’accumulo. L’affitto non vale mai la pena.

Scritto da

Bertrand

Tecnologo Creativo

Un imprenditore seriale con un dottorato in AI e venticinque anni a costruire sistemi in tutta Europa. Crea codice come fa surf: leggendo i pattern, trovando il flusso, rendendo il difficile facile.

← Tutte le note