Mythos 5, il modello segreto di Anthropic: Cisco compie in 8 settimane il lavoro di 8 anni
L'accesso riservato al potente modello per la cybersecurity accelera le difese, ma le restrizioni sulla versione pubblica Claude Fable 5 scatenano polemiche e una rara scusa pubblica.

La notizia che Cisco, nell’ambito del riservatissimo «Progetto Glasswing», abbia avuto accesso al modello Mythos 5 di Anthropic e abbia potuto scansionare 1,8 miliardi di linee di codice realizzando in otto settimane ciò che prima richiedeva otto anni, segna un punto di svolta nella cybersecurity aziendale [A1]. È la conferma che l’intelligenza artificiale più avanzata sta già operando in silos strategici, lontano dagli sguardi pubblici, con una potenza di calcolo e una capacità predittiva tali da ridisegnare i perimetri della sicurezza informatica globale. Anthropic ha scelto una via a doppio binario: da un lato, concede a partner selezionati come Cisco l’accesso al modello «grezzo» Mythos 5, capace di individuare vulnerabilità con una profondità senza precedenti; dall’altro, rilascia al pubblico Claude Fable 5, versione depotenziata e dotata di filtri etici per prevenire abusi in ambiti sensibili come la biologia e la chimica.
Proprio questi filtri hanno innescato una controversia che ha costretto Anthropic a una retromarcia e a pubbliche scuse. Ricercatori e sviluppatori hanno scoperto che, a loro insaputa, le richieste relative allo sviluppo di modelli di frontiera venivano deviate silenziosamente verso un modello inferiore, Opus 4.8, producendo risposte degradate [A3]. La società ha ammesso di «non aver trovato il giusto equilibrio» e ha promesso che d’ora in poi ogni limitazione sarà visibile agli utenti [A4]. Dietro la misura, secondo analisti statunitensi, c’è la volontà di impedire che «avversari stranieri» utilizzino i modelli più potenti di Anthropic per colmare il divario tecnologico con gli Stati Uniti nel campo dell’IA e dei semiconduttori [A4].
Parallelamente, Anthropic sta tessendo una rete di alleanze industriali su scala globale. L’accordo pluriennale con DXC Technology, annunciato in Virginia, trasformerà quest’ultima in un Global Premier partner del Claude Partner Network, con decine di migliaia di ingegneri certificati che integreranno i modelli Claude nei sistemi gestionali di banche, compagnie aeree e pubbliche amministrazioni [A2][A6]. L’obiettivo è innestare l’IA conversazionale e predittiva direttamente nelle infrastrutture critiche, un passo che solleva interrogativi sulla dipendenza tecnologica da un unico fornitore, specie in Europa dove il dibattito sulla sovranità digitale è più acceso che mai.
La reazione delle autorità regolatorie non si è fatta attendere. Il governo giapponese ha aggiornato le proprie linee guida di cybersecurity proprio in risposta alle capacità di Mythos, invitando le organizzazioni pubbliche a preparare piani per sospendere i sistemi e applicare patch con rapidità in caso di vulnerabilità rilevate [A5]. Il ministro per la trasformazione digitale Hisashi Matsumoto ha esplicitamente chiesto di «implementare contromisure tenendo conto della possibilità che i sistemi possano essere fermati», un riconoscimento implicito che la potenza offensiva di questi modelli supera le attuali difese [A5].
Per l’Italia e l’Europa, lo scenario è duplice. Da un lato, la produttività mostrata da Cisco suggerisce che l’adozione di modelli avanzati potrebbe accelerare la modernizzazione delle infrastrutture pubbliche, un’opportunità cruciale per il PNRR e la transizione digitale. Dall’altro, la vicenda dei filtri occulti su Claude Fable 5 solleva un allarme sulla trasparenza degli strumenti di IA che entrano nelle amministrazioni. Se un modello può degradare le risposte senza avvisare l’utente, la fiducia necessaria per affidargli processi decisionali pubblici vacilla. Bruxelles, che sta ultimando l’AI Act, potrebbe trovare in questo episodio un argomento concreto per rafforzare gli obblighi di disclosure e i requisiti di auditabilità, trasformando un incidente diplomatico-industriale in un precedente normativo.
Come la stessa storia è raccontata altrove.
La stampa europea continentale si concentra sulle partnership strategiche per l'accesso a Mythos, il modello AI per la cybersicurezza di Anthropic. Viene enfatizzato il potenziale di rivoluzionare la sicurezza informatica, con accordi come quello tra Cisco e DXC Technology. Tuttavia, si nota anche la cautela istituzionale, come il Giappone che aggiorna le linee guida per prepararsi agli attacchi basati su AI.
Indian and South Asian press highlights Anthropic's apology after backlash over Claude Fable 5 safeguard policies. The narrative focuses on the company's admission of a flawed approach and its promise to make future restrictions transparent. There is skepticism about whether these measures will be sufficient.
Atlantic press covers the 'freakout' over Anthropic's secret downgrading of Claude Fable 5 for certain queries. The narrative emphasizes the developer backlash and Anthropic's subsequent apology and policy change. There is a tone of skepticism about the company's transparency and a sense that the incident reveals broader tensions in AI safety.
Questa notizia è apparsa su
4 testate · 3 lingue · finestra 24 ore