Ecco Janus Pro, il generatore di immagini di DeepSeek: strategia o coincidenza? L’IA cinese sfida l’Occidente mentre l’Europa resta a guardare

Effettua la tua ricerca

More results...

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
Filter by Categories
#finsubito


Le immagini mostrano i risultati ottenuti con Janus (a sinistra) e Janus Pro-7B (a destra) per gli stessi prompt testuali. Janus Pro-7B offre output più stabili, dettagli più ricchi e una qualità visiva migliorata. Inoltre, è in grado di generare testo in modo più chiaro e leggibile, come evidenziato nella lavagna con la scritta “Hello”

Dopo aver stupito il mondo con R1, DeepSeek ha mostrato Janus Pro-7B, un modello di IA multimodale e generatore di immagini con un’architettura autoregressiva innovativa che separa i percorsi di codifica visiva per ottimizzare sia la comprensione che la generazione. Questa flessibilità gli permette di eguagliare o superare i modelli specializzati, aprendo nuove prospettive per l’IA. Intanto, gli hyperscaler americani investono miliardi in infrastrutture. Ma se l’efficienza può sostituire la pura potenza, ha ancora senso questa corsa agli investimenti?

Janus Pro-7B: l’IA multimodale di nuova generazione

DeepSeek ha svelato Janus Pro-7B, un modello di intelligenza artificiale multimodale basato su un’architettura autoregressiva innovativa. Il sistema unifica la comprensione e la generazione multimodale separando i percorsi di codifica visiva, ma mantenendo un’unica architettura transformer per l’elaborazione. Questo approccio risolve i conflitti tra le due funzioni, migliorando la flessibilità del modello e permettendogli di competere con soluzioni specializzate.

La capacità di Janus Pro-7B di combinare l’adattabilità dei modelli unificati con la precisione di quelli specializzati lo rende un candidato ideale per la prossima generazione di IA multimodali. Supera i limiti dei precedenti modelli unificati e si avvicina, se non supera, le prestazioni dei modelli task-specific. Questa combinazione di semplicità, flessibilità ed efficacia segna un’evoluzione significativa nel settore dell’IA.

Prestazioni di Janus Pro-7B nei benchmark multimodali
A sinistra, il grafico mostra le prestazioni medie dei modelli multimodali rispetto al numero di parametri, evidenziando il vantaggio della famiglia Janus-Pro rispetto ad altri modelli. A destra, la valutazione nei benchmark GenEval e DPG-Bench per la generazione di immagini da istruzioni dimostra che Janus Pro-7B supera Dall-e 3 e altri competitor, confermando la sua efficienza nei task multimodali.

Oltre a Janus Pro-7B, DeepSeek ha recentemente rilasciato R1, un modello avanzato basato su V3, il suo modello linguistico di grandi dimensioni. R1 introduce capacità di ragionamento avanzate, migliorando l’inferenza logica e la risoluzione dei problemi. La sua capacità di articolare il ragionamento prima di fornire risposte gli permette di affrontare compiti complessi come equazioni matematiche e processi decisionali, ampliando ulteriormente il potenziale dell’IA.

Gli hyperscaler USA continuano a investire, ma con quale ritorno?

Mentre DeepSeek dimostra che l’IA può essere più efficiente e versatile con un’infrastruttura meno onerosa, gli hyperscaler americani proseguono nella loro corsa agli investimenti. Secondo Ubs, nel 2023 gli investimenti capitalizzati sono stati di 142,6 miliardi di dollari, saliti a 248,4 miliardi nel 2024 e previsti a 328,5 miliardi nel 2025. Entro il 2027, la cifra dovrebbe raggiungere i 392,9 miliardi. Tuttavia, se la tecnologia di DeepSeek dimostra che si può fare di più con meno, questa strategia ha ancora senso?

L’intensità di capitale è il rapporto tra investimenti in beni strumentali (Capex) e ricavi di un’azienda o settore. Un valore alto indica una forte dipendenza dagli investimenti per sostenere la crescita e l’operatività, come nel caso degli hyperscaler che spendono miliardi in infrastrutture cloud e data center. Bene, il rapporto tra investimenti e ricavi nel settore cloud e data center continua a crescere. Se nel 2023 l’intensità di capitale era del 27,7%, nel 2024 è salita al 40,4% e nel 2025 raggiungerà il 45,1%. Tuttavia, le previsioni per il 2026-2028 mostrano un calo progressivo fino al 35,7%, segno che il settore potrebbe trovarsi vicino a un punto di svolta. L’innovazione di DeepSeek potrebbe accelerare questo cambiamento, costringendo le big tech a ripensare le proprie strategie.

L’efficienza cambierà il futuro dell’IA?

DeepSeek sta dimostrando che l’IA non deve necessariamente basarsi su infrastrutture sempre più costose per raggiungere prestazioni elevate. Se queste innovazioni verranno adottate su larga scala, i colossi occidentali potrebbero dover rivedere il loro approccio. L’IA del futuro sarà ancora dominata dalla pura potenza di calcolo, o prevarrà un nuovo paradigma basato sull’efficienza e sull’ottimizzazione?

Philip Smith, capo tecnico di Hugging Face, contesta la narrazione che in questi giorni c’è stata su DeepSeek R1. Il training non sarebbe costato solo 6 milioni di dollari, ma questa cifra si riferirebbe solo alle ore di calcolo Gpu, senza considerare costi aggiuntivi come la generazione dei dati. Inoltre, DeepSeek avrebbe usato 50.000 Gpu, smentendo l’idea che avesse risorse limitate. Il progetto non è un esperimento secondario, ma un’iniziativa finanziata dall’hedge fund High Flyer, e Liang Wenfeng è tutt’altro che un semplice nerd improvvisato.

È inoltre curioso che questo terremoto mediatico sia esploso proprio il giorno dopo l’annuncio di StarGate da parte di Trump (quando Deepseek era già al lavoro da  più di due anni). La Cina, dopo i ban subiti, sembra intenzionata a riaffermare il proprio ruolo nell’intelligenza artificiale. Resta da vedere se l’Europa, oltre a regolamentare e basta, sarà anche lei in grado di mettersi in gioco.



Source link

***** l’articolo pubblicato è ritenuto affidabile e di qualità*****

Visita il sito e gli articoli pubblicati cliccando sul seguente link

Source link