La startup cinese diventata più popolare di ChatGPT, DeepSeek, ha annunciato che il suo modello più grande, Janus-Pro-7B AI, ha superato Dall-E 3 di OpenAI e Stable Diffusion di Stability AI nel produrre immagini tramite messaggi di testo. Non supera, però, i modelli specializzati, creati per attività specifiche come, ad esempio, le piattaforme dedicate a radiologia o astronomia. Scopriamo, più nel dettaglio, cos’è e come funziona Janus-Pro.
Cosa è e come funziona Janus-Pro?
Il nuovo modello è un aggiornamento di Janus, lanciato alla fine dello scorso anno e disponibile in varie dimensioni che migliora i processi di formazione e la qualità dei dati, ottenendo una miglior stabilità delle immagini e una maggior ricchezza di dettagli. Secondo il rapporto tecnico, Janus-Pro ha ottenuto risultati più accattivanti e stabili aggiungendo 72 milioni di immagini sintetiche di alta qualità e bilanciandole con i dati del mondo reale. Inoltre, la versione più grande del modello, con 7 miliardi di parametri, migliora la velocità di addestramento e l’accuratezza nella generazione da testo a immagine e nella comprensione dei compiti. All’utente resterà soltanto da descrivere una foto e DeepSeek Janus-Pro trasformerà quella descrizione in realtà.