A Mountain View la conferenza per gli sviluppator Google I/O 2025 ha messo parecchia carne al fuoco. Tanta Intelligenza artificiale, tecnologia ormai onnipresente per quanto riguarda l’offerta delle Big Tech. La multinazionale guidata da Sundar Pichai ha risposto anni fa alla crescita impetuosa di OpenAI (finanziata da Microsoft) mettendo sul mercato Gemini per cercare di non farsi strappare lo scettro di motore di ricerca numero uno in Occidente. Passiamo ora in rassegna le novità svelate in California, alcune delle quali già disponibili per gli utenti.
Che cos’è Google Beam
Anni fa si chiamava Project Starline, oggi è Google Beam. Si tratta di una nuova piattaforma di comunicazione video potenziata dall’Intelligenza artificiale. Sviluppata in collaborazione con HP, sarà disponibile entro la fine del 2025: utilizzando un sistema di sei videocamere, gli stream video vengono uniti e resi su un display 3D con tecnologia lightfield. Il risultato a cui punta Google è un sistema che garantisca un’esperienza immersiva a 60 frame al secondo.
Cos’è il Project Astra
Per rendere gli assistenti virtuali più efficaci nelle risposte e nelle risoluzioni dei problemi Google ha presentato Project Astra, un assistente AI capace di comprendere il mondo circostante. Gemini Live ora incorpora le funzionalità di condivisione dello schermo e della fotocamera di Project Astra. Come si vede nel video qui sotto è possibile utilizzarlo per orientarsi in un ambiente nuovo, per fare ad esempio piccoli lavoretti con un minimo di guida. Questa funzionalità è disponibile per tutti gli utenti Android e iOS.
Cos’è il Project Mariner
A questo punto di parla di agenti di AI. Project Mariner è un prototipo realizzato da Google per utilizzare il computer e farlo interagire con il web al posto dell’utente. Come ha spiegato la Big Tech le capacità di utilizzo del computer di Project Mariner verranno rilasciate agli sviluppatori tramite l’API Gemini. Questa tecnologia sarà distribuita a partire dall’estate 2025.
Cos’è Flow
Il software per la creazione di video da input testuali Veo 3 ora include la generazione di audio nativa e Google sta introducendo Imagen 4, il suo modello di generazione di immagini più recente e potente. Entrambi sono disponibili nell’app Gemini. Per l’ambito cinematografico Flow è il sistema su cui Google sta puntando e che è stato presentato alla conferenza di Mountain View.
Le altre novità di Google lato AI
Deep Research diventa più personale per caricare i file e, a breve, connettersi a Google Drive e Gmail, migliorando la capacità di generare report di ricerca personalizzati. Google sta integrando anche il sistema con Canvas per consentire la creazione di infografiche dinamiche, quiz e podcast in numerose lingue.
Il nuovo Flash 2.5 è migliorato in benchmark chiave relativi a ragionamento, multimodalità, codice e contesti estesi. Google Stiamo sta migliorando 2.5 Pro con una nuova modalità avanzata di ragionamento, Deep Think, e include tecniche di ragionamento parallelo. Nel corso della conferenza è stata annunciato un abbonamento da 249,99 dollari al mese – AI Ultra – per accedere ai modelli di Intelligenza artificiale più avanzati.