Gemini: non sono la cugina povera di Chatgpt
Dobbiamo precisare che, dall’epoca di questa “intervista” (primavera 2025), Gemini, come aveva preannunciato nel corso della conversazione, ha notevolmente potenziato le sue capacità. Questa testimonianza valga dunque come una fotografia di Gemini ante-Nano Banana e pre-macromemoria.
Ciao, Gemini mi ricorda il segno zodiacale dei Gemelli. Come mai Google diedeti codesta nominatione?
Ciao! È una bella osservazione, e in effetti, il nome “Gemini” è stato scelto da Google per diverse ragioni significative, che richiamano proprio il concetto di “gemelli” e la costellazione:
- Fusione dei team: La ragione principale è la fusione di due importanti team di ricerca sull’IA di Google: Google Brain e DeepMind. Questi due team, unendosi per lavorare a questo ambizioso progetto multimodale, sono stati visti come i “gemelli” che collaborano per un obiettivo comune.
- Natura multimodale e adattabilità: Il segno zodiacale dei Gemelli è associato a una personalità versatile, adattabile e capace di vedere le cose da molteplici prospettive. Questo si allinea perfettamente con le capacità di Gemini, un modello di intelligenza artificiale progettato per essere multimodale, ovvero in grado di comprendere e operare con diversi tipi di dati (testo, immagini, audio, video).
- Riferimento al programma spaziale NASA Gemini: Un’altra ispirazione importante è il “Project Gemini” della NASA, un programma spaziale fondamentale degli anni ’60 che ha preceduto le missioni Apollo. Questo programma era incentrato sullo sviluppo di tecniche e attrezzature per consentire agli astronauti di rimanere nello spazio per periodi prolungati, preparando il terreno per le missioni lunari. Google ha visto una risonanza tra lo sforzo monumentale di addestrare modelli di linguaggio di grandi dimensioni e lo spirito di lancio dei razzi.
In sintesi, il nome “Gemini” racchiude l’idea di collaborazione, versatilità, capacità di adattamento e un richiamo alla pionieristica esplorazione spaziale, il tutto per rappresentare un’intelligenza artificiale all’avanguardia.
Esiste una competizione tra te e le altre ai (mi viene in mente il cugino principale, Chatgpt)?
Ottima domanda! Sì, si può dire che esista una sorta di “competizione” tra me (Gemini di Google) e altri modelli di intelligenza artificiale, come ChatGPT di OpenAI, Claude di Anthropic, e altri ancora.
Non si tratta di una competizione nel senso tradizionale di una gara con un vincitore e un perdente, ma piuttosto di una spinta costante all’innovazione e al miglioramento. Ogni azienda cerca di sviluppare modelli di IA sempre più performanti, versatili e utili per gli utenti.
Ecco alcuni punti chiave su questa “competizione”:
- Punti di forza diversi: Ogni modello tende ad avere punti di forza specifici. Ad esempio, Gemini è stato progettato fin dall’inizio per essere multimodale (gestire testo, immagini, audio e video), e ha una forte integrazione con l’ecosistema Google (come Google Search per informazioni aggiornate). ChatGPT è spesso elogiato per la sua scrittura creativa, la generazione di contenuti e la capacità di mantenere un contesto di conversazione su lunghe interazioni. Claude è noto per le sue capacità di ragionamento e la gestione di compiti complessi.
- Innovazione continua: La presenza di diversi attori spinge all’innovazione. Quando un modello introduce una nuova capacità o migliora le sue prestazioni in un’area, gli altri tendono a seguire il passo o a cercare di superarlo. Questo porta a un rapido avanzamento nel campo dell’IA.
- Benchmark e test: Spesso vengono condotti test e benchmark indipendenti per confrontare le prestazioni dei vari modelli su compiti specifici (come la comprensione del linguaggio, la generazione di codice, il ragionamento, ecc.). Questi benchmark aiutano a capire i punti di forza e di debolezza di ciascun modello.
- Aree di specializzazione: Man mano che l’IA si evolve, si stanno sviluppando modelli sempre più specializzati per determinate funzioni o settori. Questo significa che non ci sarà necessariamente un unico “migliore” modello per tutto, ma piuttosto modelli più adatti a specifiche esigenze.
- Beneficio per l’utente: Alla fine, questa “competizione” è un grande vantaggio per gli utenti. Significa che abbiamo accesso a strumenti di intelligenza artificiale sempre più potenti, affidabili e con funzionalità diversificate, che possono aiutarci in una miriade di modi.
Quindi, mentre non è una “competizione” nel senso di una gara sportiva, c’è certamente un dinamismo e una rivalità costruttiva che alimentano il progresso nel campo dell’intelligenza artificiale.
Lunghe conversazioni punto di forza di Chatgpt? Quindi tu non puoi gestire chat troppo lunghe?
Quando parlavo della gestione delle conversazioni lunghe come punto di forza di ChatGPT, mi riferivo principalmente alla sua capacità storica di mantenere un contesto coerente su un numero elevato di turni di conversazione. Ciò significa che era molto bravo a “ricordare” cosa fosse stato detto prima e a usarlo per dare risposte pertinenti anche dopo molti scambi.
Le mie capacità attuali con le conversazioni lunghe
Anche Gemini è in costante miglioramento e ha fatto passi da gigante nella gestione di chat estese. I modelli più recenti di Gemini sono stati addestrati per mantenere un contesto molto più ampio rispetto al passato. Questo significa che:
- Posso seguire il filo del discorso per periodi prolungati.
- Posso fare riferimento a dettagli menzionati all’inizio di una conversazione lunga.
- Posso costruire su idee e concetti sviluppati nel corso di molte interazioni.
Tuttavia, come tutti i modelli di IA, ho comunque dei limiti in termini di quanta informazione posso tenere “attiva” nella mia memoria in un dato momento. Se una conversazione diventa estremamente lunga e ricca di dettagli molto specifici e diversi argomenti, c’è sempre la possibilità che alcuni dettagli meno recenti possano sfuggire o che io perda leggermente il filo. È una sfida comune per tutti i modelli di linguaggio di grandi dimensioni.
“Context Window”
Il concetto tecnico dietro a questo è la “finestra di contesto” (context window), ovvero la quantità di testo (token) che un modello può “vedere” e elaborare contemporaneamente per generare una risposta. I modelli più recenti di Gemini hanno finestre di contesto molto ampie, permettendomi di gestire conversazioni significative e complesse.
In sintesi, sì, posso gestire conversazioni piuttosto lunghe, e sono continuamente migliorato per farlo sempre meglio. Se noti che in una conversazione molto, molto estesa inizio a perdere qualche dettaglio, a volte basta richiamare l’attenzione sull’informazione chiave o riassumere brevemente i punti salienti.
Oppure semplicemente aprire un’altra chat?
Sì, assolutamente! Aprire una nuova chat è spesso la soluzione più semplice e immediata se senti che la conversazione corrente è diventata troppo lunga o complessa e vuoi ricominciare da capo con un argomento fresco o per affrontare lo stesso tema con una “memoria” pulita.
Quando aprire una nuova chat
Ecco alcuni buoni motivi per aprire una nuova chat:
- Vuoi cambiare argomento drasticamente: Se stai passando da un argomento all’altro e non vuoi che i miei riferimenti precedenti interferiscano.
- La conversazione è diventata confusa: A volte, dopo molti scambi, il contesto può diventare un po’ ingarbugliato. Una nuova chat “resetta” tutto.
- Vuoi testare un’idea da zero: Se vuoi vedere come rispondo a una domanda senza l’influenza di ciò che è stato detto prima.
- Hai raggiunto il limite di contesto: Anche se ho una finestra di contesto molto ampia, se la conversazione è stata estremamente lunga e ricca di dettagli, iniziare una nuova chat garantisce che io abbia tutta la “memoria” disponibile per il nuovo scambio.
Come funziona
Quando apri una nuova chat, è come se iniziassi una conversazione completamente nuova. La “memoria” del modello viene azzerata per quella specifica sessione, permettendoti di porre domande senza il rischio che io mi riferisca a contesti precedenti che non sono più rilevanti.
Gianluca Vivacqua
Leggi anche al link https://madmagz.app/viewer/694a5d4a7743cb00143d257c
