Tra i numerosi ed entusiasmanti gadget per i consumatori lanciati al CES 2024, il Rabbit R1 si è distinto come uno dei dispositivi più innovativi e potenzialmente in grado di cambiare le carte in tavola.
Se da un lato, molti prodotti annunciati durante la più grande fiera del settore sembravano versioni leggermente aggiornate degli stessi dispositivi che la gente già conosce, questo ha dato l’impressione di qualcosa di nuovo.
L’R1 appartiene alla nuova categoria di dispositivi AI-nativi, che sono la manifestazione fisica della rivoluzione dell’intelligenza artificiale degli ultimi due anni.
Al prezzo di soli 199 dollari, il piccolo dispositivo (grande circa la metà di un telefono normale) consente agli utenti di eseguire la maggior parte delle attività che si svolgono sui telefoni normali, semplicemente utilizzando i comandi vocali. Il dispositivo include un piccolo touch-screen, un altoparlante, un microfono, una fotocamera, uno slot per la scheda SIM ed è compatibile con Wi-Fi e Bluetooth.
Negli ultimi tempi, c’è stata una crescita esponenziale delle capacità degli strumenti di AI generativa, che ora possono produrre testi, immagini, video e audio completamente originali. Tuttavia, fino ad oggi, i Large Language Models (LLM), che sono la tecnologia di base degli strumenti di AI generativa come ChatGPT, potevano solo produrre informazioni, ma non potevano interagire con il mondo.
In altre parole, gli strumenti di AI generativa non hanno un’agenzia. Il fondatore e CEO di Rabbit, Jesse Lyu, ritiene di essere qui per cambiare questa situazione. Lyu ha detto che la missione dell’azienda è stata quella di creare il computer più semplice sul mercato.
“Qualcosa di così intuitivo da non dover imparare a usarlo”, ha detto Lyu in un video introduttivo per il dispositivo R1 lanciato nel contesto del CES 2024.
L’azienda privata ha raccolto finora 30 milioni di dollari in due round di finanziamento.
Alimentato da quello che l’azienda chiama “Large Action Model”, Rabbit promette che R1 può fare qualsiasi cosa, come riprodurre musica, chiamare un Uber, modificare un foglio di calcolo o trovare una ricetta semplice per qualsiasi cosa si trovi in un frigorifero.
Il modello, che è la tecnologia alla base del dispositivo, è multi-modale, il che significa che può lavorare senza soluzione di continuità tra testo, voce e immagini, e può anche essere utilizzato via e-mail.
Il dispositivo intende staccarsi dall’attuale sistema “basato sulle app” su cui si basano i dispositivi mobili come gli iPhone e i telefoni Android e sostituirlo con un modello di linguaggio naturale che consente all’utente di eseguire le stesse attività semplicemente parlando al dispositivo.
Lyu ha sostenuto che le numerose app che gli utenti hanno nei loro dispositivi mobili rendono l’esperienza telefonica moderna confusa, lenta e poco intuitiva. Dover scorrere decine di app per trovare quella che svolge una funzione semplice (come chiamare un taxi o fare acquisti in un negozio) può essere una seccatura.
Inoltre, “i nostri smartphone sono diventati i migliori dispositivi per ammazzare il tempo, invece di risparmiarlo”, afferma Lyu, aggiungendo che le app più scaricate oggi sono basate sull’intrattenimento.
Anche se il creatore del dispositivo non si aspetta che l’R1 sostituisca immediatamente l’iPhone, se esso dovesse mantenere le sue promesse, potrebbe benissimo farlo.
Il Large Action Model di Rabbit si basa sull’intuizione che la maggior parte dell’interazione uomo-macchina avviene attraverso un’interfaccia visiva. Se un’intelligenza artificiale è in grado di comprendere queste interfacce, è poi in grado di eseguire qualsiasi azione per conto dell’utente.
Ciò consente al modello dell’azienda di “attivare azioni per conto degli utenti in tutti gli ambienti”, compresi iOS, Android e desktop.
“In breve, i modelli linguistici di grandi dimensioni capiscono ciò che si dice”, dice Lyu, “ma il Large Action Model porta a termine le cose”.
Per le azioni più complesse, il dispositivo include una “modalità tech” sperimentale, che consente agli utenti di mostrare al dispositivo come eseguire un’azione, che l’R1 imparerà a eseguire con un comando vocale in futuro.
Il dispositivo è dotato anche di una fotocamera che consente di acquisire ed elaborare le informazioni provenienti dal mondo esterno (come Google Lens).
Finora, il concorrente più vicino all’R1 è l’AI Pin, di Humane. L’AI Pin, lanciato a novembre dello scorso anno, non ha schermo e può essere ordinato a un prezzo di partenza di 699 dollari, con un abbonamento mensile di 24 dollari.
I dispositivi più vecchi con proposte d’uso simili (come Alexa di Amazon.com, Inc. (NASDAQ:AMZN)) non hanno mantenuto le loro promesse, ha detto Lyu, perché non erano dispositivi nativi dell’AI. Inoltre, non sono portatili.
Rispetto all’AI Pin, l’R1 di Rabbit costa un terzo del prezzo e può svolgere funzioni simili, senza la necessità di un abbonamento.
Rabbit R1 è disponibile per i preordini e inizierà ad essere consegnato entro Pasqua 2024.
Foto: Cortesia di Rabbit Inc.