DeepMind RoboCat migliora grazie ai dati autogenerati

Il nuovo agente robotico, chiamato RoboCat, impara a utilizzare diversi bracci robotici, risolve compiti da appena 100 dimostrazioni e migliora grazie ai dati autogenerati.

Sviluppato dai ricercatori di Al DeepMind di Google, RoboCat é dotato di intelligenza artificiale che si auto-migliora per la robotica, il che significa che impara a eseguire una varietà di compiti su diversi bracci e quindi genera automaticamente nuovi dati di addestramento per migliorare la sua tecnica.

Fino ad ora, i robot hanno generalmente eseguito compiti specifici e preprogrammati. Con l'introduzione di modelli linguistici di grandi dimensioni, le competenze dei robot iniziarono ad ampliarsi, sebbene la formazione su enormi volumi di dati richiedesse enormi quantità di tempo.

Secondo ricercatori, RoboCat impara molto più velocemente rispetto ad altri modelli all'avanguardia. Può eseguire una nuova attività con un minimo di 100 dimostrazioni perché attinge da un set di dati ampio e diversificato. Questa capacità contribuirà ad accelerare la ricerca sulla robotica, in quanto riduce la necessità di formazione sotto la supervisione umana, ed è un passo importante verso la creazione di un robot generico.

I ricercatori hanno utilizzato quattro diversi tipi di robot e molti bracci robotici per raccogliere dati basati sulla visione che rappresentano i compiti che RoboCat sarebbe stato addestrato a svolgere. Con la formazione diversificata di RoboCat, ha imparato a utilizzare diversi bracci robotici in poche ore. Sebbene fosse stato addestrato su braccia con pinze a due punte, era in grado di adattarsi a un braccio più complesso con una pinza a tre dita e il doppio degli input controllabili.

Dopo aver osservato 1000 dimostrazioni controllate dall'uomo, raccolte in poche ore, RoboCat è stato in grado di dirigere questo nuovo braccio in modo abbastanza abile da raccogliere gli ingranaggi con successo l'86% delle volte. Con lo stesso livello di dimostrazioni, potrebbe adattarsi a risolvere compiti che combinano precisione e comprensione, come rimuovere il frutto corretto da una ciotola e risolvere un puzzle di abbinamento di forme, necessari per un controllo più complesso.

Lo sviluppo è visto come un passo importante verso l'accelerazione della ricerca sulla robotica, "poiché riduce la necessità di formazione sotto la supervisione umana ed è un passo importante verso la creazione di agenti robotici più utili e generici".


Followme

498 blog messaggi

Commenti