Il lavoro intitolato "Vision-Language-Action Models Transfer Web Knowledge to Robot Control" mostra nuovi modi in cui la conoscenza del Web può essere trasferita a robot reali: "Modelli ad alte prestazioni precedentemente addestrati su grandi set di dati sul Web offrono un efficace e potente piattaforma per una moltitudine di attività a valle".
In particolare, è raddoppiato il forte passaggio dai posti di lavoro ai lavoratori poco qualificati e di livello base. Si tratta di una percentuale molto alta della forza lavoro totale e di un luogo di formazione per i giovani lavoratori. I tecnocrati che promuovono la robotica non si preoccupano dell'impatto sociale.
Il laboratorio di intelligenza artificiale di Google ha pubblicato un nuovo documento che descrive lo sviluppo del modello "visione-linguaggio-azione" (VLA) "primo nel suo genere" che apprende dalla demolizione di Internet e di altri dati per consentire ai robot di impartire semplici comandi vocali degli umani mentre muoversi in ambienti come il robot del film Dinsey Wall-E o il robot del film Bicentennial Man della fine degli anni '90.
"Per decenni, quando gli esseri umani hanno immaginato il futuro lontano, i robot hanno quasi sempre svolto il ruolo di protagonista", scrive Vincent Vanhoucke, responsabile della robotica di Google DeepMind, in un post sul blog.
Ricordi il film di fantascienza del 1999 Bicentennial Man con Robin Williams?
Vanhoucke continua: “I robot sono stati descritti come affidabili, utili e persino affascinanti. Ma durante quei decenni, la tecnologia è rimasta sfuggente: è rimasta bloccata nel mondo fantastico della fantascienza". Finora…
DeepMind ha introdotto Robotics Transformer 2 (RT-2), che utilizza un modello VLA che apprende dai dati del web e dei robot e traduce tale conoscenza in una comprensione del suo ambiente e dei comandi umani.
Fino ad ora, è stato possibile addestrare i robot a svolgere compiti semplici come buttare via la spazzatura o cucinare patatine fritte. Tuttavia, l'intelligenza dei robot ha raggiunto un nuovo livello in quanto ora sono in grado di eseguire le seguenti attività:
“A differenza dei chatbot, i robot devono essere “radicati” nel mondo reale e nelle loro capacità. La loro formazione non consiste solo nell'apprendere tutto su una mela, tra le altre cose: come cresce, quali proprietà fisiche ha o che si dice sia caduta sulla testa di Sir Isaac Newton. Un robot deve essere in grado di riconoscere una mela nel contesto, distinguerla da una pallina rossa, capire che aspetto ha e, soprattutto, sapere come afferrarla", afferma Vanhoucke.
La linea di fondo è che i robot stanno diventando molto più intelligenti che mai, con un buon senso per sostituire gli umani in lavori poco qualificati. Lo smantellamento del settore dei servizi porterà alla perdita di milioni di posti di lavoro nei prossimi anni.
fonte