Nel mondo della robotica, anche le attività apparentemente semplici si rivelano complesse. Gli esseri umani danno per scontate le infinite variabili che rendono tali compiti così naturali per noi, ma i robot non godono di tali lussi. Tuttavia, negli ultimi anni, l’apprendimento robotico ha fatto passi da gigante, aprendo la strada alla creazione di sistemi più adattabili e versatili.
Lo scorso anno, il team di robotica di Google DeepMind ha sorpreso il mondo con il “Robotics Transformer – RT-1”, un sistema in grado di addestrare i suoi robot Everyday a eseguire compiti come prendere e posizionare oggetti o aprire cassetti. Il segreto dietro questa impresa rivoluzionaria risiedeva in un database di 130.000 dimostrazioni, che ha permesso al sistema di ottenere un notevole tasso di successo del 97% in oltre 700 attività.
Oggi, Google DeepMind rivela RT-2, portando l’apprendimento robotico a un nuovo livello di adattabilità e intelligenza. In un post sul blog, Vincent Vanhoucke, Distinguished Scientist e responsabile della Robotica presso DeepMind, spiega che il sistema consente ai robot di trasferire concetti appresi su set di dati relativamente piccoli a scenari completamente diversi.
La capacità di generalizzare e comprendere semantica e visivamente al di là dei dati robotici originali è ciò che rende RT-2 un vero e proprio passo avanti. Questo permette ai robot di interpretare nuovi comandi e rispondere a richieste dell’utente eseguendo ragionamenti di base, come identificare le categorie degli oggetti o descrivere le azioni di alto livello. Inoltre, il sistema dimostra una notevole capacità di utilizzare le informazioni contestuali esistenti per determinare il miglior approccio ad una specifica attività.
Un esempio concreto fornito da Vanhoucke riguarda la richiesta di gettare via la spazzatura. Nei modelli tradizionali, l’utente dovrebbe insegnare al robot a identificare cosa costituisce la spazzatura e quindi addestrarlo a raccoglierla e gettarla via. Questo processo dettagliato non è sempre scalabile quando si tratta di far eseguire al robot una vasta gamma di compiti diversi. Tuttavia, grazie all’ampio corpus di dati web su cui si basa RT-2, il sistema ha già una conoscenza pregressa di ciò che costituisce la spazzatura, rendendolo in grado di identificarla senza necessità di un addestramento esplicito. Ancora più sorprendente, il sistema riesce a comprendere come gettare la spazzatura, anche se non è mai stato addestrato specificamente a svolgere quest’azione.
Grazie a RT-2, l’efficacia nell’esecuzione di nuovi compiti è aumentata significativamente rispetto a RT-1, passando dal 32% al 62%. Questo progresso è un segno tangibile della crescente intelligenza e capacità di apprendimento dei robot.
Il futuro della robotica intelligente appare sempre più promettente, poiché i sistemi come RT-2 aprono la strada alla creazione di robot più versatili e adattabili. Con la capacità di apprendere da piccoli dataset e di trasferire conoscenze a nuovi scenari, i robot del futuro potranno affrontare una vasta gamma di compiti in modo più efficiente ed efficace.
Questo nuovo passo avanti di Google DeepMind nel campo della robotica ci mostra che stiamo avvicinandoci a una realtà in cui i robot saranno in grado di affrontare sfide complesse e svolgere attività varie senza la necessità di un addestramento specifico per ogni singola operazione. Con RT-2, l’intelligenza artificiale si sta dimostrando sempre più all’altezza di sostenere il progresso e l’evoluzione della robotica moderna.