A Google DeepMind anunciou um avanço notável no campo da Inteligência Artificial (IA) e da robótica com o lançamento dos modelos Gemini Robotics 1.5 e Gemini Robotics-ER 1.5, sistemas que prometem levar os robôs a um novo nível de autonomia, compreensão e interaCção com o mundo físico. Os novos modelos são uma evolução directa do Gemini Robotics, lançado no início deste ano e baseado no poderoso Gemini LLM, o mesmo modelo de linguagem que alimenta várias ferramentas de IA da Google. A primeira versão já era capaz de realizar tarefas simples, como colocar uma banana numa cesta. De acordo com o site Canaltech, agora, com a versão 1.5, os robôs podem lidar com tarefas complexas e com várias etapas, representando um grande avanço em autonomia e raciocínio artificial. Num dos testes, um robô equipado com os novos modelos conseguiu separar frutas por cor, colocando uma banana, uma maçã e um limão em pratos diferentes de acordo com os seus tons correspondentes. Durante o processo, a máquina chegou a explicar em linguagem natural o que estava a fazer e por que tomou cada decisão — algo impensável até recentemente. A inteligência dos robôs provém da interacção entre dois sistemas complementares: Gemini Robotics-ER 1.5 (“o cérebro”): modelo de visão e linguagem (VLM) que compreende o ambiente, processa comandos e realiza raciocínios avançados; Gemini Robotics 1.5 (“mãos e olhos”): modelo de visão, linguagem e acção (VLA) que realiza tarefas no mundo físico com precisão e autonomia. Esta parceria entre o “cérebro” e o “corpo” permite que os robôs planeiem, ajam e aprendam continuamente, recebendo feedback do ambiente e ajustando as suas acções em tempo real. Um dos exemplos mais impressionantes foi o de um robô que, ao ser solicitado a separar lixo, acessou a Internet via Google Search para consultar as regras de reciclagem de São Francisco e aplicá-las correctamente. De acordo com a equipa da Google DeepMind, o objectivo é criar robôs de uso geral capazes de compreender o mundo físico, raciocinar logicamente e realizar tarefas diárias com segurança. A grande inovação é que o aprendizado obtido num robô pode ser transferido para outros sistemas, acelerando o progresso colectivo da robótica. A nova geração de IA da Google mostra que a fronteira entre humanos e máquinas está a tonar-se cada vez mais suave.

Post a comment

Your email address will not be published.

Related Posts