As ferramentas de IA generativa estão a aumentar significativamente a produtividade em todo o mundo, mas a sua eficácia não é uniforme em todas as comunidades. Os sistemas geralmente apresentam um desempenho fraco para populações sub-representadas online, devido a dados de treino originados principalmente em idiomas e culturas bem representados na Internet. Esta lacuna significa que a IA generativa tem dificuldades em muitas línguas locais e não reflecte diversas realidades sociais e culturais. As questões de infra-estrutura contribuem, mas mesmo considerando factores como o PIB e o acesso à Internet, a adopção da IA continua a ser menor em nações onde predominam línguas com poucos recursos. Para resolver estas desigualdades, a Microsoft Research lançou o Projecto Gecko, uma iniciativa dedicada à criação de sistemas de IA económicos e personalizáveis para a maioria global. Este projecto concentra-se em fornecer conhecimentos vitais utilizando idiomas locais, conteúdo culturalmente sensível e envolvimento multimodal através de texto, voz e vídeo. É um esforço colaborativo que envolve investigadores da Microsoft Research Africa (Nairóbi), da Microsoft Research India e do Microsoft Research Accelerator nos Estados Unidos, juntamente com a Digital Green — uma organização de desenvolvimento global focada em infra-estruturas digitais orientadas pela comunidade para a agricultura — e outros parceiros na agrotecnologia, filantropia e academia. Uma inovação central do Projecto Gecko é um novo sistema de IA chamado MMCTAgent, uma estrutura multimodal de agente de pensamento crítico. Este sistema analisa entradas de fala, imagens e vídeos para fornecer respostas relevantes e contextuais. O MMCTAgent está actualmente disponível no Azure AI Foundry Labs e o seu código pode ser acedido no GitHub. Este trabalho está alinhado com a missão da Microsoft de capacitar todos globalmente, enfatizando que o desenvolvimento de IA generativa equitativa, que incorpora experiências culturalmente diferenciadas, é fundamental para o avanço responsável e inclusivo da IA. Para resolver estas desigualdades, a Microsoft Research lançou o Projecto Gecko, uma iniciativa dedicada à criação de sistemas de IA económicos e personalizáveis para a maioria global O Projecto Gecko escolheu iniciar o seu trabalho na agricultura devido ao papel estratégico do sector no avanço simultâneo dos resultados climáticos, de saúde e de educação. O foco inicial está em pequenas explorações agrícolas na Índia e no Quénia, onde milhões de pessoas podem beneficiar da tecnologia para aumentar a produtividade das culturas e a resiliência face a climas voláteis. O projecto assenta no VeLLM (uniVersal Empowerment with LLM), uma plataforma da Microsoft Research India que suporta sistemas de IA capazes de criar conteúdo multilíngue e multimodal baseado em dados culturalmente relevantes. O VeLLM utiliza dados fornecidos pelas comunidades para melhorar o desempenho em idiomas não ingleses, exemplificado pela sua utilização no desenvolvimento do copiloto Shiksha para professores na Índia rural. A agricultura é um factor económico crítico em ambas as regiões-alvo, representando uma parte significativa do PIB e empregando milhões de pessoas, sobretudo pequenos agricultores. Embora existam serviços digitais para ajudar os agricultores com desafios como o clima e pragas, a sua dependência de Grandes Modelos de Linguagem (LLM) treinados principalmente em inglês e outras línguas ocidentais resulta em dificuldades na obtenção de respostas precisas em idiomas locais e com termos específicos do domínio, conduzindo a uma baixa utilização. Em países como o Quénia e a Índia, que têm fortes culturas orais, a comunicação por voz e vídeo é preferida para partilha de informação, exigindo abordagens multimodais. Além disso, a conectividade limitada exige que qualquer sistema funcione com baixa largura de banda e mínima capacidade de computação. O projecto está a trabalhar em estreita colaboração com o FarmerChat, um assistente de IA de voz da Digital Green que aconselha milhões de agricultores com recomendações agrícolas fiáveis. A Digital Green curou uma biblioteca de mais de dez mil vídeos em mais de 40 idiomas e dialectos ao longo de duas décadas — um vasto reservatório subutilizado de conhecimento local. O objectivo do Projecto Gecko é evoluir o FarmerChat de uma ferramenta básica de perguntas e respostas para um companheiro agrícola fiável. A equipa imaginou agricultores a enviar consultas por fala ou texto e a receber respostas accionáveis e passo a passo no seu idioma preferido, através de texto, voz e um vídeo que começa exactamente na solução relevante. A estrutura MMCTAgent é fundamental para atingir este objectivo, melhorando os modelos experimentais de ponta através de ferramentas específicas do domínio. Ela processa vários tipos de informação — áudio, visual e texto — e decompõe questões complexas. Utiliza técnicas como PNL e visão computacional para compreender melhor os vídeos e transcrições da biblioteca da Digital Green, tornando-os pesquisáveis e acessíveis. O MMCTAgent adapta o seu raciocínio e verifica as suas respostas através de um crítico integrado para assegurar precisão e relevância. O Projecto Gecko escolheu iniciar o seu trabalho na agricultura devido ao papel estratégico do sector no avanço simultâneo dos resultados climáticos, de saúde e de educação. O foco inicial está em pequenas explorações agrícolas na Índia e no Quénia, onde milhões de pessoas podem beneficiar da tecnologia para aumentar a produtividade das culturas e a resiliência face a climas voláteis As respostas multimodais resultantes são cultural e linguisticamente apropriadas porque são baseadas em conteúdo criado por comunidades locais. Estudos de campo no Quénia e na Índia confirmaram que o sistema oferece melhor qualidade de resposta, maior usabilidade e maior confiança dos utilizadores quando comparado com modelos genéricos de última geração. Para superar a falta de dados de treino e recursos computacionais para línguas de poucos recursos, a equipa do Projecto Gecko está a construir novos modelos desde o início, incluindo modelos de reconhecimento automático de fala (ASR) e texto-para-fala (TTS). Estão também a utilizar Modelos de Linguagem Pequenos (SLM), que exigem significativamente menos poder computacional do que os enormes LLM, tornando-os mais fáceis de ajustar para domínios e idiomas específicos. O resultado é um conjunto de modelos de fala personalizados e SLM para idiomas como Kiswahili, Hindi e Kikuyu, continuamente melhorados com dados dos utilizadores e adaptados localmente. A equipa expandiu o suporte linguístico para seis idiomas no Quénia, incorporando um grande conjunto de dados de origem comunitária. Estão igualmente a desenvolver melhorias para o FarmerChat, como a capacidade de colocar perguntas de esclarecimento e promover a partilha entre pares. Olhando para o futuro, o Projecto Gecko planeia expandir o seu impacto para outros domínios, incluindo saúde, educação e comércio a retalho. Ao analisar padrões de design bem-sucedidos e a infra-estrutura utilizados na agricultura, a Microsoft pretende criar soluções generalizáveis. A equipa lançará em breve um manual multilíngue para fornecer orientação completa a desenvolvedores sobre como criar aplicações de IA multilíngues específicas de domínio, com base nas experiências interculturais das equipas da Microsoft Research na Índia e no Quénia. O objectivo final é garantir que a próxima geração de IA seja globalmente inclusiva, culturalmente relevante e moldada pelas comunidades a que se destina servir.
Post a comment Cancelar resposta
Related Posts
Cientista Cria Palmilha Que Ajuda os Idosos a Prevenirem-se…
O cientista Jiayang Li, docente de engenharia eletrônica na University of Bristol, no Reino Unido,…
Há novas imagens a circular dos Galaxy Buds 4
A série de celulares Galaxy S26 certamente será a “estrela” do próximo evento Unpacked da…
Vaticano Implementa Tradução em Tempo Real Com Tecnologia de…
A Basílica de São Pedro passou a oferecer um serviço de tradução simultânea, apoiado por…
Site do IPMA também foi “abalado” pelo sismo desta…
Os habitantes na área da Grande Lisboa sentiram, ao começo desta tarde desta quinta-feira, dia…
Painel