As ferramentas de IA generativa estão a aumentar significativamente a produtividade em todo o mundo, mas a sua eficácia não é uniforme em todas as comunidades. Os sistemas geralmente apresentam um desempenho fraco para populações sub-representadas online, devido a dados de treino originados principalmente em idiomas e culturas bem representados na Internet. Esta lacuna significa que a IA generativa tem dificuldades em muitas línguas locais e não reflecte diversas realidades sociais e culturais. As questões de infra-estrutura contribuem, mas mesmo considerando factores como o PIB e o acesso à Internet, a adopção da IA ​​continua a ser menor em nações onde predominam línguas com poucos recursos. Para resolver estas desigualdades, a Microsoft Research lançou o Projecto Gecko, uma iniciativa dedicada à criação de sistemas de IA económicos e personalizáveis ​​para a maioria global. Este projecto concentra-se em fornecer conhecimentos vitais utilizando idiomas locais, conteúdo culturalmente sensível e envolvimento multimodal através de texto, voz e vídeo. É um esforço colaborativo que envolve investigadores da Microsoft Research Africa (Nairóbi), da Microsoft Research India e do Microsoft Research Accelerator nos Estados Unidos, juntamente com a Digital Green — uma organização de desenvolvimento global focada em infra-estruturas digitais orientadas pela comunidade para a agricultura — e outros parceiros na agrotecnologia, filantropia e academia. Uma inovação central do Projecto Gecko é um novo sistema de IA chamado MMCTAgent, uma estrutura multimodal de agente de pensamento crítico. Este sistema analisa entradas de fala, imagens e vídeos para fornecer respostas relevantes e contextuais. O MMCTAgent está actualmente disponível no Azure AI Foundry Labs e o seu código pode ser acedido no GitHub. Este trabalho está alinhado com a missão da Microsoft de capacitar todos globalmente, enfatizando que o desenvolvimento de IA generativa equitativa, que incorpora experiências culturalmente diferenciadas, é fundamental para o avanço responsável e inclusivo da IA. Para resolver estas desigualdades, a Microsoft Research lançou o Projecto Gecko, uma iniciativa dedicada à criação de sistemas de IA económicos e personalizáveis ​​para a maioria global O Projecto Gecko escolheu iniciar o seu trabalho na agricultura devido ao papel estratégico do sector no avanço simultâneo dos resultados climáticos, de saúde e de educação. O foco inicial está em pequenas explorações agrícolas na Índia e no Quénia, onde milhões de pessoas podem beneficiar da tecnologia para aumentar a produtividade das culturas e a resiliência face a climas voláteis. O projecto assenta no VeLLM (uniVersal Empowerment with LLM), uma plataforma da Microsoft Research India que suporta sistemas de IA capazes de criar conteúdo multilíngue e multimodal baseado em dados culturalmente relevantes. O VeLLM utiliza dados fornecidos pelas comunidades para melhorar o desempenho em idiomas não ingleses, exemplificado pela sua utilização no desenvolvimento do copiloto Shiksha para professores na Índia rural. A agricultura é um factor económico crítico em ambas as regiões-alvo, representando uma parte significativa do PIB e empregando milhões de pessoas, sobretudo pequenos agricultores. Embora existam serviços digitais para ajudar os agricultores com desafios como o clima e pragas, a sua dependência de Grandes Modelos de Linguagem (LLM) treinados principalmente em inglês e outras línguas ocidentais resulta em dificuldades na obtenção de respostas precisas em idiomas locais e com termos específicos do domínio, conduzindo a uma baixa utilização. Em países como o Quénia e a Índia, que têm fortes culturas orais, a comunicação por voz e vídeo é preferida para partilha de informação, exigindo abordagens multimodais. Além disso, a conectividade limitada exige que qualquer sistema funcione com baixa largura de banda e mínima capacidade de computação. O projecto está a trabalhar em estreita colaboração com o FarmerChat, um assistente de IA de voz da Digital Green que aconselha milhões de agricultores com recomendações agrícolas fiáveis. A Digital Green curou uma biblioteca de mais de dez mil vídeos em mais de 40 idiomas e dialectos ao longo de duas décadas — um vasto reservatório subutilizado de conhecimento local. O objectivo do Projecto Gecko é evoluir o FarmerChat de uma ferramenta básica de perguntas e respostas para um companheiro agrícola fiável. A equipa imaginou agricultores a enviar consultas por fala ou texto e a receber respostas accionáveis ​​e passo a passo no seu idioma preferido, através de texto, voz e um vídeo que começa exactamente na solução relevante. A estrutura MMCTAgent é fundamental para atingir este objectivo, melhorando os modelos experimentais de ponta através de ferramentas específicas do domínio. Ela processa vários tipos de informação — áudio, visual e texto — e decompõe questões complexas. Utiliza técnicas como PNL e visão computacional para compreender melhor os vídeos e transcrições da biblioteca da Digital Green, tornando-os pesquisáveis ​​e acessíveis. O MMCTAgent adapta o seu raciocínio e verifica as suas respostas através de um crítico integrado para assegurar precisão e relevância. O Projecto Gecko escolheu iniciar o seu trabalho na agricultura devido ao papel estratégico do sector no avanço simultâneo dos resultados climáticos, de saúde e de educação. O foco inicial está em pequenas explorações agrícolas na Índia e no Quénia, onde milhões de pessoas podem beneficiar da tecnologia para aumentar a produtividade das culturas e a resiliência face a climas voláteis As respostas multimodais resultantes são cultural e linguisticamente apropriadas porque são baseadas em conteúdo criado por comunidades locais. Estudos de campo no Quénia e na Índia confirmaram que o sistema oferece melhor qualidade de resposta, maior usabilidade e maior confiança dos utilizadores quando comparado com modelos genéricos de última geração. Para superar a falta de dados de treino e recursos computacionais para línguas de poucos recursos, a equipa do Projecto Gecko está a construir novos modelos desde o início, incluindo modelos de reconhecimento automático de fala (ASR) e texto-para-fala (TTS). Estão também a utilizar Modelos de Linguagem Pequenos (SLM), que exigem significativamente menos poder computacional do que os enormes LLM, tornando-os mais fáceis de ajustar para domínios e idiomas específicos. O resultado é um conjunto de modelos de fala personalizados e SLM para idiomas como Kiswahili, Hindi e Kikuyu, continuamente melhorados com dados dos utilizadores e adaptados localmente. A equipa expandiu o suporte linguístico para seis idiomas no Quénia, incorporando um grande conjunto de dados de origem comunitária. Estão igualmente a desenvolver melhorias para o FarmerChat, como a capacidade de colocar perguntas de esclarecimento e promover a partilha entre pares. Olhando para o futuro, o Projecto Gecko planeia expandir o seu impacto para outros domínios, incluindo saúde, educação e comércio a retalho. Ao analisar padrões de design bem-sucedidos e a infra-estrutura utilizados na agricultura, a Microsoft pretende criar soluções generalizáveis. A equipa lançará em breve um manual multilíngue para fornecer orientação completa a desenvolvedores sobre como criar aplicações de IA multilíngues específicas de domínio, com base nas experiências interculturais das equipas da Microsoft Research na Índia e no Quénia. O objectivo final é garantir que a próxima geração de IA seja globalmente inclusiva, culturalmente relevante e moldada pelas comunidades a que se destina servir.

Post a comment

Your email address will not be published.

Related Posts