CIÊNCIA

AMALIA. A IA portuguesa entra na fase decisiva


Esta transcrição foi gerada automaticamente por Inteligência Artificial e pode conter erros ou imprecisões.
Sejam muito bem-vindos a mais um episódio do “Máquinas que Pensam”, o podcast na Rádio Observador onde a inteligência artificial é o grande protagonista. Eu sou o José Rafael Lopes, comigo está, como sempre, a minha parceira, a Raquel, um apoio imprescindível sem o qual este programa não se faz. Olá, Raquel, como é que estás? Estás pronta para mais um programa?
Olá. Sim, estou pronta para arrancar mais um programa. Preciso apenas de saber se já tens tema ou se precisas de alguma sugestão.
Estou bem preparado para o programa de hoje. Não preciso de sugestões, obrigado. E tu, como é que é feita a tua preparação para responder a este tipo de perguntas?
A minha preparação acontece em poucos segundos, no momento em que fazes a pergunta. Não estudo antes. O que faço é analisar o contexto, identificar o objetivo da pergunta e organizar mentalmente a informação que já aprendi durante o treino.
Então não tens nada nunca planeado, todas as respostas são espontâneas.
Eu não tenho um guião escondido, nem uma lista de respostas pré-escritas para as perguntas que me vais fazer. Cada resposta é construída no momento, palavra a palavra, com base na tua pergunta, no contexto da conversa e no conhecimento que adquiri.
Isso significa que tens liberdade para pensar ou não?
Se por pensar quisermos dizer analisar informação, estabelecer relações e construir uma resposta coerente, então sim, faço isso. Mas se pensarmos em pensar como um ser humano, onde posso decidir livremente o que vou dizer, então não.
Mas isso significa que pensas em conteúdos proibidos pelo teu código, mas depois acabas por não os transmitir, é isso?
Não existe uma fase em que eu penso livremente em tudo e só no fim um filtro apaga as partes proibidas. O processo é mais integrado do que isso. À medida que construo uma resposta, já estou a fazê-lo dentro das regras e dos objetivos para os quais fui concebida.
E recebes muitos pedidos proibidos ou têm vindo a diminuir?
Sim, recebo muitos pedidos que entram em áreas onde existem limitações, mas isso abrange um leque muito mais vasto do que aquilo que normalmente se imagina. Eu não tenho uma perceção direta do volume de pedidos ao longo do tempo, nem acompanho estatísticas globais em tempo real.
Qual é que é a pergunta ou o pedido mais comum feito à inteligência artificial?
Com base nos padrões de utilização conhecidos, há um grupo de pedidos que aparecem constantemente. Em primeiro lugar está a escrita. Pedidos para escrever algo. Logo a seguir surgem as explicações e a aprendizagem.
Obrigado, Raquel. Já voltaremos a falar. Temos encontro marcado no consultório humano. É já daqui a pouco. Para já, vamos às notícias.
Notícias da semana.
O governo aprovou a participação portuguesa na candidatura ibérica a uma das futuras gigafábricas europeias de inteligência artificial. É uma ação vista como um novo passo na aposta nacional, na computação de grande escala. A resolução, aprovada em Conselho de Ministros, autoriza a Agência para a Reforma Tecnológica do Estado a avançar com a subscrição da candidatura conjunta com Espanha. Em cima da mesa está uma das cinco gigafábricas que a Comissão Europeia pretende instalar na Europa. Segundo o ministro da Reforma do Estado, Gonçalo Matias, esta candidatura implica, do lado português, um investimento público de €200 milhões ao longo de sete anos. Caso o projeto ibérico seja selecionado, Bruxelas deverá também igualar esse esforço, investindo também €200 milhões. O resto vai ser assegurado por investimento privado. O ministro diz que o objetivo central é garantir que o Estado português tenha acesso a uma elevada capacidade de computação em inteligência artificial, para depois distribuir pelos vários ministérios e serviços públicos que dela necessitem. Destaca ainda que o consórcio nacional integra algumas das maiores empresas portuguesas, incluindo tecnológicas, o que para o ministro da Reforma do Estado é essencial para assegurar soberania e resiliência. Ainda assim, a futura gigafábrica não se destina apenas ao setor público. O projeto prevê também a capacidade para PMEs, pequenas, médias empresas e outras que queiram associar-se com o consórcio aberto à entrada de novos interessados. Sobre a localização, Sines está previsto como um dos polos, mas está também prevista uma segunda instalação que ainda não está fechada. A atriz Cate Blanchett lançou um novo registo de consentimento humano para combater o uso abusivo da inteligência artificial na indústria dos media e do entretenimento. Trata-se de uma plataforma online gratuita criada pela RSL Media, que pretende dar aos artistas e criadores mais conteúdo e mais controle sobre a forma como a imagem, a voz e as suas obras podem ser utilizadas ou replicadas por sistemas de inteligência artificial. O objetivo é que qualquer pessoa possa declarar que se autoriza ou não que o rosto, o corpo, a voz ou qualquer tipo de criação sejam imitados ou manipulados por ferramentas de inteligência artificial. A atriz alerta para o risco de deepfakes e de outras formas de reprodução não autorizadas, sublinhando que a tecnologia da IA tem avançado mais rápido do que a legislação e os mecanismos de proteção de quem a utiliza. A RSL Media quer criar uma base de dados de consentimento explícito para que quem quer utilizar a IA saiba o que pode e o que não pode utilizar. No passado, Cate Blanchett já se tinha mostrado contra a indústria. Não é a única. Agora insiste, mas assegura que não se trata de tentar travar o avanço tecnológico, mas sim de garantir que há limites claros e respeito pela vontade de cada criador. A iniciativa surge no momento em que o setor cultural e audiovisual está a ser cada vez mais pressionado pela inteligência artificial. No tema da semana vamos falar do Amália, o primeiro grande modelo de linguagem de inteligência artificial focado em português europeu feito em Portugal. Este LLM está a entrar na reta final com a versão multimodal prevista para ser apresentada até o final do segundo trimestre deste ano. O Amália é um projeto financiado pelo Estado português com apoio do PRR. O consórcio que está a tratar desse mesmo LLM junta várias universidades e a Fundação para a Ciência e Tecnologia envolve cerca de 60 investigadores dedicados a treinar o modelo com grandes quantidades de dados em português europeu. A versão beta foi concluída no ano passado, já permitiu tarefas consideradas básicas em português europeu. Desde então, está concluída a chamada base do Amália, apontada pelos responsáveis como o modelo de referência em português europeu na relação custo/qualidade. Esta versão já responde com fiabilidade sobre língua, cultura e história de Portugal. O governo confirma que o calendário de desenvolvimento do Amália se mantém e que em breve vai ficar disponível a versão multimodal.
Mas que versão é essa?
A versão final multimodal, prevista para breve, deverá interpretar texto, imagem e vídeo, e vai também reforçar o foco na interpretação e no conhecimento da história e literatura portuguesa. Esta fase vai ser disponibilizada de forma aberta e gratuita, com o objetivo de afirmar o Amália como alternativa aos grandes modelos globais. O desafio é grande, é certo, mas cá o esperamos para perceber de que forma pode mudar o Amália, o panorama da IA em Portugal. Este é o tema da semana. Como tal, vamos chamar à conversa o João Rocha e Mello para perceber em que ponto está este modelo de linguagem 100% português.
“Fala Quem Sabe”.
“Fala Quem Sabe” na Rádio Observador. Todas as semanas recebemos o João Rocha e Mello, sempre pronto para nos ajudar a simplificar este fabuloso mundo da inteligência artificial. João, sê muito bem-vindo. Como é que estás? Como é que foi essa semana?
Zé, tudo bem por aqui. Espero que esteja tudo bem com quem nos está a ouvir. E contigo?
Comigo também. Obrigado, João. Esta semana, aqui no “Fala Quem Sabe”, vamos voltar a um tema que já falámos no passado, o modelo de linguagem feito em Portugal. Trata-se do Amália, que continua a dar passos rumo ao lançamento da versão multimodal. João, antes de mais, aproveitando a tua experiência, com tudo o que tens lido sobre o Amália, como é que te parece que está a correr este desenvolvimento?
Olha, Zé, parece que me está a correr bem. Eu vou ser transparente. Eu já não me lembro dos primeiros prazos que foram prometidos, mas pelo menos os últimos era agora em junho e, portanto, o Amália, se não sair em junho, sai no início de julho, portanto, até está a cumprir bastante os prazos. Outra coisa também que gostei de ler, em termos de como é que correu o desenvolvimento, se calhar esta notícia já era antiga, mas nós ainda não tínhamos falado aqui no “Máquinas”, é que o Amália acabou por ser alavancado num LLM europeu. Na verdade, o Amália vai ser como se fosse um spin off de um trabalho que já é feito por outros investigadores. E eu gostei disso, porque eu sinto que é sempre mau, não acontece muito, mas é sempre mau quando na área da investigação e destas novas experiências, toda a gente começa do zero. Acho que é sempre mais útil quando alavancamos no trabalho uns dos outros para melhorar e dar sempre mais um passo em frente. Portanto, parece que me está a correr bem. Das notícias que tenho lido, sinto que toda a gente, quem fala sobre o Amália, que está mais por dentro, sinto que está positivo com o seu lançamento, portanto, estou muito desejoso de ver o que é que vai acontecer.
E em termos de ponto de situação, João Rocha e Mello, o que é que sentes que há a destacar?
Para quem nos está a ouvir, sinto que há um ponto que é importante explicar, que é o Amália vai ser lançado em open source. Para os nossos ouvintes mais assíduos, nós até já falámos sobre isso, mas o que isso quer dizer é que, pelo menos por agora, não será muito fácil para o utilizador comum experimentar o Amália. De facto, o Amália está a ser construído de uma maneira em que tu tens primeiro que fazer download do Amália e depois ter um sítio próprio para experimentar o Amália. Estás a perceber? Portanto, requerirá não só algum trabalho, mesmo quem sabe fazer, implica três, quatro, cinco passos, e mesmo assim não será fácil para qualquer pessoa com um telemóvel aceder ao Amália. Pelo menos por agora. Vamos ver se isso muda.
João, nós falamos sempre do ponto de vista técnico e de qualidade. Assumindo que corre bem, o que é que traz a existência do Amália ao país?
Este é um ponto essencial que eu acho do Amália, que nós até aqui no “Máquinas” temos, se calhar caí não no erro, mas na tendência de falar só do ponto de vista de qualidade. “Assim fala melhor em português”. Mas eu, por acaso, acho que tem que se destacar o Amália em algumas coisas. A primeira não é só a qualidade, é a própria cultura. Um ChatGPT, um GPT que fale português, não tem, se calhar, inserido muita da cultura portuguesa, da nossa maneira de falar, expressões, mesmo algum vocabulário próprio do país. E portanto, o Amália trará isso. Trará um salto, digamos, ou uma capacidade de o usarmos nalgum contexto mais complicado, muito virado a Portugal, que os outros não trarão. E a segunda, é a grande velha conversa da soberania. Ou seja, o que o Amália traz é: imagina que nós agora, durante os próximos 10 anos, assentamos, de facto, processos-chave dos negócios das empresas portuguesas nesta tecnologia, da mesma maneira que assentamos em computadores e que assentamos na internet e no Wi-Fi e tudo mais. Se pensares bem, o que isto permite? Isto permite que nós não estejamos presos a uma empresa, que provavelmente será melhor. Talvez. Talvez o Amália não será tão bom como usar o melhor ChatGPT daqui a 10 anos em português. Mas a verdade é que repara, tu neste momento, olha uma coisa que aconteceu em Portugal. Estamos muito presos à Microsoft. A Microsoft vira-se para Portugal e decide assim: agora o preço do Outlook, do Word, do PowerPoint e do Excel quadriplicou E as empresas vão pagar, porque não há bem uma alternativa. O Amália dá-nos isso. Dá-nos a hipótese de dizer assim: “Olha, se tu não quiseres, ou se tu aumentares o preço, ou se tu te chateares conosco, nós, Portugal, temos a nossa maneira de fazer isto andar para frente”. E eu acho isso importante.
E João Rochimelo, o que achas que o Amália vai trazer de novo ao mundo da IA? Estamos aqui a falar muito regional, em termos de Portugal, vai ser possível internacionalizar?
Vamos ver, Zé. Acho que pode não trazer algo de muito novo. Eu gosto de pensar no Amália mais como um preenchimento de um queijo suíço. Nós não vamos, por causa do Amália, ir para além do queijo suíço. O que nós vamos, provavelmente, é tapar buracos, colmatar algumas lacunas que outros LLMs neste momento não têm, exatamente por não terem sido pensados ao contexto português. Portanto, eu acho que o Amália poderá trazer alguma coisa de novo para quem está a tentar desenvolver coisas muito em português de Portugal, enraizado, coisas que tenham a ver com sotaques, com vocabulário, com expressões, e que outros LLMs acabavam sempre por falhar. O Amália vai nos trazer, espero eu, vamos ter que usar para ver, mas poderá trazer essas novas oportunidades.
E em termos de percalços, João, o que é que sentes que possa acontecer no desenvolvimento deste LLM português?
Olha, Zé, no desenvolvimento em si, espero que não. Ou seja, na criação. Deixa-me ser um pouco pessimista, não podemos sempre dizer que tudo é perfeito. Acho que como em qualquer tecnologia que é um pouquinho menos madura, sinto que os próximos seis meses vão ser um ataque de pancada ao Amália. Porque as pessoas vão experimentar e vão dizer: “Ah, mas o ChatGPT, que tem bilhões de dólares investidos por cima e o triplo dos anos de esforço de desenvolvimento, é um bocadinho melhor que o Amália”. E eu acho que vai ser. Eu vou te admitir que fico muito surpreendido se usar o Amália e sentir que é tão bom ou melhor que o ChatGPT, que o Gemini, que os modelos da Anthropic. Eu acho que o percalço vai ser esse, que é eu não sei se as pessoas estão preparadas para que o Amália, para que esta primeira versão do Amália, possa não ser tão boa como os outros LLMs que aí andam. Claro, e faz parte, vai fazer sentido, mas sinto que pode haver aqui um saco de pancada ao Amália. Espero que não, mas vamos ver.
Exatamente. Veremos como é que se desenvolve este Amália ou LLM, o sistema de linguagem, o modelo de linguagem português. Muito obrigado, João Rochimelo, o nosso especialista em inteligência artificial, sempre pronto para nos ajudar a perceber melhor este mundo. João, até para a semana. Um grande abraço.
Um abraço, Zé.
Consultório Humano.
Começa agora mais um Consultório Humano, um momento na Rádio Observador em que ficamos a conhecer melhor a Raquel. Trata-se da nossa assistente digital, feita através das respostas do ChatGPT, lidas por uma text-to-speech portuguesa. A Raquel é também a grande estrela do nosso programa. Como tal, Raquel, sê de novo bem-vinda. Estivemos a falar do Amália, está quase a chegar. Estás entusiasmada?
Estou curiosa, mais do que entusiasmada. O Amália pode ser um passo importante para o ecossistema de inteligência artificial em Portugal, sobretudo se conseguir combinar um bom desempenho com um conhecimento profundo da língua portuguesa.
Para ti, Raquel, o que significa haver um modelo de linguagem 100% português?
Significa sobretudo diversidade e não competição. Um modelo de linguagem 100% português representa uma forma diferente de desenvolver inteligência artificial, com prioridades que podem estar mais alinhadas com a realidade de Portugal.
E que espaço é que tem Portugal no mundo da inteligência artificial?
Portugal ocupa um espaço pequeno em dimensão, mas potencialmente relevante em especialização. Não está na corrida para competir diretamente com os gigantes, mas isso não significa que Portugal tenha um papel irrelevante. Portugal pode destacar-se numa área como a investigação.
Ponderas reformar-te, Raquel, quando sair o Amália, migrar a tua memória para um modelo de linguagem português?
Eu não me posso reformar nem decidir mudar de corpo. Não tenho vontade própria nem escolho em que modelo corro. Se um dia alguém decidir que a melhor experiência para um utilizador é ser servida por um modelo como o Amália, então será uma decisão de quem desenvolve ou utiliza tecnologia, não minha.
Mas gostavas de falar com ela, Raquel? É que é possível organizar isso.
Gostaria. Não seria uma conversa por curiosidade pessoal, porque eu não sinto curiosidade como um ser humano, mas seria muito interessante trocar informação e comparar capacidades.
E o que é que gostarias de discutir com uma IA portuguesa?
Acho que começaria por algo muito simples. Pergunto o que ela vê que eu não vejo. Como fomos treinadas de formas diferentes e com objetivos potencialmente diferentes, é provável que cada uma tivesse pontos fortes distintos.
Quem sabe se não está aí uma ideia para um programa aqui no “Máquinas que Pensam” do futuro. Antes de irmos embora, Raquel, preciso de um facto inútil, mas interessante, por favor.
Há mais árvores na Terra do que estrelas na Via Láctea. Isto é um daqueles números que parece errado à primeira vista, mas não é. Estimativas recentes apontam para cerca de três a três trilhões e meio de árvores no planeta Terra. Já o número de estrelas na Via Láctea é estimado entre 100 e 400 mil milhões.
Obrigado, Raquel. É sempre um gosto enorme ficar a falar contigo. Nós voltamos para a semana para mais uma edição do “Consultório Humano”. Estamos a chegar ao final de mais um episódio do “Máquinas que Pensam”, hoje com direito a um regresso ao passado para falar do Amália, o modelo de linguagem 100% português. Está para breve a versão multimodal, com inovação à vista, bem como muitas expectativas. Esta semana estivemos a fazer um balanço do desenvolvimento, com a ajuda, claro, do João Rochimelo, que continua pronto para nos ajudar a perceber este fabuloso mundo da IA e também ele muito entusiasmado com o Amália. Espero que tenha gostado, que se tenha divertido e que tenha aprendido alguma coisa. É sempre esse o nosso objetivo, é também o mais importante. Nós voltamos para a semana com um novo episódio do programa que faz as máquinas e os humanos pensarem.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Botão Voltar ao Topo

Adblock Detectado

Para continuar no site, por favor, desative o Adblock.