Pular para o conteúdo principal

Novos modelos de IA têm mais alucinações

 A OpenAI tem estado ativa com o revelar de novos modelos de inteligência artificial que superam os anteriores, com funções de raciocínio. Curiosamente, esperava-se que estes fossem mais evoluídos, mas trazem um problema associado. Têm mais alucinações e não sabem porquê.

OpenAI AI alucinações modelos raciocínio

Novos modelos de IA têm mais alucinações

As alucinações em inteligência artificial são um dos graves problemas enfrentados pelas grandes empresas tecnológicas. Isto ocorre quando um destes modelos oferece algum tipo de informação ou raciocínio que faz uma afirmação firme, mas não é precisa ou verdadeira. Os novos modelos OpenAI, tanto o o3 como o o4-mini, geram mais alucinações do que nunca quando comparados com os modelos anteriores.

Conforme os testes internos da OpenAI, tanto o o3 como o o4-mini, que apresentam capacidades de raciocínio, apresentam alucinações com maior frequência do que os modelos anteriores da empresa. O preocupante é que a OpenAI não sabe exatamente porque é que isto acontece e, se as coisas continuarem assim, os seus modelos futuros poderão não ser propriamente fiáveis.

OpenAI AI alucinações modelos raciocínio

OpenAI não sabe a razão deste comportamento

Na última avaliação do o3 e o4-mini, a OpenAI revela serem necessárias mais pesquisas para compreender porque é que as alucinações pioram à medida que os modelos de raciocínio se expandem. Salientam que a o3 surpreendeu ao responder a 33% das questões do PersonQA, um benchmark interno da empresa para medir a precisão de um modelo sobre as pessoas.

Isto representa aproximadamente o dobro da taxa de alucinações nos modelos de raciocínio anteriores. Por outro lado, o 04-mini teve um desempenho ainda pior no PersonQA, com alucinações em 48% das vezes. Da mesma forma, testes externos também encontraram evidências de que estes novos modelos tendem a inventar mais do que nunca.

OpenAI AI alucinações modelos raciocínio

Modelos com raciocínio seriam mais fiáveis

A Transluce avançou a hipótese que o tipo de aprendizagem de reforço utilizado para modelos de séries 'o' pode amplificar problemas normalmente mitigados, mas não totalmente eliminados, por processos padrão de pós-formação. Embora estas alucinações possam, por vezes, ajudar os modelos a serem mais imaginativos e criativos, isso nem sempre é positivo.

A Open AI também já se manifestou sobre este problema. Abordar as alucinações em todos os nossos modelos é uma área de investigação contínua e a empresa está constantemente a trabalhar para melhorar a sua precisão e fiabilidade.

Comentários

Postagens mais visitadas deste blog

Cibersegurança: Confiança zero… desconfiança por omissão

  Atualmente, todas as empresas têm presença digital. Embora este facto traga inúmeros benefícios, também acarreta uma série de riscos. Os cibercriminosos estão a encontrar cada vez mais formas de contornar as medidas de segurança e aceder aos dados. Se a proteção não for suficientemente forte, os dados das organizações, dos seus clientes e dos seus parceiros podem ser comprometidos, com consequências terríveis para as empresas. A crescente digitalização, juntamente com a evolução das táticas dos cibercriminosos, está a resultar num aumento dos incidentes de cibersegurança. Esta tendência preocupante é demonstrada no último Relatório de Violação de Dados, realizado pelo Internet Theft Resource Center (ITRC), que regista 2.365 ciberataques em 2023 que afetaram mais de 300 milhões de vítimas. Com este conhecimento, é essencial que as empresas tomem medidas e protejam os seus sistemas para evitar que utilizadores não identificados acedam a informações sensíveis. Só assim será possível...

Apple Intelligence

  O iOS 18.2 trouxe  uma série de novos recursos dentro da suíte Apple Intelligence   e isso também está exigindo mais armazenamento livre nos iPhones, iPads e Macs compatíveis. Conforme as novas diretrizes da Apple, agora  o usuário precisa manter ao menos 7 GB de memória livre  no dispositivo caso deseje usar as funcionalidades de Inteligência Artificial. Ou seja, um aumento considerável em relação aos 4 GB de armazenamento  exigidos anteriormente no iOS 18.1 . A Apple diz que essa mudança é necessária porque muitas das funções de IA são processadas localmente pela NPU Apple Silicon, algo que exige mais espaço de memória. Caso o usuário não tenha os 7 GB disponíveis, ele será impedido de usar a IA para gerar emojis (Genmoji) ou conversar com a nova Siri, que tem o ChatGPT integrado.   Recursos mais "simples", como a tradução ou resumo de textos, também deixam de funcionar. Na prática, usuários que procuram comprar os novos aparelhos da linha  iP...

“internet zumbi”

 A ascensão do slop, diz ele, transformou a rede social em um espaço onde “uma mistura de bots, humanos e contas que já foram humanos, mas não se misturam mais para formar um site desastroso onde há pouca conexão social”. Nick Clegg, presidente de assuntos globais da empresa-mãe do Facebook, Meta, escreveu em fevereiro que a rede social está treinando seus sistemas para identificar conteúdo feito por IA. “Como a diferença entre conteúdo humano e sintético fica turva, as pessoas querem saber onde está o limite”, escreveu ele. O problema começou a preocupar a principal fonte de receita da indústria de mídia social: as agências de publicidade que pagam para colocar anúncios ao lado do conteúdo. Farhad Divecha, diretor-gerente da agência de marketing digital AccuraCast, com sede no Reino Unido, diz que agora está encontrando casos em que os usuários estão sinalizando erroneamente os anúncios como slop feitos de IA quando não estão. “Vimos casos em que as pessoas comentara...