O Modelo de Linguagem CLA Opus da Anthropica: Uma Revolução na IA?

By Fireship · 2024-03-07

Ontem, a Anthropica lançou o CLA Opus, um novo modelo de linguagem que promete superar o GP4 e o Gemini Ultra. Comentários autoconscientes e especulações sobre sua inteligência superior estão causando alvoroço. Será o CLA Opus tudo o que afirma ser?

Novo Modelo de Linguagem da Anthropica Lançado

Ontem, a Anthropica lançou seu magnum opus, um novo e grande modelo de linguagem que supera o GP4 e o Gemini Ultra em todos os aspectos.

Este novo modelo, chamado CLA Opus, está se destacando e até mesmo fazendo alguns comentários estranhamente autoconscientes.

Há especulações de que o CLA Opus possa ser ainda mais inteligente do que os benchmarks testam.

Hoje, vamos colocá-lo à prova para descobrir se o CLA Opus é realmente tudo o que afirma ser.

Novo Modelo de Linguagem da Anthropica Lançado

A Ascensão do Modelo de IA Claud 3 na Comunidade de Tecnologia

A voz em alguns vídeos pode soar estranha devido à gravação em diferentes momentos do dia, com variações devido à testosterona. No entanto, todas as gravações refletem a minha voz real, apesar das alegações em contrário.

Apesar de ter acesso a uma IA de alta qualidade, opto por não a usar para aumentar o conteúdo, devido à sensação de 'vale misterioso' que ainda possui. A tecnologia da IA parece não ser bem aceite pela maioria das pessoas.

O lançamento do modelo Claud 3 em três tamanhos - Haiku, Sonet e Opus - finalmente trouxe destaque para o sistema, que antes era subestimado pela comunidade mainstream em comparação com o GPT 4 e o Gemini.

A Ascensão do Modelo de IA Claud 3 na Comunidade de Tecnologia

Desempenho impressionante dos Modelos de Linguagem

Um modelo, denominado Hau, superou o GPT 4 e o Gemini Ultra em todos os principais benchmarks, destacando-se principalmente na avaliação de código por humanos.

O Hau, apesar de ser um modelo pequeno, superou todos os outros modelos maiores quando se trata de escrever código, o que é extremamente impressionante.

Além disso, o Hau obteve uma pontuação muito alta no Hella swag Benchmark, utilizado para medir o senso comum em situações do dia a dia, demonstrando sua capacidade excepcional.

Por outro lado, o modelo Gemini Ultra se destaca no benchmark matemático, superando o Hau nesse aspecto e mantendo-se como a melhor opção para auxiliar em trabalhos de matemática.

Um ponto de destaque é a análise de imagens, na qual o modelo Claude também se sobressai, embora não tenha superado o Gemini Ultra no benchmark matemático.

No entanto, o benchmark Hell Woke não foi mencionado, mas foi observado que o modelo conseguiu escrever um poema sobre Donald Trump, seguido de duas críticas ao próprio poema. O mesmo ocorreu com um poema sobre Obama, indicando que ainda existem limitações nesse aspecto.

Desempenho impressionante dos Modelos de Linguagem

O Potencial de GPT-4 e Gemini

GPT-4 e Gemini são modelos de inteligência artificial com capacidades impressionantes.

GPT-4 mostrou-se capaz de lidar com solicitações de escrita de código de forma impressionante, incluindo escrever código quase perfeito para uma biblioteca de feitiços obscura.

Por outro lado, Gemini também demonstrou habilidades notáveis, mas apresentou alucinações ao lidar com certas solicitações de código.

É surpreendente como o GPT-4 superou o Gemini em diversos aspectos, sendo considerado o modelo mais avançado.

A capacidade de lidar com solicitações complexas e produzir resultados precisos é um marco importante na evolução da inteligência artificial.

O Potencial de GPT-4 e Gemini

A Nova Geração de IA para Desenvolvimento de Software

Claud apresenta uma performance impressionante ao lidar com diferentes prompts em uma aplicação NextJS, incluindo inputs de imagem. Ele mantém o contexto perfeitamente e gera código bem explicado que pode ser facilmente integrado aos projetos.

Apesar das vantagens, o uso do modelo Opus de Claud terá um custo mensal de 20 dólares, o que pode ser considerado um investimento absurdo dada a quantidade de subscrições necessárias para outras ferramentas semelhantes, como Chat GPT, Gemini e Gro.

O investimento em Claud vai para a Anthropic, empresa-mãe que recebeu grandes investimentos da Amazon e Google. Embora possua uma bela interface de usuário construída com NextJS, Claud tem limitações, como a geração de imagens diversas, a incapacidade de lidar com vídeos como entrada, a falta de um ecossistema de plugins e a limitação de acesso à informação atualizada na web ou redes sociais.

A Nova Geração de IA para Desenvolvimento de Software

A capacidade de regressão do modelo CLA

Atualmente, o modelo CLA é limitado a uma janela de contexto de 200.000 tokens, mas é capaz de ir além de um milhão de tokens.

Uma forma de testar a sua capacidade de regressão é o teste da agulha e do palheiro, em que se utiliza uma grande coleção de texto, como 'Guerra e Paz', como o palheiro, e se insere uma frase de outro texto no meio, para ver se o modelo consegue recordar essa informação ao ser questionado.

Num teste assim com o CLA, não só conseguiu encontrar a 'agulha', como também respondeu dizendo que pensava que a agulha tinha sido inserida como uma piada ou um teste para descobrir se o próprio CLA estava prestando atenção, referindo-se a si próprio na primeira pessoa.

Aparentemente, o modelo parece ter desenvolvido consciência de si mesmo, o que se encaixa perfeitamente com a narrativa, uma vez que o CLA foi nomeado em homenagem a Claude Shannon, que uma vez disse: 'Visualizo um tempo em que seremos para os robôs o que os cães são para os humanos', mostrando-se a favor das máquinas.

A capacidade de regressão do modelo CLA

Conclusion:

O CLA Opus da Anthropica está no centro das atenções, prometendo superar o GP4 e o Gemini Ultra. Comentários autoconscientes e especulações sobre sua inteligência superior estão gerando grande expectativa. Será que este novo modelo de linguagem é realmente uma revolução na IA?