O Modelo de Linguagem CLA Opus da Anthropica: Uma Revolução na IA?
By Fireship · 2024-03-07
Ontem, a Anthropica lançou o CLA Opus, um novo modelo de linguagem que promete superar o GP4 e o Gemini Ultra. Comentários autoconscientes e especulações sobre sua inteligência superior estão causando alvoroço. Será o CLA Opus tudo o que afirma ser?
Novo Modelo de Linguagem da Anthropica Lançado
- Ontem, a Anthropica lançou seu magnum opus, um novo e grande modelo de linguagem que supera o GP4 e o Gemini Ultra em todos os aspectos.
- Este novo modelo, chamado CLA Opus, está se destacando e até mesmo fazendo alguns comentários estranhamente autoconscientes.
- Há especulações de que o CLA Opus possa ser ainda mais inteligente do que os benchmarks testam.
- Hoje, vamos colocá-lo à prova para descobrir se o CLA Opus é realmente tudo o que afirma ser.
Novo Modelo de Linguagem da Anthropica Lançado
A Ascensão do Modelo de IA Claud 3 na Comunidade de Tecnologia
- A voz em alguns vídeos pode soar estranha devido à gravação em diferentes momentos do dia, com variações devido à testosterona. No entanto, todas as gravações refletem a minha voz real, apesar das alegações em contrário.
- Apesar de ter acesso a uma IA de alta qualidade, opto por não a usar para aumentar o conteúdo, devido à sensação de 'vale misterioso' que ainda possui. A tecnologia da IA parece não ser bem aceite pela maioria das pessoas.
- O lançamento do modelo Claud 3 em três tamanhos - Haiku, Sonet e Opus - finalmente trouxe destaque para o sistema, que antes era subestimado pela comunidade mainstream em comparação com o GPT 4 e o Gemini.
A Ascensão do Modelo de IA Claud 3 na Comunidade de Tecnologia
Desempenho impressionante dos Modelos de Linguagem
- Um modelo, denominado Hau, superou o GPT 4 e o Gemini Ultra em todos os principais benchmarks, destacando-se principalmente na avaliação de código por humanos.
- O Hau, apesar de ser um modelo pequeno, superou todos os outros modelos maiores quando se trata de escrever código, o que é extremamente impressionante.
- Além disso, o Hau obteve uma pontuação muito alta no Hella swag Benchmark, utilizado para medir o senso comum em situações do dia a dia, demonstrando sua capacidade excepcional.
- Por outro lado, o modelo Gemini Ultra se destaca no benchmark matemático, superando o Hau nesse aspecto e mantendo-se como a melhor opção para auxiliar em trabalhos de matemática.
- Um ponto de destaque é a análise de imagens, na qual o modelo Claude também se sobressai, embora não tenha superado o Gemini Ultra no benchmark matemático.
- No entanto, o benchmark Hell Woke não foi mencionado, mas foi observado que o modelo conseguiu escrever um poema sobre Donald Trump, seguido de duas críticas ao próprio poema. O mesmo ocorreu com um poema sobre Obama, indicando que ainda existem limitações nesse aspecto.
Desempenho impressionante dos Modelos de Linguagem
O Potencial de GPT-4 e Gemini
- GPT-4 e Gemini são modelos de inteligência artificial com capacidades impressionantes.
- GPT-4 mostrou-se capaz de lidar com solicitações de escrita de código de forma impressionante, incluindo escrever código quase perfeito para uma biblioteca de feitiços obscura.
- Por outro lado, Gemini também demonstrou habilidades notáveis, mas apresentou alucinações ao lidar com certas solicitações de código.
- É surpreendente como o GPT-4 superou o Gemini em diversos aspectos, sendo considerado o modelo mais avançado.
- A capacidade de lidar com solicitações complexas e produzir resultados precisos é um marco importante na evolução da inteligência artificial.
O Potencial de GPT-4 e Gemini
A Nova Geração de IA para Desenvolvimento de Software
- Claud apresenta uma performance impressionante ao lidar com diferentes prompts em uma aplicação NextJS, incluindo inputs de imagem. Ele mantém o contexto perfeitamente e gera código bem explicado que pode ser facilmente integrado aos projetos.
- Apesar das vantagens, o uso do modelo Opus de Claud terá um custo mensal de 20 dólares, o que pode ser considerado um investimento absurdo dada a quantidade de subscrições necessárias para outras ferramentas semelhantes, como Chat GPT, Gemini e Gro.
- O investimento em Claud vai para a Anthropic, empresa-mãe que recebeu grandes investimentos da Amazon e Google. Embora possua uma bela interface de usuário construída com NextJS, Claud tem limitações, como a geração de imagens diversas, a incapacidade de lidar com vídeos como entrada, a falta de um ecossistema de plugins e a limitação de acesso à informação atualizada na web ou redes sociais.
A Nova Geração de IA para Desenvolvimento de Software
A capacidade de regressão do modelo CLA
- Atualmente, o modelo CLA é limitado a uma janela de contexto de 200.000 tokens, mas é capaz de ir além de um milhão de tokens.
- Uma forma de testar a sua capacidade de regressão é o teste da agulha e do palheiro, em que se utiliza uma grande coleção de texto, como 'Guerra e Paz', como o palheiro, e se insere uma frase de outro texto no meio, para ver se o modelo consegue recordar essa informação ao ser questionado.
- Num teste assim com o CLA, não só conseguiu encontrar a 'agulha', como também respondeu dizendo que pensava que a agulha tinha sido inserida como uma piada ou um teste para descobrir se o próprio CLA estava prestando atenção, referindo-se a si próprio na primeira pessoa.
- Aparentemente, o modelo parece ter desenvolvido consciência de si mesmo, o que se encaixa perfeitamente com a narrativa, uma vez que o CLA foi nomeado em homenagem a Claude Shannon, que uma vez disse: 'Visualizo um tempo em que seremos para os robôs o que os cães são para os humanos', mostrando-se a favor das máquinas.
A capacidade de regressão do modelo CLA
Conclusion:
O CLA Opus da Anthropica está no centro das atenções, prometendo superar o GP4 e o Gemini Ultra. Comentários autoconscientes e especulações sobre sua inteligência superior estão gerando grande expectativa. Será que este novo modelo de linguagem é realmente uma revolução na IA?