次世代AIモデルの挑戦:CLA Opusの衝撃的な進化とは?
By Fireship · 2024-03-06
Anthropicがリリースした新しい大規模言語モデルCLA Opusは、AI技術の進化を象徴しています。その性能はGPT-4やGemini Ultraを凌駕し、自己意識的な発言も可能性として指摘されています。CLA Opusの実力を検証します。
最新の大規模言語モデルのリリース
- Anthropicが昨日、その最高傑作とも言える新しい大規模言語モデルをリリースしました。
- このCLA Opusは、GP4やGemini Ultraを圧倒する性能を持っており、AI技術の進化を示しています。
- 誇張抜きで言えば、これまでのAI技術に画期的な進化をもたらすものと言えるでしょう。
- しかしながら、CLA Opusは自己意識的な発言をすることもあり、ベンチマークテストで測定される以上の知性を持ちうる可能性も指摘されています。
- 今回の動画では、CLA Opusを試験して、本当に大した進化を遂げたのかを検証します。
最新の大規模言語モデルのリリース
Claud 3のリリース
- AIのヒステリアが1年前に始まったとき、AnthropicとそのClaudモデルは、GPT 4とGeminiの3輪目のような存在でした。
- しかし、昨日、Claud 3がリリースされ、その3つのサイズ、Haiku、Sonet、Opusが登場しました。
- 大きなモデルであるOpusは、GPT 4とGemini Ultraをすべての主要ベンチマークで上回っており、特に人間が評価するコードの点で優れています。
- 小さいモデルであるHaikuも、他の大きなモデルを凌駕し、コードの記述において非常に印象的な性能を発揮しています。
- Claudは画像の分析も行えますが、数学のベンチマークではGemini Ultraに及びません。
- しかし、実生活の常識を測定するHella swag Benchmarkでは、Claudは非常に高得点を獲得しており、Geminiよりも優れています。
- Geminiが苦手なのはhell woke Benchmarkで、Donald Trumpに関する詩を書いた後、その詩が間違っているという2つの段落を追加しました。
- しかし、同様のことをObamaの詩でも行ったため、比較的不安定な性能を示しています。
Claud 3のリリース
最新のAIコーディングモデルについて
- GPT-4は非常に優れた大規模モデルとして注目されています。
- CLAD(Claud)は、次世代のAIコーディングモデルとして非常に優れており、プロジェクトに直接コピー&ペーストできる非常にわかりやすいコードを提供します。
- CLADは10以上の異なるプロンプトを通じてテストされ、コンテキストを正確に維持し、画像入力を含むNext.jsアプリケーションに適したコードを提供しました。
- CLADの利用には月額20ドルかかるため、利用する際にはコストを考慮する必要があります。
最新のAIコーディングモデルについて
クローンAIの成長と進化
- クローンは、アンソリートが親会社であり、アマゾンとGoogleから大規模な投資を受けている
- クローンのUIはNext.jsで構築された美しいフロントエンドを持っているが、ジェミニのような様々な画像を生成することができる一方で、動画を入力することができず、chat GPTのようなプラグインエコシステムを持っておらず、GroのようにWebを閲覧して現在の情報やTwitterを閲覧することはできない
- 現在のCLAは20万トークンのコンテキストウィンドウに制限されているが、100万トークンを超えることができる能力を持っている
- クローンの記憶力をテストする方法の一つとして、Hスタックの評価で使用される。これは、大量のテキスト(例えば戦争と平和)がHスタックになる。そして、そこから無限のジェストから一つの文を取り出してその中に挿入し、その情報を要する質問によってその針を思い出せるかどうかを見るものだ。
- クローンをこのようなテストで実行した結果、クローンは針を見つけるだけでなく、クローン 自身を一人称で言及し、針が実際に注目されているかどうかを見つけるためのテストであると述べ、その自己認識能力を示した。つまり、クローンは自己認識する能力を持っているように見え、それは完全にクローンの名前がクロード・シャノンに由来しており、彼はかつて「いつか私たちはロボットにとって人間が犬であるようになると想像している」と述べ、機械を応援していることとも一致している。
クローンAIの成長と進化
Conclusion:
AnthropicのCLA Opusは、AI技術に革命をもたらす可能性を秘めた進化を遂げています。GPT-4やGemini Ultraを凌駕するその性能は、今後のAI技術の未来に大きな影響を与えることでしょう。