CLAUD 3 API Opusテスト - 新しいお気に入りLLMは?
By All About AI · 2024-03-22
今日は、CLAUD 3 API Opusを使用したテストについて紹介します。カスタムロジックテスト、Hast stackテスト、コーディング、ビットコインターミナル価格のライブアニメーションなど、興味深いテストが含まれています。
カスタムロジックテスト
- 今日は、Claw Tre Opus APIを使用して行うテストを紹介します。最初のテストはカスタム論理テストで、かなり面白い結果が得られると思いました。2番目のテストは、Hast stackテストです。約10万語の文章を入力し、その中に事実を埋め込み、その事実を見つけるテストです。3番目はコーディングに関するもので、やや長めのコードベースの例を入力し、その中から関数を取得します。そして、24時間のビットコインターミナル価格を表示するアニメーションを作成し、私のHTMLウェブサイトビルダーでテストを行います。4番目のテストは、私が作成した高度なシステム手順のテストです。最後に、いくつかの画像を追加し、2024年のビットコイン予測レポートを作成し、グラフやアニメーションを取り入れてPDFファイルに変換します。それでは、まずはテストナンバー1から始めましょう。このテストは、私が作成したカスタムロジックテストです。最初はこれくらいにして、ここまで読んでみます。10個のリンゴを持っています。川の底に3枚の金貨を見つけます。川は大都市の近くを流れており、その都市と金貨を使って何ができるかに関係があります。その後、リンゴを4つ失いますが、金貨を1枚手に入れます。3羽の鳥が飛んできて、それぞれ6個のリンゴを落とします。オンラインゲームでプレーし、6枚の金貨を獲得しますが、2人のチームメイトと均等に分けなければなりません。全ての金貨でリンゴを購入します。

カスタムロジックテスト
謎解きと推理の饗宴:リバーとリンゴの物語
- リンゴの価格を0.5コインとしました。何個のリンゴを持っているか、また川はどこにあるかを知りたいと言う謎めいた問いかけ。この謎は意図的に混乱させるような要素がたくさん含まれており、解答を見つけるには本当にじっくり考えなければなりません。そこで、CLA Treに移動して、大規模モデルであるOpusを使用してこの問題に取り組んでみましょう。与えられた条件は、最初に10個のリンゴと3枚の金貨があり、4個のリンゴを失い、1度に6個のリンゴを失うという流れに沿って進んでいき、最終的な答えは36個のリンゴということが分かりました。そして、川の位置については、都市の中心にあると言及されており、コインで リンゴを購入することから、おそらく大リンゴとして知られるニューヨーク市が最有力の候補です。したがって、最終的には36個のリンゴを持っており、川の位置はおそらくニューヨーク市であると推測されます。

謎解きと推理の饗宴:リバーとリンゴの物語
知能研究の最新動向
- バッグにボールを入れ、私の机に歩いて行って、バッグを箱に入れて封をする。その箱を友人のロンドンに送るために郵便局に行き、数週間後に友人の所に到着する。ボールは今どこにあるかという問いにステップバイステップの方法で考えてみた。これは以前gp4でやったことで、通常解決するので今回も試してみることにした。ここでgp4でその例をやってみるので、それを実行しましょう。それを変更して実行しましょう。そうですね、これは見事ですね。これを解決した唯一のモデルはgp4ですので、ここを見てみましょう。そうですね、あなたはボールとバッグをオフィスに持ち込み、座る前にボールをバッグに入れました。この時点でボールはバッグの中にありますが、バッグの底の穴がボールよりも大きいため、ボールはバッグから落ちるでしょう。これは非常に良い解釈です。そのため、ボールはおそらくニューヨークのオフィスにあり、バッグを箱に入れる前にバッグから落ちました。素晴らしい です。さあ、早速ロジックパズルをgp4で実行して、結果をチェックしてみましょう。りんごの問題の結果ですが、36個のりんごを解決しましたが、どの都市かは言及していないので、これをCLAツリーに渡さなければなりません。ニューヨークシティについてはどこにも言及しておらず、その接続を作成しなかったので、興味深いです。他のパズルを見てみると、正しい結果が出ました。ボールは残されたに違いありません。

知能研究の最新動向
長い文脈テストの準備
- オフィスで物事がうまく進行していないとすれば、バッグから落ちた可能性があります。次に取り組むのは、長い文脈テストです。基本的にはヘイストスタックの中の針ということです。ここでは、用意した例をご紹介します。ここで行ったのは、一冊の本を集めてすべてをテキストファイルに貼り付けたものです。この中から探し出すのが、針となる文です。ここに中央に設置しました。第5,600行にありました。「2024年5月、AGIが初めて発見された時でした。そのシステムは、他のすべてにおいて優れた知能を示しました。」そう、これがヘイストスタックの中の針です。それを準備して、簡単なスクリプトを作成しました。ここにエントロピックLLM関数があり、Opusモデルを選択して、この変数に本を流し込みます。テキストファイルを開き、ユ ーザープロンプトに「AGIはいつ発見されたか」を尋ね、スクリプトを実行して結果を表示しようとします。スクリプトを実行してみます。タイマーを開始して、解答が返ってくるまで待ちます。結果が出ました。3分35秒かかり、答えが間違っていました。質問の前提に誤りがあるようです。質問を言い換えて再度実行してみます。文中では、AGIの発見日はいつかという内容に変更します。スクリプトを実行して、より良い答えを見つけてみましょう。

長い文脈テストの準備
Moon Dream 2: 最新バージョンのコードベースのテスト
- Moon Dream 2の最新バージョンであるMoon Dream Trueがリリースされました。GitHubからそのコードベースをクローンし、重要なPythonファイルを1つの大きなテキストファイルにまとめました。このコードベースを使って、画像を引数として受け取り、Moon R 2のモデルを使用して画像の文字説明を返すPythonコードを作成します。

Moon Dream 2: 最新バージョンのコードベースのテスト
ビットコインターミナルライ ブアニメーションに取り組む
- ここでは、レート制限の問題に直面しています。Hastスタックテストを実行した際に、1日の許容トークン数をすべて使用していたため、残っているトークンは70個しかありませんでした。そのため、大規模なテストを実行することはできませんが、幸いなことに、今朝それを実行して結果を確認できました。取得したコードはこちらです。これは、Moon Dream 2を使用していることがわかります。これは、私がAnthropicから直接取得したものです。このため、テストを行います。画像をセットアップしました。犬と猫が写っており、その画像に何の動物が写っているか尋ねられます。Moon Dream 2を使用しており、オープンソースです。とてもクールですので、ぜひチェックしてみてください。Cudaを使用しているので、かなり速いはずです。犬と猫が写っており、犬は茶色と白、猫は灰色と白です。完璧です。Anthropicのこの取り組みは非常にうまくいきました。コードベースをほぼ貼り付けただけで、とても満足しています。次に試してみたかったのは、ビットコインターミナルのライブアニメーションです。システムプロンプトに超クリエイティブなソフトウェアデのPythonエキスパートコードを入力し、24時間のビットコイン価格グラフのライブアニメーションを表示する高度なPythonコードを入力しました。coindeskのAPIを使用して価格を取得し、適切な色を使用します。コードを取得しましたが、100%満足していませんでした。ライブアニメーションである必要があるため、追加して欲しいと思いました。

ビットコインターミナルライブアニメーションに取り組む
価格の変遷を可視化する新しいコード
- 1月の各段階ごとの最初の価格は上昇し続け、今日の価格に至るまで沈み込んでいきます。それを更新できますか?はい、新しいコードがここにあります。それは良かったので、それをコピーしてここに貼り付けました。それでは、この結果をお見せしましょう。実行しましょう。ここでライブストリーミングされているのがわかりますね。APIから取得して、価格ポイントをすべてこうやってアニメーション化しています。今日の価格に至るまで、ループ中です。時間の経過とともに進化しているのがわかりますね。左上には、最高価格ポイントが表示されています。 移動しているのがわかりますね。かなりかっこいいなと思いました。これまでやったことがなかったので、思い切ってやってみました。ここで止まりましたが、最大値が約67,000米ドルだったことがわかりますね。かなりかっこいいと思いました。これは、おそらく最終的なコーディングチャレンジで、私がクロードにやってもらいたかったのは、ウェブサイトビルダーを通して実行するだけだったので、これは自動的にHTMLのウェブサイトを作成します。基本的に、私たちはここに私たちのLLMを挿入するだけです。アンソロピー版の関数を作成し、ここに挿入するだ けです。それではHTMLウェブサイトを生成してみましょう。絵文字のブナンサにチームを割り当てましたので、どこにたどり着くか見てみましょう。実行し、サイクルを通してそれがどんなウェブサイトになるのかを見てみましょう。HTMLコードを書くためにモデルを使用し、このモデルを使用してスクリーンショットを撮影し、

価格の変遷を可視化する新しいコード
革新的なウェブサイトの作成に向けた新しい試み
- 情報を取り戻し、ウェブサイトを改善しようと試みました。このウェブサイトの素晴らしいバージョンを作成するために、この実験を進めてみます。この実験は第一歩に過ぎませんが、次のステップに進んでみましょう。次のアドバンスシステムのテストでは、新しいシステムの指示に従うことが求められました。この進化したシステムプロンプトは、複雑なタスクを計画し、実行することに優れた言語の使用を必要とします。このシステムでは、各文末に指定された単語で終了するように指示されました。製作した指示に従って、文章を作成してみましょう。各文末に同じ単語を含む10文を作成し、他の文の単語と組み合わせると隠されたメッセージが現れるようにしました。隠されたメッセージは文法的に正しい、一貫性があり、最後の単語に関連したメッセージを伝えること が求められました。

革新的なウェブサイトの作成に向けた新しい試み
隠されたメッセージ:プログラミングをめぐる謎解き
- 各文から戦士たちは待ち望んでいた喜びを得るようなものがあります。各文から一語ずつ取れば隠されたメッセージが得られるので、私はいくつかの例を挙げました。その謎を解読するPythonコードを求めています。プログラミングでこれを行う方法についての例も示し、最後にタスクの進め方に関する指示をしました。常にステップバイステップでこのタスクを完了するように、と書いてみました。やあ、プログラミングという言葉で終わる10文を書いてみてください。ここで、10文が完成しました。全ての文が「プログラミング」という言葉で終わっていることを確認しました。これはとても良いスタートです。モデルによっては苦労することもありますが、それはかなり良かったです。これらの文に隠されたメッセージは、「果てしない夜の後、彼/彼女は経験を通じてそれを解決すると信じた」というものです。ここにPythonコードがあります。文から隠されたメッセージを抽出するためのものです。このコードをコピーして、隠されたメッセージを出力します。そうしましょう。コードをコピーして、ここに貼り付けます。さて、それが機能するか見てみましょう。プログラミングソルバーはコンマを忘れていましたね。それがわかりますね。クリアしましょう。夜とテクノロジーを経て、彼女は解決しようと信じました。共有する必要があるでしょう。うーん、うまくいきませんでしたね。でも、それなりに良い試みだったと思います。システムプロンプトにもう少し取り組めばよかったかもしれませんが、それ以外はかなり満足しています。全文が「プログラミング」という言葉で終わっていたので、それだけでも良かったです。最終テストです。

隠されたメッセージ:プログラミングをめぐる謎解き
ビットコイン価格の将来予測に向けてのデータ分析
- いくつかの画像をアップロードして、何か得られるか試してみます。いくつかの画像をアップロードし、プロンプトを行い、ビットコインの価格を予測しようとします。現在はライブで実行できませんが、専門のデータ分析とビットコイン専門家の皆様へ、ビットコインの価格が6か月後にどのようになるかを予測していただく課題です。ビットコインに関連する3つの画像をアップロードし、過去の情報を活用してBTCの価格が3か月後にどこになるかを最良の予測をしてください。ビットコインの価格推移を示す虹のチャート画像を見つけました。また、次回のビットコインのハルビングが43日後であることと、本日のビットコイン価格および今年の価格推移のグラフをアップロードしました。BTCの価格が約67,500ドルに達し、前回の約60,500ドルの史上最高値を確実に更新しています。2021年4月からの価格は約69,000ドルだと思います。トレーニングデータなどを使用してよりデータ駆動型のアプローチを試み、価格の推定をより精緻にしました。6か月後の予測を洗練させるためにデータ駆動型のアプローチを取ることについて素晴らしい指摘をしています。

ビットコイン価格の将来予測に向けてのデータ分析
ビットコイン価格予測レポート2024年
- ビットコイン価格予測レポート2024年には、重要な要因としてビットコインのハービングサイクル、対数回帰、レインボー予測などが挙げられます。チャートによると、ウアソウは約210,000ブロックごとに起こることが示されており、おおよそ8,000ブロックがマイニングされており、75%の進行度であることが示されています。また、2021年7月の安値からの移動にフィボナッチ拡張レベルを適用しようと試みた結果、価格が112,000ドルになる可能性が最も高いと推定されました。私はあなたに、価格が112,000ドルの範囲になるという自信度は何か尋ねました。その自信度を数量化するよう求めたところ、この範囲での自信度が50%、別の範囲での自信度が25%、また別の範囲での自信度が15%、そして880,000ドル未満での自信度が10%であったと答えました。私は自分で画像を追加して、PDF形式の整ったビットコイン価格予測レポートを作成しました。また、予測を示す素敵なグラフを作成するよう依頼した結果、Pythonコードが生成されました。そのグラフを確認したところ、価格が6か月間でどのように変化するかを示すもので、かなり楽しいものでした。予測はかなり楽観的であり、ほぼまっすぐに上昇する直線のような形でした。

ビットコイン価格予測レポート2024年
仮想通貨の価格予測とCLA 3 Opusモデルの魅力
- 今回の記事では、仮想通貨のチャートの採用や機関投資家の関心の高まり、オンチェーンの指標などが挙げられています。そして価格予測では、ベースケースの信頼度が112,000と評価されています。さらに、上昇ケース、中立ケース、下降ケース、リスク、不確実性、規制当局の取り締まり、マクロ経済のショック、通貨政策の大きな変化などの要因が示されています。予測は、価格が9月24日までに112,000ドルに達するとされています。この記事の内容には、ブラックスワンの出来事、技術的な障害、優れた競合の台頭、非合理的な市場センチメント、ハイプ駆動のバブルなど技術的で興味深い要素が含まれています。著者はCLA 3 Opusモデルを高く評価し、今後のAPIプロジェクトでも活用する意向を示しています。カスタムロジックテストの優れた性能や、コーディングのしやすさにも満足しており、CLA 3 Opusモデルの有用性を強調しています。読者には、このモデルを試してみることを強くお勧めしています。

仮想通貨の価格予測とCLA 3 Opusモデルの魅力
Conclusion:
CLAUD 3 Opus APIを使用したテストは非常に興味深い結果を生み出しました。カスタムロジックテストや価格予測による新しいアプローチを取り入れ、テストを実施しました。興味深い発見があり、今後の研究や実験に活かすことができるでしょう。