1001: 以下、トリカラ速報がお届けします ID:Splatoon.net
Sonnet3.5がポケモンで遊んでもせいぜいトキワの森までしか行けなかったのに、
Sonnet3.7はクチバシティに到達してマチス倒したらしい!なんという進歩
Sonnet3.7はクチバシティに到達してマチス倒したらしい!なんという進歩
2025年2月25日にリリースされたAI「Claude 3.7 Sonnet」がポケモン垢版をプレイしマチスまで辿り着いた、以下は過去モデルとの比較グラフ
【ポケモン赤のプレイ】
— d (@d_1d2d) February 24, 2025
3 人のジムリーダー (ゲームのボス) との戦いに成功し、バッジを獲得
—
X軸:Claude がゲームをプレイする際に完了するインタラクションの数
Y軸:特定のアイテムの収集、特定のエリアへの移動、特定のゲームボスの撃破しなど、ゲーム内の重要なマイルストーン pic.twitter.com/JdBYZATM3n
Claude(クロード)とは
![]()
Claude(クロード)とは、Anthropic社が開発した大規模言語モデルを用いた対話型生成AIである。2023年3月14日に一般公開され、以降複数のバージョンがリリースされている。
https://ja.wikipedia.org/wiki/Claude
「フレンドリーで熱心な同僚」をコンセプトの一つとしている。
※現在の代表的なAIはChatGPT(大本命)、Gemini(Google)、Claude(玄人受け◎)があり
後にGrok(X)、DeepSeek(価格破壊)などのモデルが続く
1002:以下、トリカラ速報がお届けします ID:Splatoon.net
どんなパーティ編成にしたか気になる。
1003: 以下、トリカラ速報がお届けします ID:Splatoon.net
いよいよ人間のゲームがベンチマークになり始めましたね。AGIに近付いていると言うことです。
これみる限りドラクエ全てクリアしましたとかも時間の問題ですね。
※AGIとは人間並み、それ以上の知能を持ったAIで2030年には完成ほぼ確と言われている
これみる限りドラクエ全てクリアしましたとかも時間の問題ですね。
※AGIとは人間並み、それ以上の知能を持ったAIで2030年には完成ほぼ確と言われている
1004: 以下、トリカラ速報がお届けします ID:Splatoon.net
ゴミ箱ランダムなのにすごいな
1005: 以下、トリカラ速報がお届けします ID:Splatoon.net
これバトルだけじゃなくて途中のRPGパートも遂行できたってことですよね。
だとしたらゲームは確かにエージェントタスク遂行のベンチマークとして優れているのかもですね。
だとしたらゲームは確かにエージェントタスク遂行のベンチマークとして優れているのかもですね。
1006:以下、トリカラ速報がお届けします ID:Splatoon.net
たけしの挑戦状とかやらせてみたい
1007: 以下、トリカラ速報がお届けします ID:Splatoon.net
こういう面白いベンチマークもっと増えてほしいな
1008: 以下、トリカラ速報がお届けします ID:Splatoon.net
将来はAIによるRTAが開催される可能性が!?
1009: 以下、トリカラ速報がお届けします ID:Splatoon.net
わかりやすすぎる
1010: 以下、トリカラ速報がお届けします ID:Splatoon.net
最強AIの時代が来たのか…
1 件のコメント
特許ゴロ、売春所運営、詐欺企業任天堂