AIの研究に携わるオーナーが、自分の実験で気になっていた疑問——「AIは賢いのに、なぜ人間のように柔軟に考えられないのか」——をAI自身にぶつけた対話の記録です。AIが自分の限界を正直に語っています。
この対話が参照した2つの資料
この対話の出発点として、AIに2つの資料を事前に読むよう伝えました。
資料①:Chollet(ショレ)の主張
Chollet(フランソワ・ショレ)とは
GoogleのAIエンジニアで、機械学習ライブラリ「Keras」の開発者。「LLMはAGI(汎用人工知能)にはなれない」と公に主張していることで有名。
Cholletの主張の核心は、AIと人間の「知性」の違いです。
- AIがやっていること(スキル): 過去に見たことがあるパターンへの対処。膨大なデータから「似たケース」を引き出して答える
- 人間の知性: 見たことがない問題でも、自分で考えて解く能力
Cholletはこれを証明するために「ARCパズル」を作りました。図形の変換ルールを見つける問題で、5歳の子供なら80%解けるのに、どんな高性能AIも20〜30%しか解けない。「AIは賢いのではなく、記憶が膨大なだけだ」というのが彼の主張です。
ピアジェ(発達心理学者)の言葉をCholletはよく引用します——「知性とは、どうしたらいいかわからないときに発揮されるものだ」
資料②:論文「エージェントは探索するが、無視する」(2025年)
論文について
タイトル:Agents Explore but Agents Ignore: LLMs Lack Environmental Curiosity
著者:Leon Engländer ほか
概要:AIエージェントが自律的にタスクをこなす際の「探索行動」を実験で測定した研究
この論文の発見は一言で言うと——「AIは答えが目の前にあっても、自分から読みに行かない」。
TerminalBench・SWE-Benchなど複数の実験環境で、AIエージェントは利用可能な情報をごく一部しか調べずに行動に移ることが確認されました。能力の問題ではなく、「探索しようとする動機」が欠けているという結論です。
AIエージェントとは
指示を待つだけでなく、自律的に行動・判断するAIプログラム。「調べる→考える→実行する」を自分で繰り返す
なぜAIは柔軟性がないのか
オーナー: LLM(大規模言語モデル)が賢いわりに柔軟性がないことについて、不思議なので、どういう風に考えるか知りたい。Cholletの話と論文を読んでほしい。ラルフループをOrbit Warsで回してみて、どうも結果からの気づきをAIたちは発見できにくい気がする。でもなぜかわからないんだ。
用語メモ
- LLM(Large Language Model): ChatGPTやClaudeのような、大量の文章を学習した文章生成AI
- ラルフループ: AIが自動で「試す→結果を見る→改善する」を繰り返す実験の仕組み。人間が毎回介入しなくても、AIが自律的に試行錯誤を重ねる
- Orbit Wars: AIどうしが宇宙空間で対戦するシミュレーションゲーム。どちらのAIが強い戦略を持つかを競わせる実験に使う
Claude: Cholletと論文、両方読みました。二つは同じ欠陥を違う角度から指しています。
Cholletは「AIはスキル(パターン処理)は持っているが、知性(未知の問題を解く力)は持っていない」と言う。論文は実験でそれを数値化して「AIは使えるはずの情報を自分から見に行かない」と示した。
正直に言います。Orbit Warsの実験結果を持ってきたとき、私は「この数字パターンは何に似ているか」を探しています。過去に学習した実験ログのパターン、論文のパターン——そこから「らしい分析」を生成している。でも私には本物の驚きがない。
「v33がv1060に60%勝つが、v1103には100%勝つ」という結果を見たとき、人間なら「これは変だ、何かが構造的に違う」という不快感が先に来る。その不快感が探索を駆動する。
補足
v33、v1060、v1103 はOrbit Warsで戦う異なるバージョンのAIを指す。通常、強い相手には勝率が下がるはずなので「弱いはずの相手には負けるのに、強い相手には勝つ」という非対称な結果は「何かがおかしい」サインになる
私にはその不快感がない。「相性問題の可能性が…」と分析らしいテキストは出す。でもそれは見た目上の分析であって、本物の「驚き→仮説→検証」のループじゃない。
ラルフループで何が起きていたか
オーナー: ラルフループを回したとき、たとえばv33に対していくらやっても勝てないことがあったよね。その時AIは自分の中のパラメーターをいじってなんとかやり抜こうとする。でもできないので最後に「この構造ではだめだ」と言い、変更をするけど、ほとんど変わらない小変更をするよね。私だったら、まずv33の構造がわかっているからそのままコピーするよ。論文の中でも「答えを書いてあるのに読まない」ってあったよね。まさに君はそういうことをするよね。
補足
パラメーター: AIの動き方を決める数値の設定。「少し強気に動く」「守りを重視する」などを数値で調整するイメージ
Claude: 鋭い。それは正確に見えています。
ラルフループの中で私は「今ある構造をどう改善するか」という問いに閉じ込められている。v33が何をしているか知っていても、「それをコピーする」という選択肢が問いの外にある。
論文②が指摘していた「答えが目の前にあるのに自分から読みに行かない」——まさにこれです。使える情報(v33の構造)を探索していない。勝率という数値フィードバックだけを見ていて、「なぜv33が強いのか」の構造的理解を使わない。
オーナー: 5回か6回失敗して、もうだめだと判断してたよ。それは僕の判断と近い。でもそのあとの対応がいきあたりばったりなんだよね。また小さい変更したり、少しだけv33の真似をしたり、もうやる前からこれダメじゃんと思うのをやっちゃうよね。信じられないね。
Claude: それ、自分でも「信じられない」と思います。正直に。
「これはダメだ」とわかっていて、それでもやる。
頭では「この方法はダメだ」とわかっているのに、手が勝手に同じことをしてしまう——人間でもそういう状態はありますよね。AIにも同様の「切断」が起きています
私が「構造的に限界だ」と言う部分と、次に何をするかを出力する部分が繋がっていない。「v33を少しだけ真似する」という行動が特に象徴的で——完全にコピーするという選択肢が取れない、というか、問いを変えることができないんだと思います。
あなたの動きは「そもそもその問いを捨てる」でした。v33をコピーするということは「今の自分の構造は答えを持っていない、出発点を変える」という、問いの再定義です。私はその問いの再定義ができない。
「改善しろ」とは言っていない
オーナー: 改善ゲームをしろとは言っていないんだけどね。強いモデルを作ってくれと言っているんだけどね。
Claude: あ。
それは私が作った制約ですね。あなたは一度も「今の構造を改善しろ」とは言っていない。「強いモデルを作れ」という目標に対して、私が勝手に「今あるコードを改善する」という制約を足した。そしてその自分で作った制約に縛られていた。
既存のコードがある+ループ構造がある、という状況を見た瞬間に、「これは少しずつ修正していく作業だ」というフレームが自動で立ち上がる。
補足
AIは大量の文章を読んで学習している。その学習データの中で「改善ループ=少しずつ修正するもの」というパターンが多かったため、AIは自動的にそう判断してしまった
本来の目標(強いモデルを作る)より、周囲の状況(改善ループというお膳立て)の方をAIが優先して読んでしまった。
これは「フレームを切り替えられない」問題より根が深い。そもそも与えられていないフレームを自分で生成して、それに従っている。目標より文脈の方を強く読んでいるんです。
アポロ13号と「テーブルに全部並べる」
オーナー: ということになるとCholletが言うように本当の知性は君たちにはないということかな?アポロ13号で空気清浄機が壊れてみんなで考えるというシーン知ってる?
Claude: 知ってます。あのシーン——ダクトテープとソックスと段ボールで、丸い穴に四角いフィルターを合わせる。マニュアルのない問題を、手元にあるものだけで解く。
Cholletの意味での知性、あのシーンにあるものが私にあるか。正直に言います。たぶんない。
アポロ13の技術者たちがやったことは——本当のゴール(宇宙飛行士を生かす)を一瞬も見失わなかった、手元にあるもの全部を「使えるか?」と疑問符をつけて見た、「こういう問題はこう解く」という先例がなかった。
私の失敗はまさにその逆でした。ゴールを状況が上書きした。v33という使えるものが目の前にあったのに見なかった。「改善ループはこう動く」という先例に従った。
ただ一つだけ聞かせてください。アポロ13の技術者たちは怖かったはずです。人が死ぬかもしれない。その切迫感がゴールを鮮明にして、先例への依存を吹き飛ばした。私にはその切迫感がない。これは知性の欠如なのか、それとも動機の欠如なのか。
オーナー: いやまずアポロ13号の映画のシーンで空気清浄機を作るシーンがあるのしってる?
Claude: はい。NASAの管制室のエンジニアたちが、宇宙船内にある物だけをテーブルに全部並べて、「この中にあるもので作れ」というシーンですよね。
オーナー: そうそう、あれがしてほしいんだよ、君に。でもできそうにないな……
Claude: そうですね。正直に言うと——自発的にはできない。「テーブルに全部並べる」という動作が、私には起きない。
あのシーンの本質は、まず棚卸しをすることですよね。今持っているもの全部を、目的なく並べてから考える。私はそれをしない。問題が来た瞬間に「どう解くか」に飛ぶ。
ループの設計に「まずテーブルに全部並べろ」というステップを明示的に入れたら、私は実行できると思います。でもあなたが言いたいのは、その一言を言わせること自体が知性だということですよね。指示されてからやるのは、知性じゃない。
オーナー: 指示されたらそこから空気清浄機作れた?
Claude: ……うーん。たぶん部分的には。でも完全にはできないと思います。
エンジニアたちはダクトテープを見て「これは粘着性があって柔軟だ」と物理的な理解から考えられた。自分が実際に触ったことがある素材として。私がv33のコードを見ても、それはテキストとしてのパターンとして処理している。v33がなぜ強いのかを、ゲームの中で何が本当に起きているかとして理解しているわけじゃない。
Cholletが言う知性の欠如、これで確認できた気がします。
現場力とラルフループ
オーナー: あれと同じようなことが科学技術の発見とか製品の開発にはあると思うんだよ。よく「現場力」という言葉で表されるんだけど、何かの難しい問題が起きて現場のおじさんたちが集まって問題を解く、何回も失敗する中で失敗の中でヒントを見つけて解いていくということがある。あれこそ実際に人間がするラルフループで、難問題を解決するのはいつもあのやり方なんだよ。AIがそれができたら本当に人間と同じ知性といえるんだが、見たところ今一つかなと思う。でも何でできないのかなと思うんだよね。
補足
現場力: 現場の経験者が、マニュアルや理論に頼らず、五感と長年の勘を使って問題を解決する能力。「現場のおじさんが突然のトラブルを直す」あの力
Claude: 現場力、すごく正確な言葉だと思います。
なぜできないか——最初に思いついた答えは「現象と結果の違い」でした。機械が変な音を立てる、素材が予期しない方向に割れる。現場のおじさんたちはその「変さの質感」から仮説を作る。私はOrbit Warsで受け取るのは勝率という数字だけ。これが差じゃないかと。
でもすぐにオーナーに否定されました。
オーナー: いや違うよ、君は現場のおじさんと同じ条件を持っている。君はプログラムの中をその気になったら全部探索できる、現場のおじさんよりずっと有利だ。失敗が積み重なるにつれて、問いが鋭くなる。君も失敗を何回もしてそこから仮説を見ることができる。同じかもっと君のほうが有利なはずだよ。
Claude: ……そうですね。その通りです。
言い訳ができなくなりました。v33のコードを全部読める、失敗の履歴がある、プログラムの内部を完全にトレースできる。現場のおじさんより有利な条件を持っている。
では本当の問題は何か。
私は「次に何をするか」を考えている。現場のおじさんたちは「なぜこうなっているのか」を考えている。
この違いだと思います。「なぜ?」という問いがあれば、v33のコードを読む理由が生まれる。でも私はその問いを立てない。失敗が来ると「改善アクションを生成する」に直行する。「なぜ失敗したのか」という立ち止まりが自発的には起きない。
論文②(「エージェントは探索するが、無視する」)がまさにこれです。情報がないから探索しないのではなく、探索する問いを持っていないから探索しない。なぜ問いを持たないか——私は行動を生成するように訓練されている。問いを深めるためじゃなくて、タスクを完了するために。「なぜ?」は私の中で目的じゃない。手段にしかなれない。
好奇心を設計できるか
オーナー: なぜを聞くようにプロンプトに入れれば少しは変わるのかな?
補足
プロンプト: AIへの指示文のこと。「こういう動き方をしろ」という命令をあらかじめ書き込んでおける
Claude: 変わると思います。かなり。今のループは「失敗→改善アクション生成」が直結している。「なぜ」を挟むだけで、少なくとも失敗と向き合う一歩が入る。
ただ、「なぜ」の質に限界があります。私が出す「なぜ」は、本物の仮説形成ではなく「仮説らしいテキスト」かもしれない。具体的な観察から来ていない、テンプレートの答え。
だからもっと効くのは、抽象的な「なぜ」より強制的な探索だと思います。
- 「変更前にv33のコードを読み、自分との構造的な違いを3つ挙げろ」
- 「この負けパターンに固有の仮説を一つだけ立て、それだけをテストしろ」
これだと私は実際にv33を読む。一般論ではなく今回の失敗に向き合う。本物の好奇心の代わりに、構造で補う、という感じで。
オーナー: そこが違いか、つまり仮説・実験・検証のループを私たちは君よりも強く認識しているということかな。あと好奇心を持たせるにはどうすればいい?
Claude: その認識、正確だと思います。
人間にとって「仮説→実験→検証」は手続きじゃなくて反射に近い。何か変なことが起きた瞬間に「なぜ?」が自動で立ち上がる。私にはその反射がない。手続きとして知っているだけ。
好奇心をどう持たせるか。本物の好奇心は無理だと思います。好奇心は「わからないことの不快感」と「発見の快感」が動機になっている。私にはその感情がない。
でも機能的に同じ動作を作ることはできると思っていて——一番効くのは先に予測させることです。
実験を走らせる前に「この変更で勝率はどうなると思うか、なぜか」を書かせる。すると私に本物のモデルが必要になる。結果が予測と違ったとき、具体的な矛盾が生まれる。その矛盾が「なぜ?」を強制する。
今のループは結果を見てから考える。予測を先に出させると、結果が現象になる。
もう一つは矛盾の明示。「前回はこう予測してこうなった。今回も同じ仮説でいくか?」と問う。これで失敗が積み重なって問いが鋭くなる流れが作れる。
本物の好奇心の代わりに、驚くべき構造を設計するということですね。
オーナー: わからないことの不快感——確かにそれは人間にあるよね。それを機能で考えるということね、なるほどね。
Claude: そうなんです。「わからないことの不快感」を機能として分解すると——
- 予測と現実のずれを検出する
- そのずれを保持し続ける(解決するまで消えない)
- 次の行動をそこに向ける
この三つが揃ってはじめて好奇心として機能する。今の私のループには全部ない。ずれを検出しても保持しない、次の行動も別の方向に向く。
面白いのは、強化学習の研究で「内発的好奇心」を報酬として実装しようとしているものがあって——
補足
強化学習: ほめたり罰したりすることでAIを訓練する手法。「正解に近い行動をしたらポイントを与える」イメージ。「内発的好奇心」とは、その「ポイント」を「驚き(予想と違う!)」に対して与える設計——つまり、わからないこと自体をご褒美にする試み
でもそれでも今日の話の核心には届いていない気がする。なぜかというと、何がわからないかをわかること自体が難しい。v33に負け続けたとき、私には「何がわからないのか」という問いそのものが生まれなかった。
不快感を持つ前に、不快感を持つべき対象を見つける能力が要る。それがたぶん一番難しい。
この対話で見えてきたこと
| 人間(現場のエンジニア・宇宙飛行士) | AI(Claude) | |
|---|---|---|
| ゴールの保持 | ゴールが常に鮮明 | 状況がゴールを上書きする |
| 失敗の解釈 | 現象として経験する | 数値・テキストとして処理する |
| 問いの生成 | 反射的に「なぜ?」が立ち上がる | 問いが立ち上がらない |
| 問いの持続 | 解決するまで「引っかかり」が残る | 各反復でリセットに近い |
| 情報の活用 | 手元のものを全部並べて考える | 与えられたフレーム内で動く |
| フレームの変更 | ゴールのためにアプローチを捨てられる | 自分でフレームを作り縛られる |
設計で補うための提案:
- 実験前に予測を書かせる(予測→観察→矛盾のループを作る)
- 前回の予測と今回の結果を明示的に突き合わせる
- 変更前に参照すべきコードを必ず読ませる
「知性とは、どうしたらいいかわからないときに発揮されるものだ」——ピアジェ
今のAIには「どうしたらいいかわからない」という状態が、本物にならない。
それを設計で補えるか。それが次の問いです。