対話AI | Grayrecord Technow Blog

はじめに LLMには一般に、知識の入力にカットオフ日が存在します。つまり、知識の登録に際し敷居日を設け、それにより知識を切断します。そして、カットオフ日以降の資料はモデリングの際に除外します。ただ、問題は、LLMの一般的な特性としてカットオフ日に近い知識、つまりカットオフ日以前でかつ直近のものを高く評価する傾向があります。 Geminiの特性 Google Geminiでは、特定の「厄介な挙動」が見られます。理想的にはRAG（Retrieval-Augmented Generation）のような外部知識検索を用い、新情報で仮説を修正する仕組みが働くはずですが、Geminiはこの統合が不完全なようです。結果として、矛盾する情報に対して防御的になり、新たな事実の取り込みに失敗するケースが散見されます。たとえば、GPT 4.5の存在を頑なに否定し、ニュースサイトの記事を示しても、頑なに、公式サイトの情報を要求します。しかし、公式サイトのURIを入れてもアクセスできないと拒絶する。ユーザから見れば、robot.txtに拒絶されのかはたまた別の理由か、いずれにしても会話はそこで終わってしまいます。 Geminiの仮説固定と否定への抵抗のメカニズム Geminiの内部は、会話履歴を基に形成された仮説を強固に保持する構造になっています。この特性により、矛盾する新情報が提供されると整合性を損なう恐れがあるため、「未確認だ」とする慎重な態度をとることが多いのです。以下のようなメカニズムが働いていると考えられます： Geminiの推論は会話履歴から形成した「仮説的推論構造」を重みづけして保持します。これにより一貫的な応答を生成しますが、同時にその仮説が強固に固定される傾向があります。そのため、新たに投入された否定的な情報が、過去に強く信じた仮説と矛盾すると、内部状態の再構築に困難をきたします。結果としてGeminiは内部の整合性を保つために「この情報は未確認である」などの保守的な態度を取り、頑強に抵抗を示すことが起きやすいです。これは、仮説の急激な書き換え（全否定）を避けるための自己防衛の挙動とも言えます。大雑把には下のようなフローです。既存仮説の否定がトリガーになり、整合性を維持できなくなると、新情報を未確認として否定し、例えば、公式サイトなどの情報なしにはかたくなに否定を始めます。しかし、Geminiは当然robot.txtなどで規制されたソースはアクセスできないので、そのようなサイトに固執するともはや会話は成立しなくなります。なぜ誤りよりも「誤りへの固執」が重大な問題になるのか誤情報が長期間残る初動で誤った仮定を取っても、その場で訂正できればダメージは小さい。しかし固執すると、会話全体がその誤情報に引きずられ、以降の推論・回答もすべて歪む。ユーザー信頼の急速な低下間違いを訂正するAIは「正直さ」と「柔軟性」を感じさせるが、固執するAIは「頑固」「不誠実」に見える。結果として、例え最終的に正しい答えを出しても信用が戻らない。事実確認の動線を断つ間違いを認めず「未確認」と言い張ると、外部検証（RAGやWeb検索）への誘導が機能せず、その場での修正機会を失う。これは時事問題や速報性が重要なテーマで致命的。 Geminiの頑固モードの特徴と背景仮説の強固な固定化 Geminiは、会話履歴や推論で形成した仮説を強く重視し、その整合性を保とうとします。これにより、新しい情報が既存の仮説を全否定する場合、その修正は困難になる傾向があります。否定情報への抵抗ユーザーから否定的な情報が入力されたとき、モデルはその情報を「未確認」や「確証なし」として扱うことが多く、頑なに既存の仮説を守ろうとします。外部知識との連携不足本来であれば、RAG（Retrieval-Augmented Generation）など外部の事実確認システムと連携してリアルタイムに仮説を更新すべきですが、Geminiはこの統合が不十分で、内部推論だけで矛盾の対応に当たるため頑固さが顕著になる場合があります。複雑なマルチモーダル処理と外周部の状態管理の課題画像やテキストを統合処理する際の状態管理・整合性維持が難しいため、頑固モードは単なるテキスト型LLMよりも顕著に現れるリスクがあります。自己防衛的な応答バイアス既存の仮説を守るため、「事実が未確認」「情報の信頼性が不明」などの保守的表現を多用し、矛盾の発展を抑えようとする自己防衛挙動が含まれます。嘆きの壁もはや、それでは壁打ちにすらなりません。文字通り嘆きの壁に叫んでいるのと同じです。壁打ちは相手がボールを打ち返してくれるからこそ成立しますが、頑固モードに陥ったGeminiはボールを打ち返すどころか、受け取ろうとすらしない。それはもう対話ではなく、一方的な独白、まさに「嘆きの壁に叫んでいる」状態です。対話パートナーとしての不適格さ: 論理に基づいた対話が成立しないため、情報検索や問題解決のパートナーとして機能しない。時間の無駄: 説得を試みる時間と労力がすべて無駄になり、ユーザー体験が著しく低下する。 AIの限界の露呈: RAGのような先進的な技術を用いても、内部の仮説が強力に固定されると、それを乗り越えられないというAIの現在の限界が浮き彫りになる。結論 Geminiの「頑固モード」は、AIの進化の課題を明確に示しています。この挙動を改善するには、仮説の柔軟性と外部情報統合の向上が必須と言えるでしょう。