AI | Grayrecord Technow Blog

AIが「良かれと思って」PCを破壊する日：Claude DXT脆弱性とActiveXの共通点

ITmediaの記事「Claude拡張機能にCVSS10.0の脆弱性　現在も未修正のため注意」によると、LayerX Securityは2026年2月9日（現地時間）、Anthropicが提供する「Claude Desktop Extensions」（以下、DXT）にゼロクリック型のリモートコード実行（RCE）の脆弱性が存在すると報告しました。 Zero-Click RCE Vulnerability in Claude Desktop Extensions Exposes 10,000+ Users というLayerXの評価は、以下の通り極めて深刻なものです。攻撃難易度：最低認証：不要影響範囲：完全破壊回避策：なし権限：完全奪取即時性：ネットワーク経由で即時悪用可能これらはCVSSスコア 10.0 という、セキュリティ脆弱性評価における最悪のレベルを示しています。 1990年代、ActiveXは「便利さのために権限を渡しすぎた」ことでインターネットを危険地帯に変えました。2020年代、AIエージェントは同じ構造を、より強力かつ危険な形で再現しつつあります。今回のClaude DXTの脆弱性は、まさにその象徴と言えるでしょう。権限管理と「承認疲弊」の歴史歴史を振り返ると、テクノロジーの進化と共に「便利さとセキュリティのトレードオフ」が繰り返されてきたことがわかります。AIエージェントの問題は、過去の失敗の延長線上にあります。 1. ActiveX（1996〜）ブラウザにOSレベルの“ネイティブ権限”を渡す仕組みでした。「便利だから」という理由で広い権限が許可され、ユーザーは承認ダイアログに疲弊し、最終的にすべてを許可するようになりました。結果として、ActiveXはマルウェアの温床となりました。構造：不信頼入力 → 高権限コード実行 2. ブラウザ拡張（2000年代）ブラウザ拡張機能がファイルやネットワークへアクセスできるようになりましたが、権限の粒度が粗く、ユーザーが承認画面を精読することはありませんでした。構造：利便性のために権限境界が崩壊 3. モバイルアプリ権限（2010年代）「このアプリは連絡先・カメラ・位置情報にアクセスします」という承認フローが定着しましたが、形骸化しました。ユーザーはアプリを使いたいがために、無意識に「許可」を押すようになり、結果として個人情報の大量漏洩を招きました。構造：承認疲弊による“儀式化した許可” 4. AIエージェント（2020年代〜）そして現在、AIエージェントはカレンダー、メール、Webといった「不信頼な入力」を読み込み、LLMが解釈して行動に変換します。権限はブラウザ、ファイル操作、API実行と多岐にわたります。構造：不信頼入力 → LLMによる解釈 → 高権限アクション ActiveXの再来、しかしより危険な理由 DXTは構造的に「ActiveXのAI版」と言えます。不信頼なWebページ（入力）から、高権限コードの実行につながり、ユーザーの承認プロセスが機能しない点において、両者は共通しています。しかし、決定的な違いがあります。それは攻撃ベクトルが「コード」ではなく「自然言語（文章）」であるという点です。攻撃に「技術力」が不要になったかつてのActiveX時代、攻撃を実行するには最低限の技術力が必要でした。 COMオブジェクトやOS権限モデルの理解 JavaScriptやVBScriptのコーディングスキルつまり、攻撃者は「技術者」である必要があり、攻撃のコストと敷居はそれなりに高いものでした。一方、AI時代の攻撃（今回のDXT脆弱性など）は、その敷居を劇的に下げています。カレンダーは外部から汚染されやすい（ICSファイルは誰でも送付可能）メールから予定が自動生成される共有カレンダーには誰でも書き込める攻撃者は「カレンダーの予定に文章を書く」だけでAIを乗っ取ることが可能です。コーディングも、AIの専門知識も、LLMの深い理解も必要ありません。必要なのは「文章を書く能力」だけです。脆弱性の質的変化今回の事例と、従来の脆弱性を比較すると、その性質の違いが浮き彫りになります。 ...

System Requirements Dataset: AIモデルとデータセットの探求

AIモデルの性能評価や、新しいアルゴリズム（例えば以前取り上げたSVG: Support Vector Generationなど）の実験において、適切なデータセットの選定は極めて重要です。今回は、私がソフトウェアエンジニアリング領域の自然言語処理（NLP）タスクでベンチマークとして愛用している「PROMISE Dataset」について、その構造とAIモデルでの活用実験の経験を交えて紹介します。 PROMISE Datasetとは私がよく利用しているのは、Software-Requirements-Classification リポジトリに含まれている PROMISE.CSV です。元々は PROMISE Software Engineering Repository で公開されていたもので、ソフトウェア要件定義書のテキストデータと、それが「機能要件」か「非機能要件」か、さらに細かい分類ラベルが付与されたデータセットです。データの構造とクラス定義このデータセットは主に以下の構成になっています。 Project ID: プロジェクトの識別子 Requirement Text: 要件のテキスト（例: “The system shall refresh the display every 60 seconds."） Class: 要件の分類クラスクラス分類は以下の4つが主要なラベルとして使用されています。これらは要件エンジニアリングにおける古典的な分類に基づいています。 F (Functional Requirement): 機能要件。システムが「何を」するか。 PE (Performance): 性能要件。非機能要件の一種。 LF (Look-and-Feel): 外観・操作感。UI/UXに関わる非機能要件。 US (Usability): 使用性。使いやすさに関わる非機能要件。 graph TD Req[Software Requirement] Req --> F[Functional (F)] Req --> NF[Non-Functional] NF --> PE[Performance (PE)] NF --> LF[Look-and-Feel (LF)] NF --> US[Usability (US)] NF --> Other[Other NFRs...] AIモデルによる実験：LLM vs SVG 私はこのデータセットを用いて、いくつかのAIモデルのアプローチを試みてきました。 ...

「匿名」という名の騙し討ち：Freeeサーベイはリクナビ事件を超える最悪の「処遇AI」だ

なか2656氏のブログ記事「AIで離職予兆を可視化するFreeeサーベイを個情法・AI事業者ガイドライン等から考えた」を読んだ。これはなかなかに酷い。頭の中でサムライスピリッツの覇王丸の「あったまきたぜ」が響き渡るくらいに。これは、新たなリクナビ事件だ。いや、雇用関係という逃げ場のない檻の中で行われる分、さらに悪質と言っていい。正直、少し考えただけでも、個情法には明白に抵触 OECDの原則には明白に背信 ISMSに抵触労働契約法への抵触と、論点がボロボロと出てくる。これは単なる「不備」ではない。「背信」だ。怒りの根源：法的・倫理的な4つの背信 1. 個人情報保護法（APPI）：騙し討ちのデータ収集最も許しがたいのは、その「欺瞞」だ。第20条（適正な取得）: 「偽りその他不正の手段」による取得は禁止されている。「匿名です」「安心してください」と従業員を信じ込ませて本音を引き出し、裏ではしっかり個人識別子（従業員ID等）と紐付けて離職リスクを算出している。これを「不正の手段」と呼ばずして何と呼ぶのか。詐欺的行為そのものだ。第18条（利用目的の通知等）: 「組織改善のため」という美辞麗句の裏で、「危険分子の特定」を行っている。目的外利用（第16条）であり、明確なルール違反だ。 2. OECD AI原則：国際的価値観への冒涜世界が必死に守ろうとしている「人間中心」の価値観に対し、このシステムは泥を塗っている。原則1.2（人間中心の価値観と公平性）: 人権と自律性の尊重？笑わせる。「匿名」と嘘をついて内心を探る行為のどこに「尊重」があるのか。原則1.3（透明性と説明可能性）: 従業員は「自分のどの回答が『離職予備軍』というレッテル貼りに使われたのか」を知らされない。完全なるブラックボックスによる密室裁判だ。 3. ISMS（情報セキュリティ）：セキュリティの自殺 ISMS（ISO/IEC 27001）の観点から見ても、これは「セキュリティ事故」レベルの欠陥だ。機密性（Confidentiality）とは、「認可されていない人間に情報を見せない」ことだ。認可の不一致: 従業員は「統計データ」としての利用には同意したかもしれない。だが、「生殺与奪の権を握る上司への密告」には同意していない。アクセス制御の無効化: 本来、「匿名化」という不可逆な壁があるべき場所に、意図的な「バックドア」を設置している。セキュリティポリシーをシステム自らが破っている。これは技術的な欠陥ではなく、設計思想の腐敗だ。 4. 労働契約法：信義則違反第3条第4項（信義誠実の原則）: 「労働者及び使用者は、信義に従い誠実に…義務を履行しなければならない」。従業員の「匿名だから言える」という信頼を逆手に取り、監視と選別の道具にする。これが「信義誠実」なわけがない。これは明白な裏切り行為だ。リクナビ事件の「本質」との不気味な一致 2019年、リクナビ事件で個人情報保護委員会が断罪したのは何だったか。「本人が予期しない目的で、個人の不利益になり得るスコアリングを行い、それを売り飛ばした」ことだ。今回のケースも、構造は全く同じだ。項目リクナビ事件 freeeサーベイ（懸念）表向きの顔就職活動の支援従業員のSOS検知・ケア裏の顔内定辞退の予知（企業防衛）離職予兆の検知（企業防衛）手口 Web閲覧履歴からのスコアリングアンケート回答からのスコアリング罪深さ学生（まだ入社していない）従業員（生殺与奪の権を握られている）リクナビ事件は「まだ逃げられる」学生が対象だった。今回は「逃げ場のない」従業員が対象だ。権力勾配を利用している分、こちらの方が遥かにタチが悪い。 freeeサーベイは「処遇AI」の本丸である高木浩光氏の指摘通り、これは間違いなく「処遇AI（Treatment AI）」だ。生成AIの著作権問題なんて、極論すれば「金」の話だ。解決策はある。だが、処遇AIは「人の人生」を扱う。「あいつは辞めそうだ」というAIのレッテル一枚で、不当な配置転換や冷遇が行われるかもしれない。しかも、本人はその理由を知る由もない。「匿名」という嘘でプロセスが隠蔽されているからだ。決定の適切性も、異議申し立ての機会も、全てが闇の中だ。 ...

テクノ・オリガルヒに突きつけられた不都合な真実

WIRED誌が報じた「AIデータセンター投資が生む、米国経済の新たなひずみ」という記事は、現代のゴールドラッシュとも言えるAIブームの影の部分に光を当てています。しかし、この問題を真に理解するためには、映画『マネー・ショート』で知られる投資家マイケル・バーリー氏の警告を読み解く必要があります。バーリー氏の主張が正しければ、ハイパースケーラー各社は、将来的に巨額のネガティブ要因を財務諸表内に抱え込んでいることになります。これは、会計上の処理が「技術的な現実」と乖離した結果生じる、避けられない「時限爆弾」とも言えるものです。 💣 会計上の「時限爆弾」：減損損失のメカニズムなぜ、巨額の投資が将来の損失に変わりうるのでしょうか。その鍵は「減価償却」と「技術の陳腐化」のズレにあります。現在、多くのハイパースケーラーは、AIの学習や推論に使われるGPUサーバーの耐用年数を「6年」として設定し、その期間で費用を分割計上（減価償却）しています。しかし、AIチップの性能は2年未満で倍増するのが現実です。このギャップが、将来の「減損損失」という形で爆発するリスクを内包しています。 graph TD subgraph 会計上の世界 A[GPUサーバーを120億円で取得] --> B{耐用年数を6年に設定}; B --> C[毎年20億円ずつ費用計上]; C --> D[3年後の帳簿価額: 60億円]; end subgraph 技術的な現実 E[2年後に次世代GPUが登場] --> F[旧世代GPUの性能が相対的に低下]; F --> G[市場価値と収益性が急落]; G --> H[3年後の経済的価値: 10億円]; end subgraph 減損損失の発生 D & H --> I{帳簿価額 > 経済的価値}; I --> J[差額の50億円を「特別損失」として一括計上]; end style A fill:#f9f,stroke:#333,stroke-width:2px style J fill:#ff9999,stroke:#333,stroke-width:4px GPU資産は巨額であるため、この減損損失は単なる費用ではなく、巨額の「特別損失」として損益計算書に計上されます。その結果、その期の利益（EPS）は大きく押し下げられ、株価に深刻な影響を与える可能性があります。バーリー氏の主張は、この「会計上の先送り」が、AIブームのピークが過ぎ去った後、業界全体で一斉に発現するというシステミックなリスクを指摘しているのです。 ...

SVGの真相：32パラメータのAIは、次世代LLM（MoE）の司令塔になるか

「日本企業が、わずか32個のパラメータで大規模言語モデル（LLM）に匹敵する性能を持つ生成AIを開発。GPUは不要で、汎用CPUで動作する」――。先日、I.Y.P Consulting社から発表されたこのニュースは、多くのAI関係者に衝撃を与えました。これまでAI業界では、モデルの性能はパラメータ数と計算資源に比例するという「スケール則」が常識とされてきました。しかし、そのスケール則も実用上の壁に突き当たりつつあります。一説には、かつて存在した超巨大モデル「GPT-4.5」は、そのあまりのサイズと高額な利用価格から、ごく短期間でサービス終了に追い込まれたとも言われています。実際、その価格は入力が100万トークンあたり75ドル、出力が150ドル以上と、従来のモデルとは比較にならないほど高コストなものでした。また、GPT-5をはじめとする最新モデルが、単純な巨大化ではなく、複数の専門モデルを連携させる効率的なMoE（Mixture-of-Experts）アーキテクチャを採用していることも、この流れを裏付けていると言えるでしょう。このような「巨大化路線の限界」が見え始めた今、SVGの登場はどのような意味を持つのでしょうか。本稿では、プレスリリースの見出しの先にある学術論文の真実に迫り、話題のAI「SVG」の驚くべき真相と、ビジネスにおける本当の価値を解き明かしていきます。衝撃の発表：GPU不要の「LLM」が日本から登場？ I.Y.P Consulting社のプレスリリースや各種ニュース記事で報じられた「SVG（Support Vector Generation）」の性能は、まさに革命的でした。その主張の要点は以下の通りです。パラメータ数はわずか32個でありながら、LLMに匹敵する性能を持つ。高価な GPUを一切必要とせず、一般的なCPUでリアルタイムに稼働する。応答速度は 1ミリ秒と非常に高速。言語理解能力の国際的な指標であるGLUEベンチマークにおいて、GPTを上回る精度を達成。これらの特徴は、AI導入の障壁となっていた高コストなインフラ問題を解決する可能性を示唆し、大きな注目を集めました。しかし、この発表の根拠として提示された、国際会議へ投稿された論文を精査すると、話はより複雑で、ある意味ではさらに興味深いものになります。まず、SVGの主なターゲットタスクは、ChatGPTのような自由な文章を生成することではなく、与えられた文章を特定のカテゴリに分類するテキスト分類 (text classification) です。例えば、「この映画は素晴らしかった」というレビューを「ポジティブ」に分類するのがテキスト分類であり、「この映画のレビューを書いてください」という指示に応えて新しい文章を作成するのがテキスト生成です。両者は根本的に異なるタスクなのです。次に、最もセンセーショナルな「パラメータ数はわずか32個」という主張。これは従来のニューラルネットワークにおけるパラメータとは意味が異なります。論文を読み解くと、この数字はLLMのモデルサイズを示す「重み」の数ではなく、分類の境界線を定義するために使われる最も重要なサンプル文（サポートベクトル (support vectors) ）の数を指している可能性が極めて高いです。これはモデルの規模ではなく、特定の分類問題の「複雑さ」を示す指標と言えます。そして、「GPTを上回る精度」という点も、より正確な理解が必要です。論文の実験結果（Table 2）によれば、SVGが上回ったのは、ファインチューニングされた最新のGPTモデルではなく、特定のゼロショット学習手法（プロンプティング (prompting) ）というベースラインです。これは大きな成果ですが、あらゆる面でGPTを超えたと解釈するのは早計です。 SVGの核心技術：「言語をカーネルとして使う」という新発想では、SVGはどのようにしてこれほど軽量でありながら高い分類性能を実現しているのでしょうか。その核心は、論文タイトルでもある「Language as Kernels（カーネルとしての言語）」という革新的なアプローチにあります。SVGはLLMを代替するのではなく、いわば巨大なLLMの『脳』の一部を借りてくる、共生関係にも似た新しいアプローチなのです。この仕組みを具体的に見てみましょう。まず、SVGに「ポジティブなレビュー」と「ネガティブなレビュー」の例を少数与えます。するとSVGは、GPT-4.1のような強力なLLMを、新しいレビューを書かせるためではなく、「類似性判定の審判」として利用します。新しい文章が入力されると、LLMに「この文章は、私が知っているポジティブな例とどれくらい似ていますか？ネガティブな例とはどうですか？」と問いかけ、その類似度スコアをテキスト埋め込み (text embeddings)という形で受け取ります。最後に、この類似度マップを、古くから知られる超高効率なアルゴリズムであるサポートベクターマシン (Support Vector Machine) に入力し、最も効果的な分類の境界線を引かせるのです。しかし、SVGの真の独創性はここからさらに一歩進みます。その名の「Generation（生成）」が示す通り、SVGは単に既存のサンプルを使うだけではありません。論文で述べられているように、マルコフ連鎖モンテカルロ（MCMC）法という手法を用いて、分類の境界線をより明確にするための新しい、高品質なサンプル文（サポートベクトル）を自動的に生成するのです。これは、選挙の情勢調査員が、既存の有権者の意見を使うだけでなく、両党の支持を分ける境界線を正確に見つけるために、絶妙な特徴を持つ「仮想の有権者プロフィール」を巧みに作り出すようなものです。SVGはこれを言語で行い、わずかな初期データから極めて精度の高い分類器を構築することを可能にしています。論文では、このアプローチの理論的正当性について次のように述べられています。本研究では、このパラドックスを解決すべく、カーネルマシンという機敏で洗練されたパラダイムを導入します。本稿では、ゼロショット学習とカーネルマシンが数学的に等価であることを示す、説得力のある証明を提示します。査読プロセスで明らかになった課題この有望に見えるSVGですが、その根拠となった論文「Language as Kernels」は、トップレベルのAI国際会議であるICLR 2024において不採択（Reject）となっています。査読プロセスにおいて、複数の専門家からいくつかの重要な懸念が示されました。新規性と貢献の不明確さ: 既存研究との比較が不十分で、このアプローチが持つ独自の貢献が何であるかが明確ではない。実験評価の限定性: 実験が小規模なデータセットに限定されており、より大規模で多様なタスクにおいてその有効性が実証されていない。主張の妥当性への疑問: 「CPUで動作する」と主張しながら、実験ではOpenAIのAPI（外部のGPUリソースを多用する）が利用されており、主張と実態に乖離がある。これらの指摘は、SVGがまだ研究開発の途上にある技術であり、その性能や実用性については、プレスリリースが示唆するほど確立されたものではないことを意味します。 SVGが持つ「本当の強み」：速度、コスト、そして説明可能性では、SVGは単なる誇大広告なのでしょうか。論文が発展途上であるという事実は、その価値を損なうものではありません。むしろ、SVGが「ChatGPTの代替ではない」からこそ、特定のビジネス用途においてLLMを凌駕する強力なメリットをもたらす可能性を秘めています。圧倒的なスピードと低コスト (Overwhelming Speed and Low Cost) 最終的な意思決定を担うSVMのアーキテクチャが非常にシンプルであるため、CPU上でも驚異的な速度で動作します。これにより、高価なGPUインフラへの投資が不要となり、運用コストを劇的に削減できます。 ...