AIのように急速に変化する業界に追いつくのは至難の業です。AIがあなたの代わりにそれをこなしてくれるようになるまで、機械学習の世界における最近の話題や、私たちが単独では取り上げなかった注目すべき研究や実験をまとめてご紹介します。
今週は、AIスタートアップ企業OpenAIをめぐる経営陣をめぐる論争から目を背けることは不可能だった。筆者自身も含め、睡眠不足の脳にはひどく落胆させられた。取締役会は、CEO兼共同創業者のサム・アルトマン氏を解任した。その理由は、安全性を犠牲にしてAIを商業化しようとしたという、アルトマン氏の誤った優先順位設定が理由とされている。
アルトマン氏は、OpenAIの主要支援者であるマイクロソフトの尽力もあって、CEOに復帰し、取締役会の大半も交代した。しかし、この騒動は、OpenAIのように大規模で影響力のあるAI企業でさえ、収益化を目的とした資金源に手を出す誘惑がますます強まる中で、いかに危険な状況に陥っているかを如実に示している。
AIラボが、商業志向で利益を渇望するベンチャー企業や巨大IT企業と必ずしも結びつきたいわけではない 。AIモデルのトレーニングと開発にかかる莫大なコストが、この運命を避けることをほぼ不可能にしているのだ。
CNBCによると、OpenAIの主力テキスト生成AIモデルGPT-4の前身であるGPT-3のような大規模言語モデルの学習には、400万ドル以上の費用がかかる可能性があるという。この推定には、高額な給与を得ているデータサイエンティスト、AI専門家、ソフトウェアエンジニアの雇用コストは含まれていない。
多くの大規模AIラボがパブリッククラウドプロバイダーと戦略的契約を結んでいるのは偶然ではありません。AIモデルの学習用チップが不足している時代(Nvidiaなどのベンダーに有利な状況)において、コンピューティングはこれらのラボにとって金よりも価値のあるものとなっています。OpenAIの最大のライバルであるAnthropicはGoogleとAmazonの両社から投資を受けており、一方Character.aiはGoogle Cloudの支援を受けており、Google CloudはCharacter.aiの独占的なコンピューティングインフラプロバイダーでもあります。
しかし、今週の出来事が示したように、こうした投資にはリスクが伴います。巨大テック企業はそれぞれ独自の思惑を持っており、その意図を汲み取るために、様々な影響力を行使しています。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
OpenAIは、投資家の総収益を制限する独自の「利益上限」構造によって、ある程度の独立性を維持しようと試みました。しかし、マイクロソフトは、スタートアップを統制する上で、コンピューティングが資本と同等の価値を持つ可能性があることを示しました。マイクロソフトのOpenAIへの投資の多くはAzureクラウドクレジットの形で行われており、これらのクレジットを差し控えるという脅しは、どの取締役会の注目を集めるのに十分でしょう。
公共のスーパーコンピューティング資源やAI助成金プログラムへの投資が大幅に増加しない限り、現状はすぐには変化しそうにありません。ある程度の規模のAIスタートアップは、他の多くのスタートアップと同様に、成長を望むならば自らの運命を委ねざるを得ません。OpenAIとは異なり、彼らが悪魔と取引を交わすことを期待したいところです。
ここ数日間で注目されたその他の AI 関連ニュースは次のとおりです。
- OpenAIは人類を滅ぼすつもりはない: OpenAIは「人類を脅かす」可能性のあるAI技術を発明したのだろうか?最近のニュースの見出しを見ると、そう思いたくなるかもしれない。しかし、専門家によると、心配する必要はないという。
- カリフォルニア州、AI規制に着目:カリフォルニア州プライバシー保護局は、AIへのガードレール設置という新たな戦略を準備している。ナターシャの報道によると、同州のプライバシー保護当局は最近、欧州連合(EU)の既存規則を参考に、AIにおける個人情報の利用方法に関する規制案を公表したという。
- BardがYouTubeの質問に答える: Googleは、AIチャットボット「Bard」がYouTube動画に関する質問に答えられるようになったと発表しました。Bardは9月にYouTube拡張機能をリリースした際に既にYouTube動画を分析する機能を備えていましたが、今回新たに動画の内容に関する質問にも具体的な回答を提供できるようになりました。
- XのGrokがリリース間近: xAIのチャットボットGrokがXのウェブアプリに登場したスクリーンショットが公開された直後、Xのオーナーであるイーロン・マスク氏は、今週中にGrokが同社のPremium+会員全員に提供される予定であることを確認しました。マスク氏の製品提供時期に関する発言は必ずしも正確ではありませんでしたが、Xアプリのコード開発状況から、Grokの統合が順調に進んでいることがわかります。
- Stability AIが動画生成ツールをリリース: AIスタートアップ企業Stability AIは先週、既存の画像をアニメーション化することで動画を生成するAIモデル「Stable Video Diffusion」を発表しました。Stability AIの既存のテキスト画像変換モデル「Stable Diffusion」をベースにしたStable Video Diffusionは、オープンソースで、あるいは商用でも利用可能な数少ない動画生成モデルの一つです。
- AnthropicがClaude 2.1をリリース: Anthropicは先日、主力の大規模言語モデルであるClaude 2.1をリリースしました。これはOpenAIのGPTシリーズとの競争力を維持するための改良版です。Devin氏によると、Claudeの最新アップデートには、コンテキストウィンドウ、精度、拡張性の3つの主要な改善点が含まれています。
- OpenAI とオープン AI:ポールは、OpenAI の失態によって、急成長する AI 革命をコントロールする勢力にスポットライトが当てられ、中央集権的なプロプライエタリ プレーヤーにすべてを賭けたらどうなるのか、そしてその後に破綻したらどうなるのか、という疑問が多くの人に生まれたと書いています。
- AI21 Labsが資金調達: OpenAIのGPT-4やChatGPTに倣った生成AI製品を開発するAI21 Labsは先週、5,300万ドルを調達し、累計調達額は3億3,600万ドルに達した。テルアビブを拠点とするスタートアップ企業で、様々なテキスト生成AIツールを開発するAI21 Labsは、Mobileyeの共同創業者であるアムノン・シャシュア氏、オリ・ゴシェン氏、そしてもう一人の共同CEOであるヨアブ・ショハム氏によって2017年に設立された。
さらなる機械学習
AIモデルが自信のある答えを出すために、より多くの情報が必要なタイミングについて、より率直に理解できるようにするのは難しい問題です。なぜなら、モデルは実際には正しいことと間違っていることの区別がつかないからです。しかし、モデルの内部の仕組みを少しだけ公開することで、嘘をついている可能性が高いタイミングをより正確に把握できるようになります。

パーデュー大学によるこの研究は、ニューラルネットワークが視覚概念をベクトル空間でどのように表現するかを示す、人間が判読可能な「レーブマップ」を作成する。類似していると判断された項目はグループ化され、他の領域との重なりは、それらのグループ間の類似性、あるいはモデル側の混乱のいずれかを示している可能性がある。「私たちが行っているのは、ネットワークから出力されるこれらの複雑な情報セットを扱い、ネットワークがマクロレベルでデータをどのように捉えているかを人間に理解してもらうことです」と、主任研究者のデイビッド・グレイヒ氏は述べた。

データセットが限られている場合は、そこからあまり推測しない方が良いでしょう。しかし、どうしても推測しなければならない場合は…ロスアラモス国立研究所の「Senseiver」のようなツールが最適かもしれません。このモデルはGoogleのPerceiverをベースにしており、少数のまばらな測定値を取得し、そのギャップを埋めることで(どうやら)驚くほど正確な予測を行うことができます。
気候測定やその他の科学的データ、あるいは高高度スキャナーで作成された低忠実度地図のような3Dデータなどにも適用できます。このモデルはドローンなどのエッジコンピューター上で実行可能で、単にデータを読み取って後で分析するのではなく、特定の特徴(今回のテストケースではメタン漏れ)を検索できるようになるかもしれません。
一方、研究者たちは、これらのニューラルネットワークを動かすハードウェアを、ニューラルネットワークそのものに近づける研究を進めています。彼らは16個の電極アレイを作り、それを導電性繊維の層で覆い、ランダムながらも均一な密度のネットワークを作り上げました。繊維が重なり合う部分では、様々な要因に応じて、接続を形成したり切断したりすることができます。これは、ある意味で、私たちの脳内のニューロンが接続を形成し、その後、その接続を動的に強化したり切断したりするのとよく似ています。
UCLAとシドニー大学の研究チームによると、このネットワークは手書きの数字を93.4%の精度で識別できたとのことで、これは同規模の従来の手法を凌駕する結果でした。確かに興味深い成果ですが、実用化には程遠い状況です。しかし、自己組織化ネットワークはいずれツールボックスに組み込まれる可能性は高いでしょう。

機械学習モデルが人々の役に立っているのを見るのはうれしいことです。今週はその例をいくつかご紹介します。
スタンフォード大学の研究者グループは、難民や移民がそれぞれの状況やスキルに合った適切な場所を見つけるのを支援する「GeoMatch」というツールの開発に取り組んでいます。これは自動化された手続きではありません。現在、これらの決定は配置担当官やその他の職員によって行われており、彼らは経験豊富で情報に精通していますが、必ずしもその選択がデータに裏付けられているとは限らないのです。GeoMatchモデルは、いくつかの特性を考慮し、その人物が安定した雇用を見つけられる可能性が高い場所を提案します。
「かつては複数人が何時間もかけて行っていた調査が、今では数分で完了します」と、プロジェクトリーダーのマイケル・ホタード氏は述べた。「GeoMatchは、情報収集と関連付けのプロセスを簡素化するツールとして、非常に役立ちます。」
ワシントン大学で、ロボット工学の研究者たちが、自力で食事ができない人のための自動給餌システムの開発に関する研究成果を発表しました。このシステムは多くのバージョンを経て、コミュニティからのフィードバックを受けて進化を遂げてきました。「フォークで扱えるものはほぼすべて扱えるようになりました。例えばスープは扱えませんが、マッシュポテトや麺類、フルーツサラダ、本格的な野菜サラダ、さらにはカット済みのピザやサンドイッチ、肉片など、あらゆるものを扱えます」と、共同リーダーのイーサン・K・ゴードン氏は大学が投稿した質疑応答で述べています。

これは興味深い会話で、このようなプロジェクトは決して「完了」することはなく、各段階でより多くの人々を支援できることが示されています。
視覚障がい者の移動を支援するプロジェクトはいくつか存在します。Be My AI(GPT-4V搭載)から、日常的なタスクに特化したモデル集であるMicrosoftのSeeing AIまで、実に様々です。Googleも、歩いたりジョギングしたりする際に道から外れないようにするための経路探索アプリ「Project Guideline」を開発していました。Googleはこれをオープンソース化しました。これは、一般的に何かを諦めることを意味しますが、Googleの損失は他の研究者の利益となります。なぜなら、この数十億ドル規模の企業で行われた研究成果を、個人のプロジェクトで活用できるようになるからです。
最後に、FathomVerse でちょっとした遊びを。iNaturalist などのアプリが葉や植物を識別するのと同じように、海の生き物を識別できるゲーム/ツールです。ただし、イソギンチャクやタコのような生き物は柔らかくて識別が難しいので、皆さんの協力が必要です。ベータ版に登録して、このプロジェクトの成功にご協力いただけませんか?
