AIのように急速に進化する業界に追いつくのは至難の業です。AIがあなたに代わってそれをこなしてくれるようになるまで、機械学習の世界における先週のニュースと、私たちが単独では取り上げなかった注目すべき研究や実験をまとめてご紹介します。
YouTubeは、英語の動画と視聴者の限られた数のみを対象に、視聴ページと検索ページで動画のAI生成による要約の実験を開始した。
確かに、要約は発見やアクセシビリティに役立つかもしれません。すべての動画制作者が説明文を書くのに苦労するわけではありません。しかし、AIによって作り出される動画には、間違いや偏見が入り込む可能性があるのではないかと懸念しています。
今日の最高のAIモデルでさえ「幻覚」を起こす傾向があります。OpenAIは、最新のテキスト生成・要約モデルであるGPT-4が推論において重大な誤りを犯し、「事実」を捏造することを率直に認めています。ヘルステック業界の起業家であるパトリック・ハイメル氏は、GPT-4が実際の情報源との明確な関連性を一切示さずに、参考文献、事実、数字を捏造する方法について記事を書きました。また、Fast CompanyはChatGPTの記事要約能力をテストし、その性能は…かなり劣悪であると結論付けました。
動画の内容分析という難しさを考えると、AIが生成した動画要約が行き過ぎてしまう可能性も想像に難くありません。YouTubeのAI生成要約の質を評価するのは難しいですが、AIがテキストコンテンツの要約をそれほど得意としていないことは周知の事実です。
YouTubeは、AIが生成した説明文が実際の説明文の代わりにはならないことをさりげなく認めています。サポートページには、「これらの概要が動画の概要を分かりやすく伝え、お役に立てれば幸いですが、動画の説明文(クリエイターが作成するものです!)に代わるものではありません」と記載されています。
プラットフォームがこの機能の導入を急ぎすぎないことを祈ります。しかし、Googleが最近リリースした中途半端なAI製品(ChatGPTのライバルであるBardへの挑戦など)を考えると、あまり自信がありません。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
ここ数日間で注目されたその他の AI 関連ニュースは次のとおりです。
ダリオ・アモデイがDisruptに登場。Anthropicの共同創業者にインタビューし、大金持ちの心境やAIについても語ります。
Google検索に新たなAI機能が追加: Googleは、5月のI/Oカンファレンスで発表されたAIを活用した生成型検索機能「Search Generative Experience(SGE)」に、文脈に応じた画像と動画を追加します。今回のアップデートにより、SGEは検索クエリに関連する画像や動画を表示するようになりました。また、Googleはアシスタントプロジェクトをバードのような生成型AIへと転換すると報じられています。
MicrosoftがCortanaを廃止:名前の由来となったHaloシリーズのゲームで起きた出来事を彷彿とさせるように、Cortanaは廃止されました。幸いなことに、これは悪意のある汎用AIではなく、時代遅れのデジタルアシスタントでした。
Meta が生成 AI 音楽を採用: Meta は今週、短いテキストの説明やプロンプトから「高品質」で「リアル」なオーディオと音楽を生成するフレームワーク、AudioCraft を発表しました。
GoogleがAI Test Kitchenを削除: Googleは、ウェブプラットフォームに特化するため、AI Test KitchenアプリをPlayストアとApp Storeから削除しました。同社は昨年、LaMDA 2などの様々なAIモデルを搭載したプロジェクトをユーザーが操作できるようにAI Test Kitchenエクスペリエンスをリリースしました。
ロボットは少量のデータから学習する: Google に関して言えば、このテクノロジー大手の AI に特化した研究機関 DeepMind は、ロボットが比較的小規模なデータセットで学習した概念をさまざまなシナリオに効果的に転送できるようにするシステムを開発したという。
Kickstarterが生成型AIに関する新たなルールを制定: Kickstarterは今週、プラットフォーム上でAIツールを用いてコンテンツを生成するプロジェクトにおいて、プロジェクトオーナーがAIコンテンツをどのように活用する予定なのかを開示することを義務付けると発表しました。さらにKickstarterは、AI技術の開発を伴う新規プロジェクトにおいて、プロジェクトオーナーが使用を予定しているトレーニングデータのソースに関する詳細情報の開示を義務付けています。
中国が生成 AI を取り締まる:中国で動作する AI アプリに行政ライセンスの取得を義務付ける新しい規則により、今週、複数の生成 AI アプリが Apple の中国 App Store から削除されました。
NPC作成のための生成AIプラットフォーム「インワールド」が新たな投資を獲得
Stability AIが新モデルをリリース: Stability AIは、テキスト画像変換モデル「Stable Diffusion XL 1.0」をリリースしました。同社はこれを「これまでで最も先進的」なリリースと表現しています。Stability AIによると、このモデルの画像は、前モデルのアートワークと比較して「より鮮やか」で「正確」な色彩を実現し、コントラスト、影、照明の表現が向上しています。
AI の未来はビデオです。あるいは、少なくとも Haje 氏の言うように、生成 AI ビジネスの大部分はビデオです。
AI.com は OpenAI から X.ai に切り替えました。売却されたのか、貸し出されたのか、あるいは何らかの進行中の計画の一部なのかは全く不明ですが、切望されている 2 文字のドメイン (おそらく 500 万ドルから 1,000 万ドルの価値がある) は、ChatGPT インターフェースではなく、Elon Musk の X.ai 研究機関を指し示すようになりました。
その他の機械学習
AIは数え切れないほどの科学分野に進出しており、私も定期的にここで報告する機会がありますが、具体的な応用例をすぐに挙げるのは難しいかもしれません。Nature誌に掲載されたこの文献レビューは、AIが効果を発揮している分野や手法、そしてそれらを可能にした進歩について、これほど包括的にまとめた資料は他にないでしょう。残念ながら有料ですが、おそらく入手方法は見つかるでしょう。
AIが感染症との世界的な闘いを改善する可能性について、より深く掘り下げた記事はScienceに掲載されており、ペンシルベニア大学の要約にもいくつかのポイントが記載されています。興味深い点の一つは、薬物相互作用を予測するために構築されたモデルが「感染性微生物と宿主の免疫系との間の複雑な相互作用を解明する」ことにも役立つ可能性があるということです。病気の病理は非常に複雑になる可能性があるため、疫学者や医師はおそらくどんな助けでも受け入れるでしょう。

もう一つの興味深い例は、すべてのアルゴリズムがAIと呼ぶべきではないという但し書き付きですが、複数の機関が協力して「潜在的に危険な」小惑星をアルゴリズムで特定する研究です。天文観測では膨大なデータが生成されますが、小惑星のような微弱な信号を探し出すのは大変な作業であり、自動化の影響を受けやすいものです。高さ600フィート(約180メートル)の2022 SF289は、ATLASデータを用いたアルゴリズムのテスト中に発見されました。「これは、2年足らずでルビン天文台がHelioLinc3Dのような天体を毎晩発見するようになるという期待のほんの一部に過ぎません」とワシントン大学のマリオ・ユリッチ氏は述べています。待ちきれません!
AI研究の世界では、AIがどのように機能し、なぜ機能するのかを解明する研究が、いわば光輪のように輝いています。通常、こうした研究は専門家でない人にとっては理解するのが非常に難しく、ETHZの研究者によるこの研究も例外ではありません。しかし、筆頭著者のヨハネス・フォン・オズワルド氏は、いくつかの概念を分かりやすい英語で解説するインタビューも行っています。ChatGPTのようなモデル内部で行われる「学習」プロセスに興味があるなら、一読の価値があります。
学習プロセスの改善も重要であり、デューク大学の研究者たちが発見したように、答えは必ずしも「より多くのデータ」ではない。実際、データの増加は機械学習モデルの妨げになる可能性があると、デューク大学のダニエル・レーカー教授は述べている。「犬と猫の写真を見分けるアルゴリズムを訓練するのに、学習用に犬の写真を10億枚、猫の写真を100枚しか与えなかった場合のようなものです。アルゴリズムは犬の識別が非常に上手になり、すべてが犬のように見えるようになり、世界の他のすべてを忘れてしまいます。」彼らのアプローチは、データセットのそのような弱点を特定する「能動学習」手法を使用し、データのわずか10分の1を使用しながら、より効果的であることが証明されました。
ユニバーシティ・カレッジ・ロンドンの研究によると、英語と中国語の両方において、人間が本物の音声と合成音声を判別できたのはわずか73%でした。おそらく私たちはもっと上手になるのでしょうが、近い将来、技術が人間の判別能力を上回るでしょう。どうか冷静に。