今週のAI:生成AIが学術誌を賑わせている

今週のAI:生成AIが学術誌を賑わせている

こんにちは、皆さん。TechCrunch の定期的な AI ニュースレターへようこそ。

今週の AI では、生成 AI が学術出版物をスパムし始めています。これは偽情報の分野での新たな展開であり、気が滅入ります。

学術研究の最近の撤回を追跡するブログ「Retraction Watch」の投稿で、哲学助教授のトマシュ・ジュラツク氏とレシェク・ヴロンスキ氏は、アドルトン・アカデミック・パブリッシャーズが発行する、完全にAI生成の論文で構成されていると思われる3つのジャーナルについて書いた。

これらのジャーナルには、同じテンプレートに従った論文が掲載されており、「ブロックチェーン」「メタバース」「モノのインターネット」「ディープラーニング」といった流行語が溢れかえっている。同じ編集委員会(うち10人は故人)と、ニューヨーク市クイーンズ区にある住宅と思われる地味な住所が記載されている。

それで、何がそんなに大変なの?と疑問に思う人もいるかもしれません。AIが生成したスパムコンテンツを閲覧するのは、昨今のインターネットビジネスにおけるコストの一つではないでしょうか?

ええ、確かにそうですね。しかし、偽のジャーナルは、昇進や採用における研究者の評価システムを容易に操作できることを示しており、これは他の業界の知識労働者にとっての先駆けとなる可能性があります。

少なくとも広く使われている評価システムの一つであるCiteScoreでは、これらのジャーナルは哲学研究分野でトップ10にランクインしています。なぜこのようなことが可能なのでしょうか?それは、これらのジャーナルが互いに頻繁に相互引用しているからです。(CiteScoreは引用数を計算に考慮します。)Żuradzk氏とWroński氏は、Addletonのジャーナルの一つにおける541件の引用のうち、208件が同出版社の他の偽造出版物からの引用であることを発見しました。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

「(これらのランキングは)大学や資金提供機関にとって、研究の質を示す指標として頻繁に利用されている」と、ズラツク氏とヴロンスキ氏は述べている。「学術賞、採用、昇進の決定において重要な役割を果たしており、研究者の論文出版戦略にも影響を与える可能性がある。」

CiteScoreこそが問題だと主張する人もいるだろう。明らかに欠陥のある指標だ。そして、それは間違った主張ではない。しかし、生成型AIとその悪用が、人々の生活を支えるシステムを予期せぬ形で、そして潜在的に非常に有害な形で混乱させていると言うのも間違いではない。

生成型AIによって、CiteScoreのようなシステムをより公平で包括的、そして包括的なものへと再考・再構築する未来があります。一方、より悲惨な代替案、そして今まさに現実となっているのは、生成型AIが暴走を続け、大混乱を引き起こし、職業生活を破滅させる未来です。

すぐに軌道修正できることを願っています。

ニュース

DeepMindのサウンドトラック生成ツール:GoogleのAI研究機関であるDeepMindは、動画用のサウンドトラックを生成するAI技術を開発中であると発表しました。DeepMindのAIは、サウンドトラックの説明(例:「水中で脈打つクラゲ、海洋生物、海」)と動画を組み合わせ、動画の登場人物や雰囲気に合った音楽、効果音、さらにはセリフまでも生成します。

ロボット運転手 東京大学の研究者たちは、「筋骨格ヒューマノイド」と呼ばれるロボット「ムサシ」を開発し、小型電気自動車をテストコースで運転できるように訓練しました。人間の目の代わりになる2台のカメラを搭載したムサシは、前方の道路だけでなく、車のサイドミラーに映る景色も「見る」ことができます。

新たなAI検索エンジン AIを活用した新しい検索プラットフォーム「Genspark」は、生成型AIを活用して検索クエリに応じたカスタムサマリーを作成します。同社はこれまでにLanchi Venturesを含む投資家から6,000万ドルを調達しており、直近の資金調達ラウンドでは、ポストマネー評価額が2億6,000万ドルに達しました。これは、Perplexityなどのライバル企業と競合するGensparkにとって、立派な数字です。

ChatGPTの料金はいくらですか?:OpenAIが展開するAI搭載チャットボットプラットフォーム「ChatGPT」の料金はいくらですか?これは想像以上に難しい質問です。ChatGPTの様々なサブスクリプションオプションを把握できるよう、ChatGPTの料金に関する最新のガイドを作成しました。

今週の研究論文

自動運転車は、場所や状況に応じて、数え切れないほどのエッジケースに直面します。2車線道路を走行中に誰かが左ウィンカーを点灯させた場合、それは車線変更の意思を示すのでしょうか?それとも追い越すべきなのでしょうか?答えは、I-5号線を走行しているか、アウトバーンを走行しているかによって異なるかもしれません。

Nvidia、USC、UW、スタンフォード大学の研究者グループは、CVPR で発表したばかりの論文の中で、信じられないことに、AI に地元の運転者ハンドブックを読ませることで、多くの曖昧な状況や異常な状況を解決できることを示しています。

彼らの大規模言語運転アシスタント(LLaDa)は、LLMに州、国、または地域の運転マニュアルへのアクセスを提供します(微調整はできません)。現地の規則、慣習、標識などがマニュアルに含まれており、クラクション、ハイビーム、羊の群れといった予期せぬ状況が発生した場合、適切な行動(路肩に停車、方向転換、クラクションを鳴らし返す)が自動的に生成されます。

画像クレジット: Nvidia

これは決して完全なエンドツーエンドの運転システムではありませんが、「ユニバーサル」な運転システムへの代替案を示しています。しかも、それでもなお予期せぬ事態に遭遇する可能性があるのです。さらに、未知の場所を訪れる際にクラクションを鳴らされる理由を、私たち一般人が理解する手段にもなるかもしれません。

今週のモデル

月曜日、映画や画像コンテンツ制作者向けの生成AIツールを開発するRunway社が、Gen-3 Alphaを発表しました。公開されている情報源と社内の情報源から膨大な量の画像と動画を学習したGen-3は、テキストによる説明や静止画から動画クリップを生成できます。

Runwayによると、Gen-3 Alphaは、同社の従来の主力ビデオモデルであるGen-2と比較して、生成速度と忠実度が「大幅に」向上し、作成するビデオの構造、スタイル、モーションをきめ細かく制御できるという。また、Gen-3は「特定の芸術的および物語的要件」に合わせてカスタマイズできるため、より「スタイル的に制御された」一貫性のあるキャラクターを作成できるとRunwayは述べている。

Gen-3 Alphaには、動画の最大再生時間が10秒に制限されるなど、いくつかの制限があります。しかし、Runwayの共同創設者であるアナスタシス・ゲルマニディス氏は、これはRunwayのアップグレードされたインフラストラクチャでトレーニングされた次世代モデルファミリーに登場する複数の動画生成モデルの最初の1つに過ぎないと明言しています。

グラブバッグ

次回のマクドナルドの注文は AI が受けません。

マクドナルドは今週、3年近く試験運用してきた自動注文受付システムを100店舗以上から撤去すると発表した。IBMと共同開発され、レストランのドライブスルーに設置されたこのシステムは、顧客の意図を誤解し、ミスを誘発する傾向があるとして昨年話題になった。

テイクアウトの最近の記事によると、ファストフード業界はAI技術とその効率向上(および人件費削減)の可能性につい最近まで熱意を示していたものの、AIの影響力は全般的に薄れつつあるようだ。AI支援ドライブスルーレーンの大手企業であるプレストは、最近主要顧客であるデルタコを失い、損失の拡大に直面している。

問題は不正確さです。

マクドナルドのCEO、クリス・ケンプチンスキー氏は2021年6月にCNBCに対し、音声認識技術の精度は約85%だが、注文の5分の1程度は人間のスタッフによる対応が必要だと語った。一方、Takeoutによると、プレストの最高峰システムでは、人間の介入なしに注文を完了できるのは約30%に過ぎないという。

AIがギグエコノミーの特定の分野を壊滅させている一方で、多様なアクセントや方言の理解を必要とする仕事など、一部の仕事は自​​動化できないようです。少なくとも今のところは。