AIに関するニュースは、誰もが追いつくことができないほど溢れています。しかし、このコラムを読めば、世界中のAIと機械学習の進歩をまとめ、それらがテクノロジー、スタートアップ、あるいは文明にとってなぜ重要なのかを解説しながら、最も興味深い開発動向について、ある程度最新情報を得ることができます。
しかし、今回の調査に入る前に、ITIF業界団体による、AI「競争」における米国、EU、中国の相対的な位置付けを評価する調査結果をご紹介します。「競争」という言葉に「かぎ括弧」を付けたのは、私たちがどこに向かっているのか、その道のりがどれくらい長いのか、誰も分からないからです。とはいえ、時折、誰が先頭を走っているかを確認する価値はあります。
今年の答えは米国です。米国は、大手テクノロジー企業やベンチャーキャピタルからの民間投資によって大きくリードしています。中国は資金と論文発表数では追い上げていますが、依然として大きく遅れをとっており、米国の半導体とインフラに依存していることで打撃を受けています。
中国の自動運転スタートアップPony.aiの評価額が53億ドルに到達
EUは規模が小さく、特にAIベースのスタートアップへの資金調達において、利益も小さい。その一因は米国企業の過大評価にあることは間違いないが、この傾向は明らかだ。そして、投資家にとってもチャンスとなるかもしれない。彼らはこれを、それほど多額の資本を必要とせずに質の高いスタートアップ企業に投資するチャンスと捉えるかもしれない。
もちろん、これらの数字のより詳細な内訳にご興味がおありの場合は、完全なレポート (PDF) でさらに詳しい内容をご覧ください。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
もし著者らが、USC にあるこの Amazon が資金提供した新しい AI 研究センターについて知っていたら、おそらくそれを、米国の AI 研究者の育成を維持するのに役立つタイプのパートナーシップの好例として指摘しただろう。
上品な雰囲気
収益化や実用化から最も遠いところでは、人間の専門知識がさまざまな方法で評価される分野における機械学習の興味深い使用法が 2 つあります。

スイスのEPFL(連邦工科大学ローザンヌ校)のデジタル・認知音楽学研究所に所属する音楽に造詣の深い研究者たちは、クラシック音楽における旋法(長調、短調、その他、あるいは旋法なし)の時代ごとの変化を調査していました。数百年にわたる作曲家による数千もの楽曲を客観的に分類するため、彼らは楽曲を聴いて旋法ごとに分類する教師なし機械学習システムを開発しました。(データと手法の一部はGitHubで公開されています。)
「例えばルネサンスには2つ以上の旋法があったことは既に分かっていました。しかし、古典派以降の時代においては、旋法の区別は曖昧になっています。私たちは、こうした違いをより具体的に特定できるかどうかを調べたかったのです」と、彼は大学のニュースリリースで説明した。
このモデルは、音楽理論や歴史に関する知識を一切持たずに、最終的に複数の異なる旋法の使用クラスターを分離することに成功しました。結果をどのように解釈するかは人それぞれですが、これは古典音楽コーパスを評価するための魅力的な新しい手法です。
もう一つの文化の柱であるチェスは、ガルリ・カスパロフとディープ・ブルーの有名な戦いで転機を迎えたことで有名です。
「失業についてではなく、人々が苦しんでいることについて話すべきだ」とカスパロフ氏はAIについて語る
しかし今、問題はより強いチェスAIを作ることではなく(それは必須ではない)、より人間に近いプレイをさせる方法です。カスパロフをこれほどまでに優れたプレイヤーにした要素は何だったのでしょうか?彼がディープ・ブルー戦に関する著書で述べているように、それは単なる計算能力ではありませんでした。コーネル大学の研究者たちは、人間のスキルを模倣することの方が、人間を圧倒することよりも、より深く興味深い課題だと考えています。
アイデアは、あるレベルのスキルを持つプレイヤーと同じようにゲームを理解するAIを作ることでした。そして、そのアプローチの一つとして、AIに全体的な勝利ではなく個々の動きに焦点を当てるように教えるという方法がありました。様々なスキルレベルのプレイヤーがどのような動きをし、なぜそうするのかを理解することで、非常に説得力のある対戦相手を作ることができ、さらに指導にも役立つでしょう。
結果として得られた(開発中の)AI、Maia は、lichess.org で対戦できるようになっているはずですが、見つけられるかどうかはわかりません。
AIの鋭い目

医用画像診断は非常に広範かつ多様な分野であるため、このコラムのほぼ毎回、機械学習の新しい応用例が取り上げられているのも当然です。しかし、統合失調症の発見は、腫瘍や白内障の初期症状の発見よりもはるかに難しいようです。それでも、アルバータ大学の研究者たちは、実用化する価値のある何かを見つけたと考えています。
統合失調症患者のMRI画像で訓練されたコンピュータービジョンモデルを、近親者の数十枚のMRI画像に応用した。統合失調症は必ずしも先天性ではないが、一部の家系ではリスクが高いようだ。このモデルは「自己申告による統合失調型パーソナリティ特性尺度で最も高いスコアを示した14人を正確に特定した」という。
これは良いことであり、現実的です。脳画像に基づいて統合失調症を診断できるAIを期待する人はもちろん、報告する人もいないでしょう。しかし、脳組織には様々な疾患と相関関係にあると思われるパターンが存在します。その理由は不明かもしれませんが、AIはパターン検出に優れています。他の指標からリスクが高いと示唆される人を正確に指摘したこのAIは、精神科医やその他の医療従事者にとって非常に有用なツールとなる可能性があります。
ゾウを見つけるのは簡単な作業のように思えるかもしれませんが…実際、簡単です。とはいえ、特に軌道上からだと簡単というわけではありません。高解像度の軌道画像は、自然保護活動家や生態学者にとって金鉱となる可能性がありますが、その量は膨大であるため、見る価値があるようにするには、自動化が事実上必須です。
絶滅危惧種のカイギュウを数えるのは難しいので、AIに任せることにした
数十年にわたって、そのような作業は大学院生や研究助手、そしてコーヒー一杯の領域でしたが、これまで見てきたように、機械学習はジュゴンなどの背景から動物を見つけ出すのに優れています。

ゾウは体が大きいにもかかわらず、長距離を移動し、多様な生態系に生息するため、追跡は困難を極めることがあります。しかし、オックスフォード大学の研究チームとバース大学、そしてESAのパートナーは、現在利用可能な一定の解像度があれば、ゾウの位置を毎日更新できる可能性があると示唆しています。人間によるラベル付けほど正確ではありませんが、この種の作業の他の例と同様に、すべてを行うよりも作業負荷を軽減することが目的です。
上空から行うのが当然と思われるもう一つの重要な作業は、樹木の識別です。森林管理は、多くの場合、現地に人力で赴き、地上から調査するか、せいぜい小型航空機やドローンを使って行われます。

ロシアのスコルコボ科学技術研究所は、衛星データ(特にレーダーなどの他の軌道情報源からの高度データと組み合わせた場合)を用いて、特定の地域の優占種を特定できることを実証しました。得られた等高線図は、特に経時的に追跡すれば、森林生態学者にとって非常に有用なものとなるでしょう。このモデルは混交林をまだ理解できませんが、それでも非常に有用なソフトウェアとなる可能性を秘めています。
アクセシブルアイコン
この最後の項目は、上記の内容をまとめているときに思いつきました。Googleは、「進む」「戻る」「オプション」「リスト表示」といった一般的なアイコンを数十種類認識してラベル付けできるコンピュータービジョンシステムの開発に取り組んでいます。
携帯電話のアクセシビリティは、まだ不完全な状況です。アプリやサービスの中には、すべてのアイコンやボタンにラベルが付いているものもあれば、必要最低限、あるいはそれ以下のラベルしか付いていないものもあります。もし携帯電話のOSがこれらの不足を補うことができれば、視覚障碍のある人にとって非常に役立つでしょう。アプリのコードから情報を取得することで実現できる場合もありますが、見た目で「これは元に戻すボタンです」とわかるだけでも役立つでしょう。

Google はまさにそのことに取り組んでいます。IconNet と呼ばれる、集中的で高速な畳み込みニューラル ネットワークです。このネットワークはスペースをほとんど占有せず、処理オーバーヘッドを最小限に抑えながら、まもなく 70 個を超えるアイコンを数ミリ秒以内に認識できるようになります。
素晴らしい機能だと思いませんか?Appleが12月にiOS 14でこれに似た機能をリリースしたのも、驚くべきことではありません。
iPhoneは視覚障碍者向けにボタンやUI機能を自動的に認識してラベル付けできるようになりました
まあ、全てを勝ち取ることはできません。しかし、いずれにせよ勝者はユーザーです。AI分野における熾烈な競争のおかげで、ユーザーはより多くのアクセシビリティの選択肢を持つことになります。