中国はいかにして並列生成AI宇宙を構築しているのか

中国はいかにして並列生成AI宇宙を構築しているのか

機械学習モデルがここ数ヶ月で見せてきた驚異的な技術進歩は、AIの未来に人々を熱狂させている一方で、その不都合な結末への不安も募らせている。Stability AIとOpenAIによるテキスト画像変換ツールが話題を呼んだ後、ChatGPTのインテリジェントな会話能力は、あらゆる分野で新たな注目を集めている。

テクノロジーコミュニティが常に西側諸国の進歩を注視してきた中国では、起業家、研究者、投資家が生成型AI分野への進出を模索しています。テクノロジー企業は、消費者や企業顧客を引き付けるため、オープンソースモデルを基盤としたツールを開発しています。個人はAI生成コンテンツで利益を上げています。規制当局は迅速に対応し、テキスト、画像、動画合成の利用方法を定義づけています。一方、米国によるテクノロジー制裁は、中国がAIの進歩に対応できるかどうかの懸念を高めています。

2022 年末にかけて生成 AI が世界を席巻する中、この爆発的なテクノロジーが中国でどのように変化しているかを見てみましょう。

中華風味

Stable DiffusionやDALL-E 2といったバイラルアート制作プラットフォームのおかげで、生成型AIは突如として誰もが話題にするようになりました。地球の反対側では、中国の巨大テック企業も、中国の嗜好や政治情勢に合わせた独自の工夫を加えた同様の製品で人々を魅了しています。

検索エンジンで名を馳せ、近年自動運転分野でも力を入れている百度(バイドゥ)は、1億4500万件の中国語画像とテキストのペアからなるデータセットで訓練された100億パラメータのモデル「ERNIE-ViLG」を運用しています。このモデルは、アメリカの同業他社と比べてどうなのでしょうか?以下は、Stable Diffusionに「ニューヨークのチャイナタウンでシュウマイを食べている子供たち」というプロンプトを与えた場合と、ERNIE-ViLGに同じプロンプト(中国語:纽约唐人街小孩吃烧卖)を与えた場合の結果です。

画像クレジット:安定拡散
画像クレジット: ERNIE-ViLG

中国とチャイナタウンで点心を食べて育った私としては、結果は互角と言えるでしょう。どちらも正しいシュウマイを作れませんでした。点心におけるシュウマイとは、半開きの黄色い皮に包まれた、ジューシーなエビと豚肉の餃子のことです。Stable Diffusionはチャイナタウンの点心店の雰囲気をうまく再現していますが、シュウマイは的外れです(でも、この機械の狙いは分かります)。ERNIE-ViLGは確かにシュウマイの一種を生成しましたがそれは広東風ではなく、中国東部でよく見られる種類のものでした。

この簡単なテストは、使用されるデータ セットが本質的に偏っている場合に文化的なニュアンスを捉えることの難しさを反映しています。Stable Diffusion には中国系移民に関するデータがより多く含まれており、ERNIE-ViLG は中国以外では珍しい、より多様なシューマイの画像でトレーニングされていると考えられます。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

話題を呼んだもう一つの中国製ツールは、テンセントの「異次元私」だ。これは人物写真をアニメキャラクターに変換できる。このAI生成ツールには独自のバイアス(偏り)が見られる。中国ユーザー向けに開発されたが、南米などのアニメ好きの地域で予想外に人気を博した。しかし、ユーザーはすぐに、このプラットフォームが黒人やプラスサイズの人物を識別できていないことに気づいた。これらのグループは日本のアニメには明らかに欠けており、AI生成結果が不快なものになっているのだ。

https://twitter.com/ruima/status/1600378304745205761

ERNIE-ViLGに加えて、大規模な中国語テキスト画像変換モデルとしてTaiyiがあります。これは、著名なコンピュータ科学者ハリー・シャム氏が率いる研究機関IDEAの成果です。シャム氏は、米国以外ではマイクロソフト最大の研究拠点であるMicrosoft Research Asiaの共同設立者でもあります。このオープンソースAIモデルは、フィルタリングされた2,000万件の中国語画像とテキストのペアで学習されており、10億のパラメータを備えています。

百度(バイドゥ)などの営利企業とは異なり、IDEAは近年、最先端技術の研究において地方自治体の支援を受けている数少ない機関の一つです。つまり、商業的成功を追求するプレッシャーがなく、より自由な研究環境を享受できるということです。テクノロジーハブである深圳に拠点を置き、中国で最も裕福な都市の一つから支援を受けているIDEAは、注目に値する新進気鋭の組織です。

AIのルール

中国の生成AIツールは、学習に利用する国内データだけでなく、現地の法律にも影響を受けています。MITテクノロジーレビューが指摘したように、百度のテキスト画像変換モデルは政治的にデリケートなキーワードを除外しています。中国のインターネットでは長年、検閲が普遍的な慣行となってきたことを考えると、これは当然のことです。

この新興分野の将来にとってさらに重要なのは、政府が「ディープシンセシス技術」と呼ぶ技術を対象とした新たな規制措置です。ディープシンセシス技術とは、「ディープラーニング、バーチャルリアリティ、その他の合成アルゴリズムを用いて、テキスト、画像、音声、動画、仮想シーンを生成する技術」を指します。ゲームからソーシャルメディアまで、中国の他のインターネットサービスと同様に、生成AIアプリを使用するユーザーは、利用前に氏名の確認を求められます。確認のプロンプトから本人確認が可能であるという事実は、必然的にユーザーの行動を制限する影響を及ぼします。

しかし、明るい面としては、これらの規制は、生成AIのより責任ある利用につながる可能性があります。生成AIは既に他の場所でNSFWコンテンツや性差別的コンテンツを大量に生み出すために悪用されています。例えば、中国の規制では、AIが生成したフェイクニュースの作成と拡散を明確に禁止しています。しかし、それがどのように実施されるかは、サービスプロバイダー次第です。

中国の生成AI規則は、悪用に対する制限と罰則を定めている

「中国が国として(生成AIを)規制しようとする最前線に立っているのは興味深いことです」と、イスラエルに拠点を置くOpenAIのライバル企業AI21 Labsの共同創業者、ヨアブ・ショハム氏はインタビューで述べた。「AIに制限を設けている企業は数多くあります…私が知る限り、どの国もAIを規制しようと、あるいは何らかの形で法制度や社会制度が技術に追いついていることを確認しようと努力しています。特にコンテンツの自動生成を規制する点においてです。」

しかし、急速に変化するこの分野をどのように管理すべきかについては、まだコンセンサスが得られていません。「これは私たち全員が共に学んでいる分野だと思います」とショーハム氏は認めています。「これは共同作業でなければなりません。テクノロジーとその機能と機能しないものを実際に理解している技術者、公共部門、社会科学者、テクノロジーの影響を受ける人々、そして規制の商業的および法的側面を含む政府を巻き込む必要があります。」

AIの収益化

強力なAIに取って代わられることを懸念するアーティストたちがいる一方で、中国では多くのアーティストが機械学習アルゴリズムを活用し、様々な方法で収益を上げています。彼らはテクノロジーに精通しているわけではありません。むしろ、副収入源を探している機会主義者や専業主婦といった人たちです。彼らは、プロンプトを改良することでAIにクリエイティブな絵文字や魅力的な壁紙を作成させ、ソーシャルメディアに投稿して広告収入を得たり、ダウンロード料金を直接請求したりできることに気づいています。本当に優れたアーティストは、金儲けのゲームに参加したい人々にプロンプ​​トを販売したり、有料で指導したりしています。

中国でも、他の国々と同様に、正式な業務でAIを活用している人々がいます。例えば、ライトフィクション作家は、小説よりも短く、イラストが多く使われるジャンルであるライトフィクション作品のイラストを、安価に大量生産することができます。製造業に革命を起こす可能性のある興味深いユースケースとして、AIを用いてTシャツ、付け爪、その他の消費財のプリントをデザインすることが挙げられます。大量のプロトタイプを迅速に作成することで、メーカーは設計コストを削減し、生産サイクルを短縮できます。

中国と欧米で生成AIがどのように発展しているのかを見極めるのは時期尚早です。しかし、起業家たちは初期の観察に基づいて決断を下しています。何人かの創業者から聞いた話では、企業や専門家はAIに投資することで直接的な利益が得られるため、一般的に喜んで支払いをするため、スタートアップ企業は業界におけるユースケースの開拓に熱心です。その巧妙な応用事例の一つが、Sequoia Chinaが支援するSurreal(後にMovioに社名変更)とHillhouseが支援するZMO.aiによるものです。両社はパンデミック中に、中国が国境を封鎖したため、eコマースの販売業者が外国人モデルを見つけるのに苦労していることに気付きました。その解決策は?両社は、あらゆる体型、肌の色、人種のファッションモデルを生成するアルゴリズムの開発に取り組みました。

しかし、一部の起業家は、AIを活用したSaaSが、JasperやStability AIといった欧米の同業他社が享受しているような、急激な評価額の上昇や目覚ましい成長を遂げるとは考えていません。長年にわたり、多くの中国のスタートアップ企業から、同様の懸念を聞かされてきました。中国の企業顧客は、一般的に先進国の顧客に比べてSaaSへの支払い意欲が低いため、多くの企業が海外展開を始めているのです。

中国のSaaS市場における競争も、弱肉強食だ。「米国では、ユーザー獲得や維持に人的サービスに頼らない、製品主導型のソフトウェアを開発すれば、かなりうまくいく。しかし中国では、たとえ優れた製品を持っていても、ライバルが一夜にしてソースコードを盗み出し、それほど費用のかからないカスタマーサポートスタッフを何十人も雇って、競争に勝つことができる」と、中国の生成AIスタートアップ企業の創業者は匿名を条件に語った。

セールス・インテリジェンス・スタートアップ企業FlashCloudの創業者兼CEOであるShi Yi氏も、中国企業は長期的なイノベーションよりも短期的な利益を優先する傾向があることに同意した。「人材育成に関しては、中国のテック企業はアプリケーションのスキル向上と短期的な収益創出に重点を置く傾向があります」と同氏は述べた。上海に拠点を置くある投資家は、匿名を条件に、「今年の生成AIにおける大きなブレークスルーがすべて中国国外で起こっていることに少しがっかりしている」と述べた。

官僚主義に縛られ、中国のスタートアップ企業は本土での夢を諦めている

今後の障害

中国のテクノロジー企業が大規模ニューラルネットワークのトレーニングに投資したいと思っても、最適なツールが不足している可能性がある。9月、米国政府は中国に対し、高性能AIチップの輸出規制を課した。多くの中国のAIスタートアップ企業は応用分野に重点を置いており、膨大なデータを処理する高性能半導体を必要としない。しかし、基礎研究を行う企業にとって、性能の低いチップを使用することは、計算に時間がかかり、コストも高くなることを意味すると、中国の大手ベンチャーキャピタルのエンタープライズソフトウェア投資家は匿名を条件に述べた。朗報なのは、こうした制裁措置が中国を長期的に先進技術への投資へと駆り立てていることだ、と彼は主張した。

中国AI分野のリーダーを自称する百度(バイドゥ)は、米国の半導体制裁が同社のAI事業に与える影響は短期的にも長期的にも「限定的」だと考えていると、同社の執行副社長兼AIクラウドグループ責任者であるドウ・シェン氏は第3四半期決算発表で述べた。これは、百度のAIクラウド事業の「大部分」が「高度な半導体に過度に依存していない」ためだ。また、ハイエンド半導体が必要な場合でも、「実際には、短期的な事業を支えるのに十分な在庫を既に保有している」という。

将来はどうでしょうか?「中長期的に見ると、実は当社には独自開発のAIチップ『Kunlun(クンルン)』があります」と幹部は自信たっぷりに語りました。「大規模言語モデルにKunlunチップ(聞き取れず)を使用することで、当社のAIプラットフォームにおけるテキストおよび画像認識タスクの効率が40%向上し、総コストは20%から30%削減されました。」

崑崙やその他の国産AIチップが、生成AIの競争において中国に優位性をもたらすかどうかは、時が経てば分かるだろう。

記事は更新され、Yoav Shoham 氏が AI21 Labs の共同設立者であることが明確になりました。