中国は現在、世界で最も豊かなデジタル経済圏の一つであり、比類のないハードウェアサプライチェーンを擁し、アリババ、テンセント、バイトダンスといった著名で莫大な利益を上げている企業が世界をリードしています。しかし、こうした最先端のイノベーションはすべて、コンピューティングにおける大きな課題の一つである中国語ワードプロセッサの開発という、40年前の解決策に支えられています。
1980年代初頭から、中国は米国および西側諸国からのコンピュータ製品の購入を劇的に拡大し、1980年には外国製マイクロコンピュータの輸入台数がわずか600台であったのに対し、1985年には13万台にまで減少した。米国、日本、欧州の企業は、ある観察者が「買い漁り」と呼んだこのブームに乗ろうと躍起になった。
しかし、中国のコンピューターユーザーと欧米メーカーの両方にとって、大きな問題がありました。欧米製のパソコン、プリンター、モニター、オペレーティングシステム、プログラムなど、どれも中国語の文字入力や出力に対応していませんでした。少なくとも1980年代初頭から中頃までは、そしてもちろん「そのままの状態」では対応していませんでした。大規模な改修が行われない限り、量産型のパソコンは中国語で操作したい人にとって実質的に役に立たないものでした。
最も重要な理由の一つはメモリの問題、特に中国語フォントに必要なメモリでした。ラテンアルファベットコンピューティングの出現により、西洋のエンジニアや設計者は、英語のフォントは5×7のビットマップグリッド上に構築でき、1文字あたりわずか5バイトのメモリで済むことを発見しました。見た目は美しくないものの、このグリッドはコンピュータ端末や紙の印刷物でラテンアルファベットの文字を判読できるほどの解像度を提供していました。US ASCIIの95の印刷可能な文字を格納するのに必要なメモリはわずか475バイトで、これは例えば当時のApple IIのマザーボードメモリ48KBに比べればごくわずかな量でした。
中国語の文字で同等の最低限の可読性を実現するには、5 バイ 7 のグリッドでは小さすぎました。中国語のビットマップ フォントを設計する際、エンジニアはラテン アルファベットのグリッド サイズを 5 バイ 7 ピクセルから 16 バイ 6 ピクセル以上に幾何学的に増やすしかなく、つまり漢字 1 文字あたり少なくとも 32 バイトのメモリが必要でした。ビットマップ (簡体字または繁体字のいずれか一方、両方ではない、メタデータなし) を格納するために必要なメモリの総量は、最もよく使用される 8,000 字の漢字で約 256 KB に相当し、1980 年代初期のほとんどの市販のパーソナル コンピュータの総容量の 4 倍になります 。これはすべて、オペレーティング システムとアプリケーション ソフトウェアの RAM 要件を考慮する前の値です。

これは、現代コンピューティングの偉大なエンジニアリングの歴史の 1 つであり、デジタル革命の世界的な発展を独自の視点で示す、起業家精神の大胆さとエンジニアリングの創意工夫の物語の背景です。
これはTechCrunchで2回にわたって執筆した記事のうちの1回で、中国語の入出力に対応した最初のパーソナルコンピュータの一つである実験機、Sinotype IIIを検証するものです。市販のApple IIをベースに、カスタムプログラムされたワードプロセッサとオペレーティングシステムを搭載したSinotype IIIは、西洋製コンピュータを中国語に「翻訳」する方法を実証する「概念実証」として機能し、広大な新市場を開拓しました。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
この最初の部分では、Sinotype III の作成者が直面したコンピュータ メモリ、フォント、オペレーティング システムに関する重大な技術的課題と、それらの課題を克服するための斬新なソリューションを考案した方法について検証します。
「すぐに就職の見込みがない新卒者の厚かましさ」
私たちの物語は、グラフィックアート研究財団(GARF)から始まります。この組織こそが、中国のコンピュータ技術の誕生の地と言えるでしょう。漢字組版機(Sinotype)は、1950年代後半にMITの電気技師サミュエル・ホークス・コールドウェルによって、GARFの資金援助を受けて発明されました。1960年に彼が早すぎる死を迎えた後、プロジェクトは中断されました。1960年代から1970年代にかけて、Sinotypeプロジェクトは、アイテック社、RCA、そして最終的にGARFを含む様々な団体によって存続しました。

シノタイプの復帰は、ルイス・ローゼンブラムという一人の人物のおかげです。1921年ニューヨーク市に生まれた彼もMITファミリーの一員で、1942年に応用数学の学士号を取得して卒業しました。世界的に著名な電気工学教授であり(1930年代に有名な「ミルクドロップの王冠」の写真を撮影した人物でもある)、ハロルド・エドガートンに師事したローゼンブラムは、卒業後すぐにポラロイド社に就職し、エドウィン・ランドと共にインスタント写真の開発を含む様々なプロジェクトに携わりました。1954年にはフォトン社に移り、非ラテン文字の写植に取り組みました。故コールドウェルのシノタイプの先駆的研究を深く理解していたローゼンブラムは、このプロジェクトを効果的に採用し、1970年代半ばにコンサルタントとしてGARFに加わった際にプロジェクトを復活させました。

GARFは1980年代初頭までシノタイプ・プロジェクトの活動を続け、その時点では著名な学者や中国に深い経験を持つ人々からなる諮問委員会が設立されていました。ハーバード大学の言語学者、久能進氏や、1972年のリチャード・ニクソン大統領の中国訪問で重要な役割を果たし、当時ランド研究所の社会科学部門長を務めていたリチャード・ソロモン氏も委員に加わりました。
しかし、この頭脳集団がいかに傑出していたとしても、Sinotype プロジェクトにおける GARF の大きな進歩 (ミニコンピュータ ベースのシステム (Sinotype II) からマイクロコンピュータ ベースのシステム (Sinotype III) への飛躍) は、1979 年に Sinotype II プロジェクトのデータ管理に 2 週間ほど短期間携わったことしか GARF で経験のない、ある大学生によって促進された。その大学生とは、ルイス ローゼンブラムの息子、ブルース ローゼンブラムだった。

ペンシルベニア大学の学部生でフォトジャーナリストを目指していたブルースは、授業と学生による独立系新聞「デイリー・ペンシルベニアン」の写真編集者としての仕事を両立させていました。同紙は、機材面でも、担当する学生たちの深い専門知識においても、当時としては驚くほど先進的でした。
ブルースが3年生の秋を迎える頃には、新聞社が所有していた既存の植字機(コンピュグラフィック・タイプセッター2台)が寿命を迎え、交換が必要になりました。ブルースは新聞社の同僚3人と共に、代替機の選定調査に協力し、最終的にカンザス州ウィチタのMycro-Tek社とマサチューセッツ州ウィルミントンのCompugraphic社という2社と、合計12万5千ドルの契約を結びました。
シノタイプ・プロジェクトに関しては、ブルースは父親のおかげでその存在をよく知っていたものの、自身は関わっていなかった。1981年5月初旬、転機が訪れた。ブルースは期末試験を終えたばかりで、新聞社のオフィスに立ち寄った。同僚のエリック・ジェイコブスが、ラジオシャックのTRS-80 Model IIパーソナルコンピュータで熱心に作業していた。ジェイコブスは、このマイクロコンピュータを新聞社の業務運営にどのように活用できるかを思案していた。ブルースは30分ほど観察した後、自分の仕事に戻った。
しかし、あの30分間は彼の記憶に深く刻まれていた。「マイクロコンピュータで作業する人を見たのは初めてでした」とブルースはメールで回想した。「あの数分が、Sinotype IIIプロジェクト全体のきっかけとなり、やがて私のコンピューター業界でのキャリアの始まりとなったのです。」
その週の後半、ブルースは父親との電話で、やや思いつきで発言した。GARFが当時Sinotype IIの開発に使用していたデータジェネラル社のハードウェアの莫大なコストに触れ、ブルースは、誰かがマイクロコンピュータを使えば、おそらくその数分の1のコストで同等かそれ以上のものをプログラムできるだろう、と言ったのだ。GARFが現在資金提供している機器の価格は10万ドル以上だが、ブルースは1万ドル程度のハードウェアで済むかもしれない、と。
父親は興味をそそられた。ルイスはブルースに、そんな機械をプログラミングできるかどうか尋ねた。ブルースは高校時代にコンピューターをかなり使い、PDP-8アセンブリ言語とBASICを独学で習得していたものの、コンピューターサイエンスの正式な教育は受けていないと自慢していた。「もちろん」と父親の問いに彼は答えた。「すぐに就職の見込みがない新卒らしい厚かましさ」

1981年6月、ブルースはニューヨークでビル・ガース、プレスコット・ロー、そして父ルイスと正式な会議を開き、シノタイプIIIの提案書を提出した。ブルースは場にふさわしい服装でスリーピーススーツで現れた。ブルースの正式な提案書では、ハードウェア費用として合計7,500ドル、プログラミング費用として5,000ドルを挙げていた。計画では、Apple IIで動作する中国語ワードプロセッサを約4ヶ月で納品すると約束されていた。もしこれが実現すれば、この種のマシンのコストは桁違いに削減されるはずだった。
ブルースはその仕事に就き、1981年6月から11月までSinotype IIIのプログラミングに取り組みました。その間、フィラデルフィアの独立記念館にある国立公園局のツアーガイドというフルタイムの仕事との両立を図っていました。昼間の休憩時間にはアセンブリコードを手書きし、夜に書き写していました。1981年の労働者の日が来てツアーガイドの仕事が終わると、ブルースは2ヶ月間ひたすらコードを完成させ、GARFに提出しました。
メモリハッキング
GARFとローゼンブラム夫妻が最初に直面した問題は、コンピュータメモリでした。初期の中国製パーソナルコンピュータの開発者たちは、システムから可能な限り多くのメモリを消費しようと、あらゆる選択肢を模索しました。ここでは、アダプティブメモリと漢字カードという2つの戦略について考察します。これらの戦略は、単独で用いられることもありますが、多くの場合は併用されます。
Sinotype III システムは、5 つのコンポーネントで構成されていました。Sanyo DM5012CM 12 インチ モニター、Epson MX-70 プリンター、漢字ビットマップ データベースとそれに対応する「記述子コード」を保存するための Corvus 10 MB「リジッド ディスク ストレージ」、テキスト ファイルの保存用の Apple ディスク ドライブ、および Apple II 本体です。
Apple II には、出荷時の状態で 32KB の RAM が搭載されており、マザーボード上で 48KB まで拡張可能でした。「Apple II が出荷される前に、すでに最大限に活用しました」と、ブルース・ローゼンブラム氏は私への電子メールで述べています。しかし、48KB のメモリは彼の目的には依然として少なすぎたため、ブルース氏は、当時としては完全に標準的な変更、つまり当時のいわゆる「パワーユーザー」の間で一般的に行われていた変更を選択しました。つまり、スロット 0 に 16KB のメモリカードを追加して、使用可能なメモリの合計を 64KB に増やしたのです。
しかし、それでもまだ少なすぎました。「完全なエンコード システムを格納するには、より多くの RAM が必要でした。また、最もよく使用される 100 個の表意文字用の 16 x 16 のビットマップも必要でした」と彼は述べています。
彼は、これまでほとんど誰も試したことのないApple IIの「改造」を模索し始めた。「どういうわけか」と彼は言った。「Apple IIのスロット2に16KBのボードを2枚目挿せることを思いつき、合計80KBのメモリを確保したんだ。全く規格外のやり方だったけど、市販の部品でうまくいったよ」
しかし、この改造はマシンの限界を超えてしまいました。Apple IIの6502マイクロプロセッサは、64KBのメモリにしか直接アクセスできませんでした。つまり、ブルースが2枚目のメモリボードでブートストラップして16KBを追加したとしても、Apple IIがメモリ内のこれらの追加アドレスに同時にアクセスする組み込みの方法がまったくなかったのです。この改造は非常に「非標準」だったため、ブルースがAppleのエンジニアと何度も会話をした際にこのことを話した際、担当者は驚愕しました。こんなことは聞いたことも、考えたこともなかったからです。
Apple IIが64KBではなく80KBのメモリにアクセスできるようにするため、ブルースは標準のオペレーティングシステムを捨て、アセンブリ言語で独自のオペレーティングシステムをプログラムしました。彼が独自に設計したプログラムの鍵は、「互いに重なり合う16KBの2つのバンクから選択する」機能でした。言い換えれば、一度にアクセスできるメモリは64KB分しかありませんが、2枚のメモリ拡張カードを高速に切り替えることで、ユーザーから見れば無視できるほどの速度でコンピュータが両方のメモリにアクセスするように仕向けることができたのです。これによりシステムメモリが25%増加し、オンボードメモリにおそらく400文字もの漢字を格納できるようになりました。
ブルースは感謝祭の1週間前に最終的なコードをGARFに提出し、ヨーロッパとアジアを横断する世界一周のバックパック旅行に出発しました。この時点から、シノタイプIIIの開発は主にルイス・ローゼンブラムとGARFの手に委ねられることになりましたが、ブルースは引き続きコンサルタントとして働き、ヨーロッパ、中国、インドなど、その時々の場所にいた父親と頻繁に文通を続けました。
リアルタイムの中国語入力に向けて加速
しかし、ルイスとブルースは、この独創的な改造を施しても、オンボードメモリに収まる漢字はわずか600~1,000字程度だと見積もっていました。Sinotype IIIのオペレーティングシステム、プログラムアプリケーション、そして漢字1字あたりのメモリ要件を考慮すると、マシンの語彙に含まれる漢字の大部分は、フロッピーディスク、外付けハードドライブ、あるいはその他のハードウェアソリューションなど、どこか別の場所に保存する必要があるでしょう。

ブルースは当初、PROM(プログラマブル・リードオンリー・メモリ)チップの使用を一時的に検討しましたが、このアイデアはすぐに行き詰まりました。1981年から1982年頃、市場に出回っていた最大のPROMチップのメモリ容量は2KBで、これはわずか28~51文字の漢字に相当しました。つまり、この方法で7,000文字の漢字を保存するには、ブルースは138個か250個のPROMチップを必要としたことになります。「それはかなりのチップ数ですね」と彼は言いました。
ブルースは次に、フロッピーディスクに文字を保存する可能性を検討しました。しかし、これも実現不可能であることが判明しました。必要なディスク枚数が膨大になるだけでなく、フロッピーディスクから文字ビットマップを取得する際のアクセス速度と検索速度が遅いことが原因です。GARFは代わりに3つ目の解決策を選択しました。それは、当時マイクロコンピュータのアクセサリとしてはほとんど知られていなかった外付けハードドライブをSinotype IIIに搭載することでした。深刻なメモリ制限を克服するため、GARFは使用頻度の低い数千字の漢字をシステムの外付けハードドライブ、10MBのCorvus「リジッドディスクストレージ」に「オフサイト」で保存することにしました。
しかし、これはシノタイプ III の動作速度に悪影響を及ぼしました。ほとんどの操作が 1 秒未満の驚異的な速度で行われるコンピューティングの時空間連続体において、ハード ドライブは扱いにくいモンスターでした。特に当時は、レコード プレーヤーのようにデバイス内で回転する硬い磁気ディスク (「プラッター」) に依存していました。レコードの溝が針で読み取られるのと同様に、各「トラック」の内容はヘッドによって読み取られました。取得速度は、ヘッドの位置と、取得要求時のディスクの特定の回転位置に依存していました。バス停に到着したらバスがちょうど出発したばかりだったのと同じようなもので、バスが戻ってくるまで待つしか選択肢がありませんでした。
具体的には、ハードドライブに保存された漢字の検索時間は、RAMに保存されたものに比べて10倍も遅くなりました。具体的には、RAMに保存された漢字の検索時間は1文字あたり約100ミリ秒で、これは人間の認知能力では感知できない時間単位です。一方、外部ストレージに保存された文字の場合、これらの文字を入力すると、アクセスと検索に最大1秒かかりましたが、これは人間の認知能力の閾値をはるかに超える時間単位です。
1980年代半ばのパーソナルコンピューティングの時代、英語圏のユーザーはリアルタイムタイピングに急速に慣れつつあり、1秒の入力時間は非常に遅いと思われていました。さらに、1秒は 100ミリ秒の10倍の長さであるため、平均的なユーザーは、使用頻度の低い文字を入力するたびに、この差を実感することになります。
この問題を緩和するため、ルイス・ローゼンブラムは「適応型一時記憶」と呼ぶアイデアを思いつきました。シノタイプ III は、ユーザーが最後に入力した内容に応じて、RAM に格納する文字セットを調整できるようになります。最初の起動時に、シノタイプ III のオンボード RAM には、事前に決められた高頻度文字セットのみが備えられます。ハードドライブベースの低頻度文字の入力には、前述のように最大 1 秒かかります。しかし、当時の手紙の中で彼は、「低頻度の表意文字がキーボード入力されるたびに、そのコードとドットマトリックスパターンがランダム アクセス メモリに記録されます」と説明しています。言い換えれば、そのような文字はハードドライブからオンボード RAM キャッシュに一時的にコピーされ、それによってその後の読み込み時間が短縮されます。

チャイニーズ・オン・ア・チップ
トグルスイッチや適応メモリを駆使したとしても、そうした戦略の限界を超える文字が何千文字も残っていました。高頻度の漢字が全体の使用率の大部分を占めていたとはいえ、技術系や専門系のコンテンツを作成する際には、ユーザーは必ず「オフサイト」の漢字リポジトリに何度もアクセスする必要がありました。中国語のコンピューティング体験が英語圏のユーザーが享受しているような瞬時の感覚に近づくためには、こうした「低頻度」の漢字をもっと「オンサイト」で利用する必要があったのです。
1970年代後半から1980年代初頭にかけて、エンジニアたちは「漢字カード」(Hanka)、「中国語カード」(Zhongwenka)、「中国語文字ジェネレーター」、「中国語フォントジェネレーター」(Hanzi zimo fashengqi)、あるいはある記事で面白おかしく「中国語オンチップ」と呼ばれた、異なるハードウェアソリューションの探求を始めました。メモリカードやグラフィックカードと同様に、「漢字カード」はマザーボードの拡張スロットに直接インストールできるように設計されていました。これらのカードには、数千もの中国語ビットマップと入力エンコーディングがハードワイヤードされていました。実質的には外付けハードドライブと同じ役割を果たしていましたが、速度ははるかに高速で、パフォーマンスの信頼性も高くなっていました。
「Chinese-on-a-chip」カードはGARFの研究対象ではありませんでした。むしろ、パーソナルコンピューティング革命以前の、カスタム設計された中国語システムの時代から発展したものです。これらのシステムには、Chan Yeh氏によるIdeographix IPXやOlympia 1011などがあり、文字ビットマップの生成と入力記述子の保存のみを目的としたマイクロプロセッサを搭載していました。Olympia 1011中国語ワードプロセッサ(基本的には中国語専用電動タイプライター)では、3基のIntel 8085プロセッサのうち1基が中国語文字生成専用でした。
1980年代初頭には、こうした文字生成器はコモディティ化され、それ自体が販売可能な製品へと変貌を遂げました。もはや、オリンピア1011のような本格的なワードプロセッサを購入しなくても、この種の内蔵文字生成器を利用することができるようになりました。代わりに、「漢字カード」を購入し、好みのパソコンにインストールするだけで済むようになったのです。
中国のコンピュータ科学において漢字カードに着目した初期の研究拠点の一つは清華大学であり、同大学の研究者らは32×32ドットマトリックス形式で約6,000種類の漢字ビットマップパターンを格納できる初期の漢字カードを開発しました。1980年代半ばから後半にかけて、日本、中国、台湾、香港、米国など、世界中の企業によって数十種類の漢字が製造・販売されていました。
1980 年代の中頃から後半にかけて、「Chinese-on-a-chip」アプローチは非常に重要かつ一般的になり、中国語または日本語機能を備えたほぼすべてのコンピューターに、何らかの文字生成カードが搭載されるようになりました。
このように、1950年代のコールドウェルのSinotypeから、1980年代のローゼンブラム父子のチームとGARFによるSinotype IIIに至るまで、漢字に関連するメモリ問題の解決は、中国市場をコンピューティングに開放するための要でした。より多くのメモリを搭載したコンピューターのハッキング、文字の優先順位付けのための適応型メモリアルゴリズムの開発、そして専用ハードウェアの構築が、この問題を解決し、中国におけるコンピュータ革命のきっかけとなりました。
しかし、次のステップは、コンピューター本体を超えて、それに接続する可能性のあるあらゆるものに拡張する方法でした。TechCrunchでまもなく公開されるこのシリーズのパート2では、中国語テキスト出力に対応していた初期のコンピューターモニター、プリンター、その他の周辺機器の設計とプログラミングにおける課題について深く掘り下げながら議論を続けます。
サマーセール:エクストラクランチ会員が10%オフ