MozillaはFirefoxに公式翻訳ツールを追加しました。このツールはクラウド処理に依存せず、機械学習ベースの処理をユーザーのコンピューター上で直接実行します。GoogleやMicrosoftといった巨大企業と強く結びついている人気サービスにとって、これは大きな前進です。
Firefox Translationsと呼ばれる翻訳ツールは、こちらからブラウザに追加できます。初めて言語を翻訳する際には、いくつかのリソースをダウンロードする必要があります。また、必要に応じて改良されたモデルもダウンロードされる可能性がありますが、実際の翻訳作業は数百マイル離れたデータセンターではなく、ユーザーのコンピューターで行われます。
これが重要なのは、多くの人がオフライン時にブラウザで翻訳する必要があるからではなく (潜水艦の網戸のように、これは実際には意味のある使用例ではありません)、リソースを必要としないタスクについて、下心のあるクラウド プロバイダーへの依存を減らすことが目的だからです。
これはEUの資金提供を受けたプロジェクト「ベルガモット」の成果です。このプロジェクトでは、Mozillaが複数の大学と協力し、オフライン翻訳を可能にする機械学習ツール群を開発しました。通常、この種の作業はデータセンターのGPUクラスターで行われ、ユーザーのクエリを翻訳するために、ギガバイト単位の大規模言語モデル(数十億のパラメータを持つ)が展開されます。
GoogleやMicrosoft(DeepLなどの新興競合は言うまでもありません)のクラウドベースのツールは正確で(ほぼ無制限の計算能力があるため)高速ですが、データを第三者に送信して分析・返送させるという行為には、根本的なプライバシーとセキュリティ上のリスクが伴います。このリスクを許容できる人もいれば、必要がない限りインターネット広告大手を関与させたくないと考える人もいます。
新たな言語モデルの種類とその重要性
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
タパス店のメニューをGoogle翻訳で翻訳したら、ソーセージのプロモーションの標的にされるようになるでしょうか?さらに重要なのは、デバイスのIDと位置情報が分かっている状態で入国管理書類や医療書類を翻訳した場合、移民税関捜査局(ICE)が介入してくるのではないかということです。クラウドプロバイダーを使った翻訳のプライバシーへの影響を少しでも懸念している人にとって、状況に関わらず、オフラインで翻訳を行うのは理にかなっています。
翻訳の品質をすぐに試してみましたが、十分すぎるほどでした。以下はスペイン語ニュースメディア「エル・パイス」のトップページの一部です。

なかなか良いですね!もちろん、タブタイトルの「El País」は「The Paris」と翻訳され、他にも疑問符が付く表現がたくさんありました(ただし、すべての「|」は「Oh, it's a good thing」と翻訳されていて、かなり笑えます)。しかし、内容を理解する上ではそれほど支障はありませんでした。
結局のところ、ほとんどの機械翻訳は、基本的な意味を伝えることを目的としているのです。ニュアンスや微妙なニュアンスについては、大規模な言語モデルでさえもイディオムを再現できない可能性があります。そのため、実際にバイリンガルの翻訳者を使うのが最善の選択肢です。
おそらく最大の制約は対応言語の少なさでしょう。Google翻訳は100以上の言語に対応していますが、Firefox翻訳はスペイン語、ブルガリア語、チェコ語、エストニア語、ドイツ語、アイスランド語、イタリア語、ノルウェー語(ブークモール)、ニーノシュク、ペルシャ語、ポルトガル語、ロシア語の12言語に対応しています。これはかなり多くの言語を網羅していますが、これは非営利団体と研究者グループによるプロジェクトの最初のリリースに過ぎず、数十億ドル規模の世界規模のインターネット帝国の目玉製品ではないことを忘れないでください。
実際、開発者たちは「熱心な」ユーザーが新しいモデルを学習できるように、学習パイプラインを公開することで積極的に協力を求めています。また、既存のモデルを改善するためのフィードバックも募集しています。これは使える製品ではありますが、完成品とは決して言えません。
デヴィン・コールドウェイはシアトルを拠点とする作家兼写真家です。
彼の個人ウェブサイトは coldewey.cc です。
バイオを見る