カカオはAI画像生成器「Karlo 2.0」で生成AIのゲームを強化した

カカオはAI画像生成器「Karlo 2.0」で生成AIのゲームを強化した

韓国のテクノロジー大手カカオは、生成AIの競争に参入したいと考えており、本日、AI画像生成ツールKarloと大規模言語モデルKoGPTの大幅なアップデート、およびAI画像生成のスタートアップを支援するための新しいファンドの設立により、その競争に参入する入札を行った。

カカオのAI部門カカオ・ブレインが、テキストプロンプトから画像を生成できるAI搭載ツール「Karlo 2.0」をリリースしたことで、ユーザーは英語や韓国語でプロンプトを入力するだけで、わずか数秒で画像を生成できるようになった。

一方、KoGPT 2.0 は 2023 年第 3 四半期までリリースされる予定はありませんが、300 億の異なるパラメータでトレーニングされる予定です。

カカオブレインは、画像生成技術を開発するAIスタートアップ企業を支援するため、  100億ウォン(770万ドル)規模のファンド「Karlo 100X」も設立した。

Kakaoの発表は、他の既存テック企業と同様に、同社がAIの進歩のスピードに追いつくために直面​​しているプレッシャーを浮き彫りにしている。OpenAIやMidjourneyといった新興企業が大きな話題を呼び、今最も注目されるイノベーションに関する話題を独占している。一方、老舗企業にとっての脅威は、次に来るものを活用できないというだけでなく、古臭く見えてしまうことにある。

注目すべきことに、Karlo 2.0は、同社の前回のアップデート(1.4)からわずか7か月後にリリースされます。Kakao Brainは以前、高度なテキスト画像生成ツール「RQ-Transformer」と「minDALL-E」をGitHubでリリースしていました。 

同社によると、Karlo 2.0は3億点のテキストと画像で学習されており、最大2048×2048の解像度をサポートしているため、様々なスタイルやサイズの画像の品質と鮮明度が向上しています。これは、Karloの以前のバージョン(以前のバージョンは1億8000万点のテキストと画像のデータポイントで学習されていました)と比べて大きな進歩です。 

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Karlo 2.0では開発者にとってさらに使いやすくなり、Kakao開発者向けに公開APIが提供され、開発者は無料で毎月60万枚の画像を作成できるようになります。

KoGPTと呼ばれる前身は、2021年にリリースされ、韓国語のデータを用いて 、わずか60億のパラメータで2000億トークンの学習を行いました。現在、英語、日本語、そしてマレーシア語やベトナム語を含むその他のアジア言語を追加する計画です。Kakao Brainは、2023年第3四半期を目標に、300億パラメータのKoGPT 2.0をリリースする予定です。 

画像クレジット: Kakao Brain

Kakaoの動きは興味深いが、独力で行われているわけではなく、多くの既存の競合企業と対峙することとなるだろう。画像生成ツールは既にOpenAI(DALL-E)、Midjourney、そして Stable DiffusionのDream Studioから提供されている。つい先週、中国の巨大テック企業アリババは、企業顧客向けにAIを活用したテキスト画像生成モデル「Tongyi Wanxiang」を発表した。 

地域リーダーであるメッセージングアプリ「カカオトーク」と同様に、カカオのような企業にとってのチャンスは、世界制覇を目指すのではなく、AI画像分野で市場をリードする存在となることにあるようだ。今年初め、カカオのCEOであるホン・ウンテク氏は決算説明会で、韓国のテクノロジー企業が生成型AIサービスを提供すると述べた。しかし、ホン氏によると、カカオは(今のところは)韓国語に重点を置いたAIサービスを開発していくという。

カカオがAI分野における他の野心と連携して、この分野をどのように、そして実際に構築していくのか、注目される。例えば、同社はヘルスケア業界への進出を進めている。同社は、医用画像を分析し、患者の胸部X線写真の診断案を医師向けに作成するAI生成サービスを開発している。また、創薬のためのAI技術も開発している。 

「人間のプロポーションや構図、空間感や立体感を表現する透視図法など、様々な画像データと技術の進歩を学習するプロセスを経て、Karlo 2.0を発表できることを嬉しく思います」と、カカオブレインのCEOであるキム・イルドゥ氏は声明で述べています。「豊富なデータとユーザーからのフィードバックを活用し、フォトリアリスティックな画像を作成するとともに、より幅広いユーザーニーズに対応できる画像生成モデルの開発も進めていきます。」

地域的にもカカオの競争は激しく、他の韓国企業も生成AI分野での地位を争うために独自のAI製品を積極的に開発している。 

ネイバーは来月、HyperCLOVA Xと呼ばれる生成AIサービスとAIチャットボットSearchGPTをリリースする予定だ。

2021年12月、韓国のテクノロジー企業LGのAIシンクタンクであるLG AI Researchは、3,000億パラメータのAI搭載大規模言語モデル「Exaone」を発表しました。LGエレクトロニクス、LGエナジーソリューション、LG U+、LGディスプレイなど、LGの子会社のほとんどがExaoneを使用しています。LGエレクトロニクスは、ChatGPT、Google Bard、MicrosoftのBing AIなどの生成AIツールの使用をブロックした ことを受けて、5月に独自のAIチャットボットをリリースしました。

また、サムスンは機密データ漏洩後に生成AIツールを制限した 後、社内専用 の非公開生成AIツールを開発していると報じられている。 

韓国最大の通信会社の一つであるSKテレコムも、MicrosoftのAzure OpenAIをベースとしたChat GPT技術を、自社のAIチャットボット「A. [A dot]」に追加しました。韓国の大手通信会社2社、KTとLG傘下のU+も、ChatGPT技術をベースにしたAIチャットボットを開発中であると、地元メディアが報じています。  

このストーリーは、KoGPT 2.0 が OpenAI の GPT-3.5 に基づいていないことを反映するように更新されました。 

ケイト・パークはTechCrunchの記者で、アジアのテクノロジー、スタートアップ、ベンチャーキャピタルを専門としています。以前はMergermarketで金融ジャーナリストとしてM&A、プライベートエクイティ、ベンチャーキャピタルを担当していました。

バイオを見る