アマゾンのCTO、ヴェルナー・フォーゲルス氏は、莫大な資産を持ち、COVID-19パンデミック中にアムステルダム中心部の小さなAirbnbに住んでいたが、一体どうやって日々を過ごしているのだろうか?どうやら、AIを活用した会議要約アプリの開発らしい。想像してみてほしい。
今週、ヴォーゲルス氏は個人ブログに投稿した記事で、彼が「OCTO」(Office of the CTO)チームと共同で開発したオープンソースアプリ「Distill」について詳しく説明している。このアプリは、電話会議の音声を文字起こしして要約するものだ。Distillは、会議の音声録音(MP3、FLAC、WAVなどの形式)を取り込み、分析して要約とToDoリストを生成する。さらに、カスタム統合機能を通じて、Slackなどのプラットフォームに要約とリストを出力することも可能だ。

AmazonのCTOが開発したアプリらしく、Distillは膨大な計算処理をAmazonの有料製品やサービスに大きく依存しています。AWS TranscribeはDistillの文字起こしを、Amazon S3は会議の音声ファイルの保存場所を提供し、Amazonの生成AI開発スイートであるBedrockは要約処理を担当しています。
しかし、会議サマライザーを作る理由は、目的を達成できるツールが無数にあるのに、なぜ作らなければならないのでしょうか?Vogels氏は「なぜ作らないのか」と考えたに違いありません。彼には膨大なリソースがあり、趣味のプログラミングプロジェクトに費やす時間も十分にありそうです。ブログによると、彼はすでにDistillのコードベースをPythonからRustに移植する作業に取り組んでいるそうです。(CTOになれるなら、それは素晴らしい仕事です。)
Distillのユニークな点の一つは、会議の要約をどのAIモデルで実行するかを選択できることです。デフォルトでは、AnthropicのClaude 3ファミリーの中級モデルであるSonnetが選択されます(AmazonがAnthropicに多額の出資をしていることが、この設計上の決定に何らかの影響を与えている可能性があります)。しかし、MetaのLlama 3や、AIスタートアップ企業のMistral AI、AI21 Labs、Cohereなどのモデルなど、Bedrockでホストされているモデルであればどれでも動作します。
フォーゲルス氏は、ディスティル社が間違いを犯さないとは約束していない。
「AIは完璧ではないことを忘れないでください」と彼は書いている。「私たちが返す要約の中には…手動で修正が必要な誤りが含まれているものもあります。しかし、それでも問題ありません。なぜなら、AIはプロセスをスピードアップさせてくれるからです。これは、私たちが依然として判断力を持ち、プロセスに積極的に関与する必要があることを改めて認識させてくれるだけです。批判的思考は、これまで以上に重要です。」
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
要約作業に「関与」しなければならないというのは、自動要約機能の意義をある程度損なうと私は思います。速記者を雇った方がましでしょう。しかし、ヴォーゲルス氏が自分の雇用主が販売している技術を悪く言うのを耳にすることは決してないでしょう。そして、それが彼が今もCTOであり続ける理由だと私は確信しています。
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る