コールセンター向けに、間接的な質問を拾い上げ、人間に引き継ぐ最適なタイミングを判断できる音声アシスタントを開発することは可能でしょうか?それは、ハードルをどの程度高く設定するかによって異なります。一般的に、顧客は電話での自動化された体験を期待していません。そのため、音声アシスタントは顧客の信頼を得るために、より一層の努力をする必要があります。2019年のある調査では、88%の人が自動システムを操作するよりも、ライブサービスエージェントと話すことを好むことがわかりました。
コールセンター・ソフトウェア市場は数百億ドル規模と推定されており、その鍵を解き明かそう、あるいは少なくともそれに近づこうとする強い動機がある。Google(およびGoogleのインキュベーターであるArea 120)、Microsoft、Amazon、Got It AI、Replicant、Tenyxなど、数え切れないほどの巨大テクノロジー企業やスタートアップ企業が、自動通話処理の問題に自社の技術を投入してきた。そして今、PolyAIという新興スタートアップ企業が、より効果的にこの問題を解決していると主張し、その普及率をその証拠として挙げている。ケンブリッジ大学からスピンアウトしたPolyAIは、FedExやMarriottなどの企業の電話に応答する音声アシスタントサービスを提供している。
投資家からの信頼の証として、PolyAIは本日、Georgianがリードし、Twilio Ventures、Khosla Ventures、Point72 Ventures、Amadeus Capital Partnersが参加した4,000万ドルのシリーズB資金調達ラウンドを完了しました。CEOのNikola Mrkšić氏はTechCrunchに対し、今回の資金調達によりPolyAIの調達総額は7,000万ドルとなり、資金調達後の企業価値は3億ドル近くに上ると語りました。この資金は、PolyAIが顧客獲得を強化する中で、市場開拓活動を支援するために活用される予定です。
PolyAIの創設者であるムルクシッチ氏、ツォン・シェン・ウェン氏、そしてペイ・ハオ・スー氏は、ケンブリッジ大学の対話システムグループで出会ったとムルクシッチ氏は説明する。このグループは音声対話システムを専門とする研究室である。彼らの博士課程での研究と、アップル(ムルクシッチ氏)、グーグル(ウェン氏)、フェイスブック(スー氏)での在職経験は、同社の多くの会話型AIシステムの基礎を築いた。

「企業は、前例のない労働力不足により、当社の技術を急速に導入しています。コンタクトセンターの失業率は低く、離職率も高いため、ブランドが一貫して高品質な顧客体験を提供する能力は圧迫されています」とムルクシッチ氏はメールで述べた。「この新たな環境により、人間のように話す高品質の音声アシスタントを導入する意欲が高まっています。」
「人間のように話す」というのは大げさかもしれない。PolyAIの音声アシスタント技術は、話せる内容に多少の制約があり、ウェブサイト上のデモはしばらくすると繰り返しのように聞こえるほどだ。しかし、同社は真の強みは言語理解へのアプローチにあると主張している。PolyAIはAIシステムを用いて顧客との会話中に何を言うべきかを推測し、競合プラットフォームが必要とするデータの「ほんの一部」だけで動作できるとしている。
「クライアントの潜在的に機密性の高い消費者データをモデルの学習に使用せずに、音声アシスタントをより迅速に導入できます。つまり、エンドユーザーの個人識別データが当社のシステムによって悪用されるリスクは一切ありません」とムルクシッチ氏は断言した。「当社のコアモデルは学習に顧客データを必要としません。クライアントの所在地に関わらず、GDPR基準に基づいて業務を行っています。」
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
AIシステムのもう一つの利点は、より自由で「インテリジェント」な会話を可能にすることだとムルクシッチ氏は述べた。PolyAIは、キーワードや決定木のようなフローに頼るのではなく、問い合わせの文脈を(ある程度)解釈し、適切な回答を試みる。
例えば、ピザ店に電話をかけてきた顧客がデリバリー注文の進捗状況を尋ねた場合、PolyAIはその電話番号を認識し、関連情報をプロアクティブに表示する可能性があります。また、ホテルの宿泊客がスタンダードルームを予約するために電話をかけてきたものの、考えを変えてスイートルームにすることにした場合、プラットフォームは新しい条件に合う部屋を提案するかもしれません。
「他のベンダーは発信者の話し方を制限し、特定のキーワードと決定木形式の対話フローに限定していますが、PolyAIは、発信者が何を言うか、どのように話すかに関係なく、発信者を理解し、顧客の質問を解決するのに必要なだけ会話を続けることができるように、当社の技術スタック全体を開発しました」とムルクシッチ氏は述べた。
さらに、PolyAIはカスタマーサービス担当者が行える多くのタスクを実行できます。支払い情報に加え、氏名、住所、口座番号(健康保険など)の取得も含まれます。パフォーマンスは人のアクセントによって異なる場合があります。PolyAIは自社の技術がアクセントに依存しないと主張していますが、最高の音声認識システムでさえ特定の方言には対応できないことは周知の事実です。とはいえ、Mrkšić氏によると、ほとんどの顧客にとってPolyAIのプラットフォームは十分に信頼性の高い応答をするため、慣れ親しむことができ、まるで人間に話しかけるように話しかけられるようになるとのことです。

「人々は音声技術の限られた機能に慣れてしまっているため、ロボットのように返答しようとする傾向があることが分かりました。しかし、2、3回うまくやり取りして顧客の意図が十分に理解され、音声アシスタントが役立つ回答を返すと、発信者はより自然な話し方に前向きになります」とムルクシッチ氏は述べています。
問題は、自動通話処理に対する顧客の大多数が考えを変えるかどうかだ。しかし、最終的には、それは重要ではないかもしれない。「大辞任」の圧力とコールセンター業界の離職率の上昇により、顧客が好むと好まざるとにかかわらず、企業は自動化の拡大を受け入れる可能性が高い。
2020年のCanam Researchの調査によると、米国に拠点を置くコンタクトセンターの78%が、平均処理時間の短縮と顧客待ち時間の最小化の可能性を理由に、今後3年以内に何らかの形でAIを導入する予定であると回答しました。当然のことながら、多くのセンターにとって収益は最優先事項であり、57%のセンターがAI導入の目的としてコスト削減を挙げています。
一例として、PolyAI は数十の企業や政府機関の顧客を抱えており、その発信者は毎月数百万回、プラットフォームの音声アシスタントと対話していると主張している。
「パンデミック後の人手不足により、多くの企業が音声自動化の計画を加速させています。ホスピタリティ業界を例に挙げると、パンデミック中に多くの労働者が業界を去りました」とムルクシッチ氏は述べています。「それ以来、ホテルやレストランはスタッフの再雇用が困難になっています。PolyAIは、これらの企業が電話に応答し、スタッフが店内でゲストに対応できるよう支援しています。」
人員拡大の計画について尋ねられたムルクシッチ氏は、不透明な経済情勢の中であまり多くのことを約束することに抵抗を感じたのか、答えを控えた。PolyAIは現在、米国と英国で98人の従業員を雇用している。