AI音声プラットフォーム・ボイスボット用語集:知っておくべき60の用語(受電・架電・グローバル)
公開日: 2026年2月 / カテゴリ: 技術解説 / ターゲットキーワード: ボイスボット 用語集, 音声AI 用語, voice AI glossary
AI音声技術の進歩により、企業の電話業務が急速に変化しています。しかし、専門用語の多さが導入検討の障壁となっていませんか?
総務省「情報通信白書令和6年版」によると、日本のAI活用企業は年率23.4%で増加していますが、技術理解の不足が導入阻害要因の第1位となっています。特に音声AI分野は、ASR、TTS、NLU、コンバージョナルAIなど、英語由来の専門用語が混在しており、業務担当者にとって理解が困難な状況です。
本記事では、AI音声プラットフォーム・ボイスボット領域で使われる重要用語60選を、受電・架電・グローバル対応の観点から体系的に解説します。経済産業省「DXレポート2.1」が示すDX加速の文脈において、正しい用語理解は適切な技術選択の第一歩となります。
基礎用語:音声AI技術の核心概念
ASR(Automatic Speech Recognition / 音声認識)
音声をテキストに変換する技術。日本語では「音声認識」と呼ばれ、ボイスボットの最初のステップです。Google Speech-to-Text、Amazon Transcribe、Microsoft Azure Speech Servicesなどのクラウドサービスが代表的。認識精度は95%以上が実用レベルとされています。
TTS(Text-To-Speech / 音声合成)
テキストを自然な音声に変換する技術。従来の機械的な音声から、近年は人間に近い自然な発話が可能になりました。ElevenLabs、OpenAI、Google Cloud TTSなどが高品質な日本語対応を提供。感情表現やトーン調整も可能です。
NLU(Natural Language Understanding / 自然言語理解)
認識されたテキストの意図を理解する技術。「明日の予約を変更したい」という発話から、「予約変更」という意図と「明日」という時間情報を抽出します。ChatGPT、Claude、Geminiなどの大規模言語モデルが活用されています。
NLG(Natural Language Generation / 自然言語生成)
理解した意図に基づいて、自然な応答文を生成する技術。単なるテンプレート応答ではなく、文脈に応じた柔軟な回答を生成します。
ボイスボット(Voicebot)
音声による自動対話システムの総称。チャットボットの音声版として位置づけられ、ASR、NLU、NLG、TTSを統合したシステムです。AI受電とは?電話自動応答の完全ガイド — IVRを超えるAI電話対応では詳細な仕組みを解説しています。
受電(インバウンド)関連用語
IVR(Interactive Voice Response)
従来の自動音声応答システム。「〇〇の件は1番を押してください」形式の操作。総務省調査では、73%の利用者がIVRでの解決を諦めて有人対応を求めています。AI音声プラットフォームは、このIVRの限界を解決する次世代技術として注目されています。
バージイン(Barge-in)
発話中に割り込み入力を受け付ける機能。「お客様の番号は〜」という案内中に、顧客が番号を話し始めても認識できる技術です。自然な会話体験に必須の機能。
ハングアップ率(Hang-up Rate)
自動応答中に顧客が電話を切る割合。従来のIVRでは30-40%と高い水準ですが、AI音声対応では10%以下に改善される事例が報告されています。
ファーストコールレゾリューション(FCR)
初回の電話で問題を解決する割合。コールセンターKPIの最重要指標の一つ。AI音声プラットフォーム導入により、FCR率が20-30%向上する企業が多数存在します。
エスカレーション
AI音声対応から人間オペレーターへの引き継ぎ。適切なエスカレーション設計が顧客満足度に直結します。電話受付の自動化:まず分けるべき用件トップ7で詳しく解説しています。
コンテキスト保持
会話の文脈を記憶し続ける機能。「さっき話した件について」といった参照に対応できます。短期記憶と長期記憶の両方を管理する高度な技術です。
架電(アウトバウンド)関連用語
オートダイアラー(Auto Dialer)
自動的に電話番号にダイヤルするシステム。従来は人間オペレーターに接続していましたが、AI音声プラットフォームでは完全自動化が可能です。
コンタクト率(Contact Rate)
架電に対して実際に会話が成立する割合。一般的な営業架電では**15-25%程度ですが、AI活用により40-50%**まで向上させた事例があります。AI自動架電でアウトバウンド営業を効率化する方法|ノーコードで始める完全ガイドで具体的手法を紹介しています。
コンバージョン率(Conversion Rate)
架電から成約・アポイント獲得等の目標達成に至る割合。業界平均**2-5%に対し、AI音声エージェントでは8-12%**を達成する企業も存在します。
ドロップ率(Drop Rate)
自動架電で接続されたが、AI音声対応開始前に切られる割合。初期の挨拶設計が重要で、3秒以内に価値を伝える必要があります。
DNC(Do Not Call)
架電拒否リスト。法的コンプライアンス要件として、DNCリストとの照合が必須です。AI音声プラットフォームでは自動照合機能を搭載している場合が多数。
プレディクティブダイアリング
複数番号に同時架電し、応答があったものをオペレーターに接続する技術。AI音声プラットフォームでは、オペレーター不足を解決する重要機能です。
技術アーキテクチャ用語
API(Application Programming Interface)
システム間連携のインターフェース。CRMや基幹システムとの連携で、顧客情報の自動取得・更新が可能になります。RESTful APIが標準的。
Webhook
イベント発生時に自動的に外部システムに通知する仕組み。通話終了時にCRMに結果を自動記録するなど、リアルタイム連携に活用されます。
SIP(Session Initiation Protocol)
VoIP通話の確立・制御に使用される標準プロトコル。企業のPBXシステムとAI音声プラットフォームの接続で重要な技術仕様です。
WebRTC(Web Real-Time Communication)
ブラウザ間でのリアルタイム通信を可能にする技術。Webベースの音声通話機能で活用されています。
レイテンシ(Latency)
音声認識から応答までの遅延時間。自然な会話には300ms以下が求められます。ネットワーク、処理、音声合成の各段階で最適化が必要です。
ストリーミング処理
音声データをリアルタイムで処理する技術。従来のバッチ処理と異なり、発話と同時に認識・理解・生成を並行実行します。
ビジネス指標・ROI用語
AHT(Average Handle Time)
1件あたりの平均処理時間。人間オペレーター:8-12分に対し、AI音声対応:3-5分と大幅短縮が可能です。
CSAT(Customer Satisfaction Score)
顧客満足度スコア。5段階評価で測定され、AI音声対応では4.2-4.5の高評価を獲得する事例が増加しています。
NPS(Net Promoter Score)
顧客推奨度を測る指標。「この会社を友人に勧めますか?」の質問に対する0-10評価。AI導入によりNPS向上を達成する企業が多数存在。
TCO(Total Cost of Ownership)
システム導入・運用の総コスト。初期費用、月額費用、人件費、教育コストを含めた包括的な評価指標です。
ROAS(Return on Advertising Spend)
広告投資収益率。架電営業をマーケティング活動として捉えた場合の効果測定指標。AI活用により**ROAS 300-500%**を達成する企業も。
CPA(Cost Per Acquisition)
顧客獲得単価。従来の人的営業:15,000-30,000円に対し、AI音声営業:3,000-8,000円と大幅削減が可能です。
グローバル・多言語対応用語
i18n(Internationalization)
国際化対応。システムを複数言語・地域に対応させる設計手法。AI音声プラットフォームでは、日本語・英語・中国語等への対応が重要です。
l10n(Localization)
地域化対応。言語だけでなく、文化・慣習・法規制への適応を含みます。日本市場では敬語対応、電話マナーの配慮が必須。
GDPR(General Data Protection Regulation)
EU一般データ保護規則。グローバル展開時の個人情報保護要件。音声データの処理・保存で厳格な規制があります。
CCPA(California Consumer Privacy Act)
カリフォルニア州消費者プライバシー法。米国展開時のプライバシー規制。音声録音データの取り扱いで重要な法的要件です。
クロスリンガル
複数言語間での自動翻訳・対応機能。日本語で話しかけても英語で応答する、またはその逆の対応が可能な技術です。
アクセント適応
地域別の発音・アクセントに対応する機能。関西弁、東北弁などの方言や、外国人の日本語発音への対応が含まれます。
セキュリティ・コンプライアンス用語
PCI DSS(Payment Card Industry Data Security Standard)
クレジットカード業界のデータセキュリティ基準。音声による決済情報取得時に必要な認証です。
HIPAA(Health Insurance Portability and Accountability Act)
米国の医療情報保護法。医療機関でのAI音声利用時に適用される規制。日本でも医療分野では同等の配慮が必要です。
個人情報保護法
日本の個人情報保護に関する法律。音声データは個人情報に該当するため、適切な取得同意・利用目的明示が必要です。
エンドツーエンド暗号化
送信者から受信者まで、中継点でも解読不可能な暗号化技術。音声通話の秘匿性確保に必須の技術です。
通話録音(Call Recording)
法的要件や品質管理のための通話記録機能。金融機関では100%録音が義務付けられている場合があります。
監査ログ(Audit Log)
システム利用状況の詳細記録。誰が、いつ、どのような操作を行ったかを追跡可能にする機能です。
新興技術・トレンド用語
RAG(Retrieval-Augmented Generation)
検索拡張生成。外部知識ベースから情報を取得して回答を生成する技術。最新の製品情報や社内規定に基づく正確な応答が可能です。
エージェンティックAI(Agentic AI)
自律的に判断・行動するAI技術。単純な質疑応答を超え、複数のタスクを連携実行できます。MCPで"業務連携する電話AI"を作る:ワークフロー統合の概念と実装パターンで詳細を解説しています。
マルチモーダルAI
音声、テキスト、画像などの複数の入力形式に対応するAI。将来的には画面共有しながらの音声サポートが可能になります。
ゼロショット学習
事前学習なしで新しいタスクに対応する技術。業界特有の専門用語にも即座に対応可能な次世代AI技術です。
フェデレーテッドラーニング
分散学習技術。各企業のデータを外部に出すことなく、AIモデルの精度向上が可能。プライバシー保護と性能向上を両立します。
エッジコンピューティング
クラウドではなく、端末側でのAI処理。レイテンシ削減とプライバシー保護のメリットがあります。
プラットフォーム固有用語
ノーコード(No-Code)
プログラミング不要でシステム構築が可能な開発手法。StepAIの「Reco」のように、業務担当者が直接AI音声エージェントを設計できます。
ローコード(Low-Code)
最小限のコーディングでシステム開発を行う手法。ノーコードとフルスクラッチ開発の中間的位置づけです。
GUI(Graphical User Interface)
グラフィカルな操作画面。ドラッグ&ドロップでボイスボットの対話フローを設計できるインターフェースです。
A/Bテスト
異なるバージョンの性能を比較検証する手法。挨拶文A版とB版でコンタクト率を比較するなど、継続的改善に活用されます。
ダッシュボード
KPI可視化画面。通話件数、成



