關(guān)于我們

聯(lián)系我們

當(dāng)前位置：首頁(yè)-新聞動(dòng)態(tài)如何從零開始搭建智能外呼系統(tǒng)？

如何從零開始搭建智能外呼系統(tǒng)？

作者：admin 來(lái)源：本站發(fā)布時(shí)間：2021-07-29 09:51:09

一、序言

隨著人工智能技術(shù)的發(fā)展，近半年來(lái)涌現(xiàn)了大量基于人工智能的呼叫中心業(yè)務(wù)服務(wù)商和集成商。僅電銷機(jī)器人這一個(gè)方向就少有近百家公司正在推廣運(yùn)營(yíng)，包括奇高，嘉舜等。商務(wù)上的需求非常強(qiáng)烈，整個(gè)市場(chǎng)都飛快地?zé)狒[起來(lái)。

一套可提供saas服務(wù)的智能外呼系統(tǒng)，看起來(lái)功能并不復(fù)雜。一個(gè)網(wǎng)站可注冊(cè)、充值繳費(fèi)開票，登錄后在后臺(tái)頁(yè)面選擇或者定制外呼話術(shù)腳本，新建外呼任務(wù)并導(dǎo)入外呼號(hào)碼列表，明確外呼策略（時(shí)間段、重呼次數(shù)），設(shè)置外呼機(jī)器人數(shù)量（同時(shí)撥出幾個(gè)號(hào)碼），點(diǎn)擊開始。然后就可以看著進(jìn)度條走完，外呼機(jī)器人按照列表一個(gè)個(gè)打電話出去。任務(wù)完成后，可以查看外呼結(jié)果列表。

那么如何從零開始搭建一套對(duì)外可以提供saas服務(wù)的智能外呼系統(tǒng)呢？

二、總覽

我們先列出，搭建這樣一整套系統(tǒng)需要哪些技術(shù)和資源：

運(yùn)營(yíng)商線路：提供方包括三大運(yùn)營(yíng)商、集成線路商，這是我們打電話出去要交電話費(fèi)，必須涉及的供應(yīng)商。
呼叫中心設(shè)備：商用設(shè)備原廠包括avaya、genesys、cisco、華為等，集成商很多，開源的也有一些。在發(fā)起外呼任務(wù)時(shí)，saas平臺(tái)是把外呼請(qǐng)求發(fā)給了呼叫中心設(shè)備經(jīng)由運(yùn)營(yíng)商線路而撥出去的。
AI能力：包含語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解。這就是外呼機(jī)器人的核心組成部分，它能聽懂接電話的人所說(shuō)的話、表達(dá)的意思，并回復(fù)和引導(dǎo)對(duì)話。
saas服務(wù)平臺(tái)：即用戶可以注冊(cè)、登錄、繳費(fèi)、上傳呼叫列表、發(fā)起外呼任務(wù)、外呼結(jié)果查看的網(wǎng)站，這個(gè)是終端用戶可以看得到的前端界面。

四個(gè)主要模塊，其中一些難以自研，只能選擇供應(yīng)商：

AI能力部分（中文ASR/TTS）基本已經(jīng)格局穩(wěn)定，沒太多可挑選的。
運(yùn)營(yíng)商資源這塊兒，可以選擇老廠的碼號(hào)線路資源多的然后便宜的去談合作，一方面外呼應(yīng)用在催收?qǐng)鼍皶r(shí)容易被封號(hào)，同時(shí)話費(fèi)再便宜也好幾分錢一分鐘，也是重要的成本。
呼叫中心設(shè)備，因?yàn)樯婕安簧俳涌趯?duì)接調(diào)試，優(yōu)先選自己熟悉的，其次選便宜的且技術(shù)資料多的。
是外呼saas平臺(tái)，可能這是各個(gè)電銷機(jī)器人服務(wù)商/集成商容易實(shí)現(xiàn)自研的部分。

明確了涉及到的技術(shù)和資源之后，再明確一下建設(shè)步驟。由于各個(gè)廠商都有各自的資源和能力，建設(shè)方式也各不相同，簡(jiǎn)單來(lái)說(shuō)可以分成以下幾類：

有運(yùn)營(yíng)商資源的，等著別人找上門來(lái)就行了。
呼叫中心廠商，必然有已長(zhǎng)期合作的運(yùn)營(yíng)商線路資源，手里也有呼叫中心設(shè)備+職場(chǎng)，也有技術(shù)人員。于是就選擇自研saas平臺(tái)，然后找AI能力廠商合作提供ASR/TTS/NLU。
AI能力廠商，尤其以NLU起家的在線客服類廠商，通常會(huì)選擇嘉舜的語(yǔ)音能力，然后去找呼叫中心類廠商合作。
啥都沒有，只有幾個(gè)技術(shù)人員的，選擇自研saas平臺(tái)，接入呼叫中心設(shè)備、AI能力、運(yùn)營(yíng)商資源。

作為初學(xué)者，為了自行從零開始搭建一套對(duì)外可以提供saas服務(wù)的智能外呼系統(tǒng)，身份必然是第四種，啥都沒有，啥都要干。

以上這四部分，核心角色是呼叫中心。AI只是插上了想象力的翅膀，但是沒這翅膀，呼叫中心還是呼叫中心，但是AI就只是空中樓閣了。業(yè)務(wù)明確可落地的呼叫中心才是想象力的基石，這一點(diǎn)與CV和安防的關(guān)系很像。

三、呼叫中心搭建

1. 通信原理

目前對(duì)呼叫中心比較普遍接受的定義是：呼叫中心是以計(jì)算機(jī)電話集成（CTI）技術(shù)系統(tǒng)為基礎(chǔ)，將計(jì)算機(jī)的信息處理功能、數(shù)字程控交換機(jī)的電話接入和智能分配、自動(dòng)語(yǔ)音處理技術(shù)、 Internet技術(shù)、網(wǎng)絡(luò)通信技術(shù)、商業(yè)智能技術(shù)與業(yè)務(wù)系統(tǒng)緊密結(jié)合在一起，將公司的通信系統(tǒng)、計(jì)算機(jī)處理系統(tǒng)、人工業(yè)務(wù)代表、信息等資源整合成統(tǒng)一、的服務(wù)工作平臺(tái) 。

一代呼叫中心架構(gòu)NGCC（Next Generation Call Center）如下圖所示：

具體如何理解呢？

先從簡(jiǎn)單的說(shuō)起：個(gè)人A給個(gè)人B打了個(gè)電話。

流程：A→PSTN→B
解釋：PSTN是Public Switched Telephone Network，公共交換電話網(wǎng)絡(luò)，也就是運(yùn)營(yíng)商的電話網(wǎng)絡(luò)。

然后來(lái)個(gè)復(fù)雜點(diǎn)的：個(gè)人A給呼叫中心400xxxxxxxx打了個(gè)電話，撥通后先聽到了錄音，“您好，找B類接線員說(shuō)話請(qǐng)按0號(hào)鍵”。按了0，然后聽到錄音，“排隊(duì)中，請(qǐng)稍后”。幾分鐘后接通，B0026號(hào)接線員接了電話。

流程：A→PSTN→PBX→IVR→ACD→B

解釋：PBX是Private Branch Exchange，用戶級(jí)交換機(jī)，這是企業(yè)內(nèi)部的局端用戶級(jí)交換機(jī)，整個(gè)呼叫中心的出入口設(shè)備。

PSTN到PBX之間是中繼（分成模擬中繼、數(shù)字中繼、IP中繼），這是將通訊公司的局端交換機(jī)與企業(yè)內(nèi)部的用戶級(jí)交換機(jī)（PBX）相連的通訊線路。

IVR是Interactive Voice Response，互動(dòng)/交互式語(yǔ)音應(yīng)答，我們把它叫語(yǔ)音導(dǎo)航。實(shí)現(xiàn)的是類似撥打10086后聽到錄音說(shuō)，xx業(yè)務(wù)請(qǐng)按x，這個(gè)環(huán)節(jié)。主要用途是根據(jù)業(yè)務(wù)分流來(lái)電，進(jìn)入對(duì)應(yīng)的排隊(duì)機(jī)。

ACD是Automatic Call Distribution，自動(dòng)電話分配，也叫排隊(duì)機(jī)。

再來(lái)個(gè)復(fù)雜點(diǎn)的：個(gè)人A給呼叫中心400xxxxxxxx打了個(gè)電話，撥通后先聽到了錄音，“您好，您想找哪類接線員？”

個(gè)人A說(shuō)，“B~~”。

然后很快接通，“您好，這是B0026號(hào)機(jī)器人，有什么可以幫您？”

個(gè)人A說(shuō)，“我不想跟機(jī)器人說(shuō)話，泥奏凱~”

然后聽到錄音，“為您轉(zhuǎn)接很貴的真人客服，排隊(duì)中，請(qǐng)稍后”。

幾分鐘后接通，B1026號(hào)真人接線員接了電話。

流程：A→PSTN→PBX→IVR（→ASR→NLU）→ACD（→ASR→NLU→DM→NLG→TTS）→ACD→B

解釋：現(xiàn)在智能的部分，也就是我們說(shuō)的語(yǔ)音機(jī)器人的部分，分別在IVR和虛擬坐席處體現(xiàn)。

IVR部分，不再需要提示按鍵，而是直接問(wèn)來(lái)電方需要辦理什么業(yè)務(wù)，然后識(shí)別語(yǔ)音、理解意圖后，進(jìn)入對(duì)應(yīng)的業(yè)務(wù)隊(duì)列排隊(duì)。排隊(duì)后可以等待真人客服接待，也可以由機(jī)器人先行接待。

機(jī)器人（實(shí)際是服務(wù)器資源）資源空閑時(shí)，直接接待，進(jìn)行語(yǔ)音對(duì)話，對(duì)話過(guò)程就是語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音合成的多次調(diào)用，部分業(yè)務(wù)涉及業(yè)務(wù)數(shù)據(jù)接口對(duì)接調(diào)用，比如查詢?cè)捹M(fèi)、積分。并可以根據(jù)需求自動(dòng)或者選擇轉(zhuǎn)人工，再次進(jìn)入排隊(duì)，等候真人客服接待。

其中IVR部分示意圖如下：

2. 集成實(shí)施

上面提到的全部流程中，PBX、IVR、ACD等部分基本都是由我們說(shuō)的呼叫中心設(shè)備商提供，產(chǎn)品有三種類型:板卡式、交換機(jī)式、VoIP形式。

交換機(jī)式比較適合大型職場(chǎng)，例如三五百人以上，硬件價(jià)格五位數(shù)。交換機(jī)領(lǐng)域，主要有：avaya、genesys、cisco、華為、中興，其中常用的兩家對(duì)比下來(lái)，avaya比genesys便宜（參見文章）。

板卡式適合中小型職場(chǎng)，比如幾十人到兩三百人，硬件價(jià)格四位數(shù)?；诎蹇ńㄔO(shè)呼叫中心的步驟，可以參考使用三匯板卡的這幾篇（主要前4篇講原理）。

選擇板卡之前，先要確定選用哪種中繼線路，比如：使用常規(guī)的數(shù)字中繼，那么就需要選擇數(shù)字板卡，這個(gè)找板卡的供應(yīng)商問(wèn)就行了。通常來(lái)說(shuō)呼叫中心要購(gòu)買的一條E1數(shù)字中繼報(bào)價(jià)五位數(shù)/年，由用戶級(jí)交換機(jī)將局端的光信號(hào)轉(zhuǎn)換為30路模擬信號(hào)，也就是支持30個(gè)人同時(shí)接打電話，通話費(fèi)會(huì)另外按照實(shí)際呼出分鐘數(shù)收取。

近期一個(gè)實(shí)際落地項(xiàng)目是選擇了數(shù)字中繼+Asterisk（開源VoIP PBX純軟方案），（可參考：安裝配置，調(diào)試）示意圖如下：

具體的軟件業(yè)務(wù)細(xì)節(jié)，比如：常規(guī)客服中心需要的管理模塊、配置模塊、工單服務(wù)、坐席服務(wù)、報(bào)表模塊、CRM，還有比如：坐席班長(zhǎng)監(jiān)聽、通話插入、質(zhì)檢，錄音文件管理等整套軟件細(xì)節(jié)，不做詳述。

四、AI能力對(duì)接

在具體落地中，這個(gè)領(lǐng)域的常規(guī)參與者通常具備呼叫中心能力或者AI能力其中一種，而主要的對(duì)接點(diǎn)也就在于AI能力與呼叫中心設(shè)備去對(duì)接，而ASR/TTS與呼叫中心設(shè)備對(duì)接的常規(guī)協(xié)議主要是mrcp/sip。

媒體資源控制協(xié)議（Media Resource Control Protocol, MRCP）是一種通訊協(xié)議，用于語(yǔ)音服務(wù)器向客戶端提供各種語(yǔ)音服務(wù)(如語(yǔ)音識(shí)別和語(yǔ)音合成)。有兩個(gè)版本的MRCP協(xié)議，版本2使用SIP作為控制協(xié)議，版本1使用RTSP。

實(shí)際對(duì)接的時(shí)候，會(huì)遇到不少技術(shù)問(wèn)題，有的呼叫中心廠商會(huì)要求ASR/TTS引擎做私有云部署，這樣避免了內(nèi)外網(wǎng)穿透時(shí)防火墻的諸多設(shè)置和語(yǔ)音流的時(shí)延。這對(duì)基于語(yǔ)義起家（并購(gòu)買語(yǔ)音能力）的公司是一個(gè)小小的難題。

1. 語(yǔ)音識(shí)別

現(xiàn)有技術(shù)中實(shí)現(xiàn)一次性語(yǔ)音識(shí)別典型的流程時(shí)序，具體包括一下步驟：

MRCP Client發(fā)送INVITE消息給MRCP Server請(qǐng)求建立會(huì)話，攜帶MRCP Client側(cè)的SDP；
MRCP Server回復(fù)200表示請(qǐng)求已經(jīng)成功接受處理，攜帶MRCP Server側(cè)的SDP；
MRCP Client隨后發(fā)送ACK消息證實(shí)200消息已經(jīng)收到，此一個(gè)SIP會(huì)話成功建立；
MRCP Client發(fā)送RECOGNIZE消息給MRCP Server請(qǐng)求語(yǔ)音識(shí)別，按照MRCP協(xié)議規(guī)定的格式攜帶相關(guān)的語(yǔ)音識(shí)別控制參數(shù)，并且指定語(yǔ)法文件路徑；
MRCP Server接收RECOGNIZE請(qǐng)求，編譯語(yǔ)法文件，回復(fù)200消息給MRCP Client；
MRCP Client此時(shí)開始根據(jù)之前協(xié)商好的SDP，開始源源不斷的發(fā)送RTP語(yǔ)音流給MRCP Server；
MRCP Server接收RTP語(yǔ)音流，當(dāng)檢測(cè)到用戶開始說(shuō)話時(shí)，發(fā)送START-OF-INPUT事件；
當(dāng)MRCP Server根據(jù)語(yǔ)法文件定義得到識(shí)別結(jié)果時(shí)，通過(guò)RECOGNITION-COMPLETE事件返回識(shí)別結(jié)果；
MRCP Client發(fā)送BYE消息給MRCP Server結(jié)束會(huì)話；
MRCP Server發(fā)送200消息給MRCP Client確認(rèn)結(jié)束；
MRCP Client通過(guò)上述流程獲得MRCP Server提供的一次完整語(yǔ)音識(shí)別能力。

電話渠道的語(yǔ)音流采樣率一般是8k 16bit，這種語(yǔ)音識(shí)別的準(zhǔn)確率遠(yuǎn)遠(yuǎn)低于app等渠道采集音頻的識(shí)別率。再加上人在打電話時(shí)說(shuō)話方式相對(duì)隨意，導(dǎo)致語(yǔ)音識(shí)別部分成為了影響電話機(jī)器人能力和效果的重要瓶頸。

2. 語(yǔ)音合成

實(shí)現(xiàn)語(yǔ)音合成典型的流程時(shí)序，具體包括一下部分：

SPEAK:向服務(wù)器端提供文本,啟動(dòng)語(yǔ)音合成（c→s）。
STOP:如果服務(wù)器正在語(yǔ)音合成資源,則停止語(yǔ)音合成與語(yǔ)音流（c→s）。
PAUSE:通知服務(wù)器資源暫停語(yǔ)音合成與語(yǔ)音流（c→s）。
RESUME:通知暫停的語(yǔ)音合成資源繼續(xù)進(jìn)行語(yǔ)音合成與語(yǔ)音流（c→s）。
CONTROL:更改語(yǔ)音合成資源相關(guān)參數(shù),從而影響合成的語(yǔ)音流（c→s）。
SPEAK-COMPLETE: SPEAK請(qǐng)求已經(jīng)成功處理（s→c）。
SPEECH-MARKER:服務(wù)器正在處理語(yǔ)音標(biāo)簽時(shí),遇到請(qǐng)求消息頭字段 Speech Marker中標(biāo)記的tag（s→c）。
BARGE-IN-OCCURRED:客戶端檢測(cè)到barg-in-able事件或DTMF數(shù)字時(shí),發(fā)送該消息通知服務(wù)器（c→s）。

現(xiàn)在主流廠商為了使通話效果盡可能模擬真人外呼，除了涉及業(yè)務(wù)接口調(diào)用的數(shù)據(jù)查詢使用了TTS，基本采取整句錄音的方式。

3. NLU部分

準(zhǔn)確來(lái)說(shuō)，一個(gè)簡(jiǎn)單的對(duì)話機(jī)器人系統(tǒng)框圖，包括語(yǔ)音識(shí)別（ASR）、語(yǔ)音合成（TTS）、自然語(yǔ)言理解（NLU）、對(duì)話管理（DM）、自然語(yǔ)言生成（NLG）幾個(gè)模塊組成。而這一部分就是智能外呼系統(tǒng)的主流玩家——NLU類（智能客服）廠商的強(qiáng)項(xiàng)了。

對(duì)于呼叫中心從業(yè)者來(lái)說(shuō)，ASR/TTS/NLU如同黑盒一般，只暴露出接口。而國(guó)內(nèi)語(yǔ)音能力的供應(yīng)商，要么很土豪，少量QPS不要錢，要么就是非常標(biāo)準(zhǔn)的報(bào)價(jià)五位數(shù)一條線路/年，實(shí)在也沒有太多可以選擇的余地。

對(duì)于只有NLU能力的廠商來(lái)說(shuō)局面也是一樣，除了需要接入ASR/TTS的能力，還需要去尋找可以合作的呼叫中心，并且想辦法拿到盡可能低的話費(fèi)報(bào)價(jià)。

五、行業(yè)現(xiàn)狀

經(jīng)過(guò)一些調(diào)研和競(jìng)品分析，行業(yè)內(nèi)雖然有少近百家公司在推廣和運(yùn)營(yíng)電銷機(jī)器人，但毫不客氣地說(shuō)，大部分都不及格。

一 ★

官網(wǎng)粗制濫造，類似有漂浮閃動(dòng)flash，反復(fù)頻繁提示你聯(lián)系商務(wù)。
對(duì)各類基礎(chǔ)能力只有含糊其辭的描述，沒有錄音、演示、試用途徑。

二 ★★

有錄音可以試聽，但明顯可以聽出來(lái)，部分是真人直接對(duì)話錄音，而并非機(jī)器人與真人的通話錄音。部分若干家公司用于試聽播放的錄音文件完全一致，不知道誰(shuí)抄誰(shuí)的。

三 ★★★

有錄音可以試聽，甚也有演示視頻。錄音可能仍有作假嫌疑，演示視頻部分能感覺出來(lái)是按照特定的對(duì)話腳本去走流程，但是可以完成多輪對(duì)話了，語(yǔ)音時(shí)延在2s以內(nèi)，屬于基本可用。
不支持NLG，機(jī)器人所說(shuō)的內(nèi)容均為錄音。

四 ★★★★

支持NLG（Natural Language Generation），支持字段調(diào)用，支持TTS合成與錄音無(wú)縫銜接。但由于TTS調(diào)用的是某幾個(gè)大廠的api，而錄音多數(shù)為自己根據(jù)業(yè)務(wù)需求去錄的，會(huì)出現(xiàn)銜接生硬的問(wèn)題。方案是直接全文TTS，或者選擇與TTS音色相接近的播音員進(jìn)行錄制。
對(duì)打斷的處理有待優(yōu)化，要么不支持打斷，要么打斷后處理方式粗糙（如重播、多次打斷后多次直接播放對(duì)應(yīng)錄音）。
語(yǔ)義理解能力相對(duì)較弱，但配合相對(duì)完善的話術(shù)策略，可以保持相對(duì)可接受的兜底。

五 ★★★★★

支持對(duì)話中識(shí)別關(guān)鍵詞打斷。如介紹推銷信息時(shí)被打斷問(wèn)價(jià)格，則直接停下并立刻回復(fù)價(jià)格信息。
報(bào)價(jià)模式不局限于“線路xxxxx元/年，話費(fèi)0.xx元/分，話術(shù)腳本xxxx/個(gè)”的模式。如純錄音外呼機(jī)器人0.xx元/分，含NLG的外呼機(jī)器人x.xx元/分。
除了根據(jù)業(yè)務(wù)場(chǎng)景定制話術(shù)腳本之外，基于已有的積累（如呼叫中心電銷的通話記錄等）形成特定行業(yè)的話術(shù)模板，只需要填入特殊字段信息即可使用。
語(yǔ)義層面，支持跨節(jié)點(diǎn)/返回節(jié)點(diǎn)問(wèn)答（比如：先回答說(shuō)我不是本人，進(jìn)入到下一個(gè)節(jié)點(diǎn)后，客戶再說(shuō)一次我是本人，系統(tǒng)仍能處理）。
外呼結(jié)果分析，目前階段通常機(jī)器人外呼只用來(lái)做輪初篩，需要對(duì)通話內(nèi)容進(jìn)行語(yǔ)義判斷，按需分析是否需要第二輪人工跟進(jìn)。
通話中轉(zhuǎn)人工，是否允許在機(jī)器人外呼過(guò)程中被動(dòng)或主動(dòng)轉(zhuǎn)人工，這一項(xiàng)在實(shí)現(xiàn)時(shí)接近于IVR部分機(jī)器人應(yīng)答+轉(zhuǎn)人工的模式，在流程設(shè)計(jì)和資源配置上相對(duì)有難度。
根據(jù)通話內(nèi)容自動(dòng)判別二次回?fù)?，如被告?ldquo;現(xiàn)在沒空接電話，10分鐘后再給我打”（機(jī)器人二次呼叫），或者表示“有興趣，需轉(zhuǎn)人工跟進(jìn)”后經(jīng)由預(yù)測(cè)式外呼后回?fù)艿接脩籼?hào)碼上（真人接線）。

六、商業(yè)落地

商務(wù)模式比較簡(jiǎn)單粗暴，粗略的成本核算如下：

運(yùn)營(yíng)商的通訊資源，幾分錢一分鐘的話費(fèi)成本，以及平均下來(lái)一千左右一路的中繼線路費(fèi)用。
其次是呼叫中心廠商的服務(wù)器、帶寬、呼叫中心設(shè)備license/運(yùn)維等成本。
再次是AI能力的使用費(fèi)，比如：嘉舜公開報(bào)價(jià)2w每線路每年。
是外呼saas平臺(tái)的建設(shè)和運(yùn)維成本。

那么電銷機(jī)器人廠商，競(jìng)爭(zhēng)這么激烈，誰(shuí)才會(huì)笑到呢？

一是要有價(jià)格相對(duì)低廉的運(yùn)營(yíng)商資源和語(yǔ)音能力資源，這樣可以明確的報(bào)出一個(gè)行業(yè)內(nèi)相對(duì)較低的價(jià)格。比如：完全不按照主流友商們1-3w/線/年的報(bào)價(jià)方式，直接來(lái)幾毛錢一分鐘隨便打，隨打隨充。

二是呼叫中心資源方，是帶客進(jìn)場(chǎng)，別從0開始找客戶，直接把現(xiàn)有的呼叫中心B端客戶轉(zhuǎn)化一部分成為機(jī)器人電銷客戶。

三是語(yǔ)義的能力，尤其是話術(shù)模板的設(shè)計(jì)能力。這一塊兒很容易被忽視，但是這反而也是產(chǎn)品經(jīng)理可以出成績(jī)的地方。一般來(lái)說(shuō)可以拿呼叫中心多年積累的語(yǔ)料去分析一套話術(shù)模板（堪比銷售的對(duì)話體系），然后做ABtest也好。

從mvp開始逐漸增加主要話術(shù)分支也好，心理學(xué)基礎(chǔ)必須要有，必要時(shí)可以從游戲成癮機(jī)制等角度入手，《戀與制作人》的對(duì)話技巧學(xué)起來(lái)，一句話怎么說(shuō)能讓接電話的人概率的順著自己的思路走，達(dá)成目的，從而形成特定細(xì)分領(lǐng)域機(jī)器人話術(shù)模板，得到的外呼效果（接通率、通話時(shí)長(zhǎng)、電銷意愿、催收意愿）。

這一塊兒雖然很細(xì)，但是反復(fù)迭代之后可以以一敵萬(wàn)，甚達(dá)到現(xiàn)在各類智能音箱背后核心系統(tǒng)一樣的地位。

四是外呼saas平臺(tái)。這部分是web類產(chǎn)品經(jīng)理的天下了，具體功能點(diǎn)就不詳細(xì)列舉了，友商們的網(wǎng)頁(yè)和后臺(tái)過(guò)一遍，基本好壞也能判斷出來(lái)了。

于現(xiàn)在此時(shí)此刻被視作亮點(diǎn)的可視化外呼腳本編輯，筆者個(gè)人認(rèn)為其實(shí)是雞肋，普通人根本用不好，腳本邏輯只能做得很簡(jiǎn)單，多輪對(duì)話、跨節(jié)點(diǎn)對(duì)話效果也不好，反而很容易導(dǎo)致客戶放棄。還不如干干脆脆給個(gè)可設(shè)置變量的場(chǎng)景化標(biāo)準(zhǔn)模板（話術(shù)模板由產(chǎn)品經(jīng)理提供），外呼試用效果好，客戶更容易買單。

七、結(jié)語(yǔ)與參考資料

這一套智能外呼系統(tǒng)搭下來(lái)，不僅僅可以做電銷機(jī)器人，可以做各類外呼，也可以做IVR語(yǔ)音導(dǎo)航、呼入電話客服。“NLU+CallCenter”就像這幾年“CV+安防”的結(jié)合一樣，也會(huì)如商湯科技聯(lián)合創(chuàng)始人林達(dá)華所說(shuō)：

“中間也存在風(fēng)險(xiǎn)：一邊是從應(yīng)用端往前走，一邊是從技術(shù)端往后走，大家都想占領(lǐng)技術(shù)上的制高點(diǎn)。這需要大家建立一種信任和共贏機(jī)制，只有這樣合作才能長(zhǎng)久”。

AI雖然火熱受追捧，但具體項(xiàng)目落地并被市場(chǎng)認(rèn)可和買單并不是那么容易。作為入行并不久的初學(xué)者，嘗試借以此文抽絲剝繭梳理了從0開始搭建智能外呼系統(tǒng)的全流程，才疏學(xué)淺囿于見聞，疏漏和不當(dāng)之處在所難免，權(quán)當(dāng)拋磚引玉。

諸多細(xì)節(jié)限于主題和篇幅不做詳述，如有任何問(wèn)題，歡迎隨時(shí)交流。

參考資料：

《呼叫中心技術(shù)》，詹舒波等，人民郵電出版社，2015-09-01
MRCPv2概述
MRCPv2 – Speech Synthesizer Resource
MRCP協(xié)議學(xué)習(xí)筆記
MRCPv2 協(xié)議及其在分布式語(yǔ)音資源方案中的應(yīng)用
華為在審：一種語(yǔ)音識(shí)別方法及裝置
百度-智能呼叫中心 Java SDK文檔

如何從零開始搭建智能外呼系統(tǒng)？

一、序言

二、總覽