9月9日,以“共驅(qū)AI,賦能未來(lái)”為主題的第一屆中國(guó)—東盟人工智能峰會(huì)在南寧成功舉辦。捷通華聲作為人工智能技術(shù)產(chǎn)業(yè)化的開(kāi)拓者和領(lǐng)先者,受邀出席中國(guó)-東盟(華為)人工智能及軟件開(kāi)發(fā)技術(shù)交流會(huì)。
捷通華聲副總經(jīng)理于智彬發(fā)表“5G+AI:共建智能化產(chǎn)業(yè)互聯(lián)網(wǎng)”主旨演講,以下為演講內(nèi)容:
現(xiàn)在AI已成為家喻戶曉的名詞,大家都知道人工智能,就是模仿人的各種能力的技術(shù)。讓機(jī)器“能說(shuō)會(huì)聽(tīng)、能看會(huì)認(rèn),能思考、會(huì)判斷,能行動(dòng)”是AI追求的目標(biāo),也是我們捷通華聲2000年建立時(shí)的初衷和愿望。
在2010年前,人工智能已經(jīng)過(guò)幾起幾落。1950年,AT&T推出Audry,實(shí)現(xiàn)首個(gè)可以識(shí)別10個(gè)英文數(shù)字的系統(tǒng);1997年IBM推出VIA VOICE——首個(gè)語(yǔ)音識(shí)別產(chǎn)品。當(dāng)時(shí)大家很興奮,大呼語(yǔ)音識(shí)別時(shí)代到來(lái)了,但當(dāng)試用之后發(fā)現(xiàn)識(shí)別效果不好,又大失所望。此后,直至2010年前,因?yàn)橛?jì)算力有限、數(shù)據(jù)量不足、算法演進(jìn)緩慢等原因,導(dǎo)致語(yǔ)音識(shí)別、圖像識(shí)別等AI技術(shù)一直未能產(chǎn)業(yè)化。
2000年成立之初,我們主要是做TTS和手寫(xiě)識(shí)別技術(shù)。當(dāng)時(shí)的TTS有些機(jī)械音,但它能代替人日日夜夜的辛苦重復(fù)工作。例如,全國(guó)各地高鐵站廣播、汽車站廣播、醫(yī)院叫號(hào)廣播等,都用了捷通華聲的TTS產(chǎn)品。手寫(xiě)識(shí)別技術(shù)效果比較好,用在很多手機(jī)輸入法上,還賣給了日本的手寫(xiě)板生產(chǎn)廠商,歐美的各種高端轎車車機(jī)。
2008年,個(gè)人電腦開(kāi)始大規(guī)模應(yīng)用,2010年,互聯(lián)網(wǎng)快速發(fā)展,隨之產(chǎn)生了大量的數(shù)據(jù)。此時(shí),高性能計(jì)算、機(jī)器學(xué)習(xí)也發(fā)展到了新的水平,開(kāi)始可以支撐語(yǔ)音識(shí)別、圖像識(shí)別等人工智能技術(shù)的發(fā)展了。
第一次轉(zhuǎn)型:抓住機(jī)遇,發(fā)展全方位AI技術(shù)
當(dāng)發(fā)覺(jué)到這個(gè)機(jī)遇時(shí),捷通華聲下定決心,果斷轉(zhuǎn)型,準(zhǔn)備發(fā)展全方位AI技術(shù)。
2011年,捷通華聲推出國(guó)內(nèi)外首個(gè)全方位AI開(kāi)放平臺(tái)—靈云,致力于讓機(jī)器“能說(shuō)會(huì)聽(tīng)、能寫(xiě)會(huì)看、能辨音會(huì)認(rèn)人、能思考會(huì)判斷”。
在發(fā)展AI技術(shù)的路上,很多前沿計(jì)算理論,需要與學(xué)術(shù)界共同研究。2012年,我們開(kāi)始與清華大學(xué)聯(lián)合研發(fā)AI算法。我們應(yīng)用AI技術(shù),對(duì)接市場(chǎng)需求,開(kāi)發(fā)產(chǎn)品,并用產(chǎn)業(yè)應(yīng)用中產(chǎn)生的數(shù)據(jù),去訓(xùn)練提升AI水平,形成產(chǎn)學(xué)研用的良性循環(huán)。
隨著與清華大學(xué)AI技術(shù)聯(lián)合研究的深入,2013年,清華大學(xué)產(chǎn)業(yè)基金入資捷通華聲,成為捷通華聲第二大股東,并共同確立“靈云科技源自清華”的戰(zhàn)略合作。2014年,捷通華聲與清華大學(xué)共同創(chuàng)建清華靈云人工智能研究中心,中國(guó)科學(xué)院院士、清華大學(xué)人工智能研究院院長(zhǎng),張鈸院士擔(dān)任研究中心首席科學(xué)家。2015年,捷通華聲與清華大學(xué)海峽研究院在廈門(mén)共同創(chuàng)建清華靈云人工智能研究中心。通過(guò)與清華大學(xué)的科研合作,靈云AI技術(shù)學(xué)術(shù)研究保持全球領(lǐng)先,各項(xiàng)技術(shù)快速進(jìn)步。
靈云AI技術(shù),快速產(chǎn)業(yè)化應(yīng)用
隨著AI技術(shù)的不斷提升,各種產(chǎn)業(yè)需求爆發(fā)式增加,AI技術(shù)開(kāi)始快速產(chǎn)業(yè)化。
最經(jīng)典的一個(gè)應(yīng)用場(chǎng)景,就是客服中心。銀行、保險(xiǎn)、航空等大型企業(yè),有海量的客戶,需要建立大型客服中心來(lái)提供業(yè)務(wù)咨詢、業(yè)務(wù)辦理等服務(wù)。為了控制客服中心人力成本,減少客戶咨詢長(zhǎng)時(shí)間排隊(duì)等情況,農(nóng)行、中信銀行、郵儲(chǔ)銀行、太平洋保險(xiǎn)、國(guó)航、深航等,紛紛引進(jìn)捷通華聲的智能客服。
以中信銀行為例,在微信公號(hào)、和官網(wǎng)接入智能客服,可以為用戶提供借記卡、信用卡、養(yǎng)老金等全業(yè)務(wù)的智能咨詢、辦理服務(wù)。智能客服問(wèn)答準(zhǔn)確率超90%,從2014年上線至今,日均訪問(wèn)量50萬(wàn)+,人工坐席節(jié)省125人/年。
此外,客服中心的電話服務(wù)熱線,承載著大量用戶咨詢,人工服務(wù)壓力和成本巨大,客戶打電話經(jīng)常打不進(jìn)來(lái)、或長(zhǎng)時(shí)間等待。
北京國(guó)稅當(dāng)時(shí)找到我們,看如何在不增加坐席人數(shù)的情況下,提供通暢的稅務(wù)咨詢服務(wù)。捷通華聲給稅務(wù)局開(kāi)發(fā)了電話客服機(jī)器人、微信智能客服,和營(yíng)業(yè)廳實(shí)體服務(wù)機(jī)器人。稅收政策、稅務(wù)登記、一證通、優(yōu)惠政策、營(yíng)改增問(wèn)題、三證合一等問(wèn)題都可以向機(jī)器人咨詢,為納稅人提供永不占線、方便快捷的稅務(wù)咨詢服務(wù)。
銀行、電信公司的服務(wù)熱線,剛打進(jìn)去是IVR按鍵導(dǎo)航,層級(jí)深,選項(xiàng)多,很多人進(jìn)去直接按0轉(zhuǎn)人工,導(dǎo)致人工服務(wù)壓力巨大,而85%的客戶咨詢,都是常見(jiàn)問(wèn)題。我們給光大銀行95595熱線做的智能語(yǔ)音導(dǎo)航,客戶打電話進(jìn)去后,常見(jiàn)的業(yè)務(wù)問(wèn)題,機(jī)器人可以直接回答;需要轉(zhuǎn)人工的咨詢,機(jī)器人會(huì)反問(wèn)補(bǔ)全,確認(rèn)好業(yè)務(wù)種類后,精準(zhǔn)轉(zhuǎn)接給對(duì)應(yīng)的坐席組。目前光大銀行智能語(yǔ)音導(dǎo)航,日接聽(tīng)量20萬(wàn)通,回答準(zhǔn)確率91%,轉(zhuǎn)人工比例下降至20%,轉(zhuǎn)人工等待時(shí)長(zhǎng)下降30%,轉(zhuǎn)人工坐席接起率提升至99.78%,取得了良好的業(yè)務(wù)效果。
類似地,手機(jī)銀行APP,也有很多功能項(xiàng),菜單層級(jí)深。為了方便用戶使用,招商銀行引進(jìn)捷通華聲智能語(yǔ)音技術(shù),為招商銀行掌上生活A(yù)PP打造智能語(yǔ)音助手,查賬單、轉(zhuǎn)賬、買理財(cái),說(shuō)出來(lái)即可,還可以咨詢金融知識(shí)。這在提升用戶使用體驗(yàn)和粘度的同時(shí),大幅降低了中老年人等群體使用APP難度。
除了承接用戶咨詢,客服中心還有大量的外呼工作。例如銀行的信用卡逾期催繳、貸款業(yè)務(wù)推廣等。2016年,我們做了國(guó)內(nèi)第一個(gè)智能語(yǔ)音外呼機(jī)器人產(chǎn)品,某大型股份制銀行信用卡催收智能外呼機(jī)器人:2016年上線,成都分公司率先使用機(jī)器人,催收回款率提高30%,排名全國(guó)第一。月均節(jié)約人力成本120萬(wàn),截止2018年12月底,累計(jì)節(jié)約人力成本4500萬(wàn),節(jié)省了巨大的人力成本。
在近期給某知名互金公司上線的催收機(jī)器人,上線30天后,外呼回款率與純?nèi)斯ご呤招Ч恢?,即機(jī)器人催收達(dá)到真人水平。
隨著AI的深入應(yīng)用,客服中心想用AI技術(shù)來(lái)督促坐席提升服務(wù)質(zhì)量。某大型國(guó)企,引進(jìn)捷通華聲智能語(yǔ)音分析系統(tǒng),將通話全量轉(zhuǎn)寫(xiě)為文字并用規(guī)則進(jìn)行自動(dòng)打分,質(zhì)檢覆蓋率從3%提升至100%,全面督促坐席提升服務(wù)質(zhì)量,有效提升客戶服務(wù)滿意度。與此同時(shí),對(duì)客服大數(shù)據(jù)進(jìn)行挖掘與分析:業(yè)務(wù)熱點(diǎn)、業(yè)務(wù)發(fā)展趨勢(shì),可視化展現(xiàn);通過(guò)重復(fù)來(lái)電分析、關(guān)聯(lián)分析、異常分析等,挖掘客戶投訴、多次來(lái)電原因。
在質(zhì)檢客服的同時(shí),靈云智能語(yǔ)音分析系統(tǒng)還可以輔助坐席的實(shí)時(shí)通話。2016年,捷通華聲為某大型保險(xiǎn)公司做了國(guó)內(nèi)首款實(shí)時(shí)智能語(yǔ)音分析系統(tǒng)。近萬(wàn)名坐席,通話實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě),坐席側(cè)語(yǔ)音識(shí)別率超90%;如果坐席出現(xiàn)未按流程對(duì)話、保單免責(zé)條款未說(shuō)明、詆毀同業(yè)、假冒促銷等情況,系統(tǒng)會(huì)實(shí)時(shí)發(fā)出違規(guī)提醒;系統(tǒng)也會(huì)實(shí)時(shí)分析客戶說(shuō)話內(nèi)容,給予坐席產(chǎn)品類型建議、險(xiǎn)種內(nèi)容、挽回話術(shù)、常見(jiàn)業(yè)務(wù)知識(shí)等話術(shù)輔助。
系統(tǒng)上線后,有效規(guī)范了保險(xiǎn)電銷服務(wù),降低了新人成單難度,提升了整體電銷成單率。
除了客服中心,物聯(lián)網(wǎng)場(chǎng)景也對(duì)智能語(yǔ)音交互技術(shù)有巨大的需求,如大家熟知的智能音箱、兒童智能陪伴機(jī)器人等。我們給機(jī)頂盒廠商做智能語(yǔ)音助手,換頻道、搜電影,可以直接說(shuō)出來(lái),為用戶創(chuàng)造體驗(yàn)更友好、更高效的人機(jī)交互方式。
在提供方案產(chǎn)品的同時(shí),我們給眾多合作伙伴、政企客戶提供基礎(chǔ)人工智能能力平臺(tái),助力其打造智能化的業(yè)務(wù)應(yīng)用。靈云全智能能力平臺(tái)-AICP,提供語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別、OCR、人臉識(shí)別、視頻分析、語(yǔ)義理解、機(jī)器翻譯、數(shù)據(jù)挖掘等全方位AI技術(shù)能力,是靈云AI技術(shù)賦能百業(yè)的關(guān)鍵。
AI技術(shù)產(chǎn)業(yè)應(yīng)用,給企業(yè)減少了巨大的人力成本,實(shí)現(xiàn)了業(yè)務(wù)的跨越式升級(jí)。AI已成為推動(dòng)產(chǎn)業(yè)智能化升級(jí)的關(guān)鍵動(dòng)力。
AI技術(shù)產(chǎn)業(yè)化的思考
下面分享一些我們捷通華聲在AI技術(shù)產(chǎn)業(yè)化中的思考:
第一,AI技術(shù)的發(fā)展,計(jì)算理論的演進(jìn),算法的升級(jí)是關(guān)鍵;體量大、分布合理、干凈的數(shù)據(jù)模型是基礎(chǔ);給客戶提供學(xué)習(xí)訓(xùn)練,例如NLU、ASR等的數(shù)據(jù)訓(xùn)練,能有效提升AI技術(shù)在產(chǎn)業(yè)內(nèi)的應(yīng)用效果。另外,AI技術(shù)的發(fā)展,離不開(kāi)產(chǎn)業(yè)界的包容,即客戶對(duì)技術(shù)發(fā)展階段性水平的理解,這為AI公司的成長(zhǎng)進(jìn)步提供了土壤。
第二,AI技術(shù)融合應(yīng)用趨勢(shì)已非常明顯。例如我們推出的車載輸入法,用戶可以用語(yǔ)音、手寫(xiě)、鍵盤(pán)輸入,讓車載輸入更安全快捷;我們的靈云手機(jī)輸入法,支持語(yǔ)音、手寫(xiě)、鍵盤(pán)輸入,中英、中維翻譯,OCR拍照輸入、跨屏輸入、語(yǔ)音速記等功能,滿足用戶多種場(chǎng)景的輸入需求。
語(yǔ)音互譯軟件,除了綜合應(yīng)用語(yǔ)音識(shí)別、機(jī)器翻譯、語(yǔ)音合成、OCR技術(shù),各項(xiàng)技術(shù)還要求是支持多種語(yǔ)言的。銀行大廳服務(wù)機(jī)器人,要求功能更廣泛,智能語(yǔ)音交互,人臉識(shí)別、指紋識(shí)別驗(yàn)證,OCR拍照錄入材料等,各項(xiàng)技術(shù)融合應(yīng)用,為用戶提供更便捷的服務(wù)。
同樣的,我們?cè)谧龅霓k案智能化筆錄(中維雙語(yǔ))場(chǎng)景,需要語(yǔ)音識(shí)別(普通話、維吾爾語(yǔ))、機(jī)器翻譯(中翻維、維翻中)、語(yǔ)音合成(普通話、維吾爾語(yǔ))、OCR拍照識(shí)別(中文、維吾爾文)融合應(yīng)用,才能提供完整的服務(wù)。
AI技術(shù)融合應(yīng)用的背后,就是人工智能的本質(zhì)——模仿人的能力。從感知、認(rèn)知、到行動(dòng),越多AI技術(shù)融合應(yīng)用,發(fā)揮威力越強(qiáng)大。
第三,AI產(chǎn)品也趨于融合服務(wù)。例如,我們?cè)诳头行耐频撵`云全智能客服解決方案(AICC),基于靈云全智能能力平臺(tái)(AICP),運(yùn)用行業(yè)領(lǐng)先的語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解以及大數(shù)據(jù)分析等AI技術(shù),為客服中心提供一站式的智能客服、智能語(yǔ)音導(dǎo)航、智能語(yǔ)音外呼、語(yǔ)音質(zhì)檢分析等智能解決方案。
● 智能客戶服務(wù):智能客服、智能語(yǔ)音導(dǎo)航在微信、網(wǎng)頁(yè)、APP、電話等多種渠道,為用戶解答咨詢、辦理業(yè)務(wù)
● 智能語(yǔ)音外呼:外呼機(jī)器人,快速完成海量電話的外呼,高效完成客戶回訪、金融催收、營(yíng)銷推廣等工作
● 智能語(yǔ)音分析:實(shí)現(xiàn)100%全覆蓋的智能語(yǔ)音質(zhì)檢,督促坐席提升服務(wù)質(zhì)量;對(duì)坐席通話進(jìn)行實(shí)時(shí)話術(shù)輔助,助力提升電銷成單率;對(duì)客服大數(shù)據(jù)進(jìn)行挖掘分析,助力業(yè)務(wù)決策。
同樣,在公檢法辦案語(yǔ)音筆錄場(chǎng)景,通過(guò)共用基礎(chǔ)AI能力平臺(tái),支撐多場(chǎng)景業(yè)務(wù)應(yīng)用:為詢問(wèn)室提供訊問(wèn)智錄系統(tǒng),實(shí)現(xiàn)雙人對(duì)話轉(zhuǎn)寫(xiě);為會(huì)場(chǎng)提供智會(huì)系統(tǒng),實(shí)現(xiàn)多人會(huì)議轉(zhuǎn)寫(xiě),和講話實(shí)時(shí)上屏;在辦公室,提供PC語(yǔ)音輸入法,用語(yǔ)音快速錄入文字信息;在外出執(zhí)勤現(xiàn)場(chǎng),用便攜式訊問(wèn)筆錄一體機(jī),快速生成訊問(wèn)筆錄,多項(xiàng)AI產(chǎn)品融合應(yīng)用。
下一次轉(zhuǎn)型:AI云服務(wù)
展望未來(lái),下一次轉(zhuǎn)型是什么?5G、云計(jì)算快速發(fā)展,政企單位接受公有云服務(wù)的意愿度漸漸提升。下一次轉(zhuǎn)型,AI云服務(wù),將是巨大的機(jī)遇。
之前做項(xiàng)目有很多難點(diǎn)。對(duì)供應(yīng)商來(lái)說(shuō),大量POC、交付項(xiàng)目,在全國(guó)各地大量部署,部署、對(duì)接調(diào)試時(shí)間長(zhǎng),人力、差旅成本巨大,散點(diǎn)運(yùn)維,無(wú)法統(tǒng)一;對(duì)需求方來(lái)說(shuō),需要準(zhǔn)備硬件環(huán)境(如ASR用的大內(nèi)存服務(wù)器,機(jī)器翻譯用的GPU),需要投入人力配合部署、調(diào)試,部署拖長(zhǎng)了項(xiàng)目周期,也間接性增加了采購(gòu)成本。
2018年,靈云AI入駐華為云,為產(chǎn)業(yè)界提供AI技術(shù)能力與產(chǎn)品方案云服務(wù)。
我們開(kāi)始了一個(gè)轉(zhuǎn)變,從部署各種能力、系統(tǒng)產(chǎn)品,轉(zhuǎn)為向客戶提供AI能力與產(chǎn)品服務(wù)的快速調(diào)用,讓每一家企業(yè)都能快速接入人工智能。
5G+云計(jì)算,天生助力AI云服務(wù)發(fā)展。5G傳輸,滿足音頻、圖像、視頻等傳輸量大,實(shí)時(shí)語(yǔ)音識(shí)別、OCR、視頻識(shí)別等要求低時(shí)延的要求;云計(jì)算,更能好的運(yùn)行深度學(xué)習(xí)算法,滿足語(yǔ)音識(shí)別等模型庫(kù)巨大,圖像識(shí)別、機(jī)器翻譯等需要GPU計(jì)算的需求。
例如,某大型保險(xiǎn)公司項(xiàng)目,之前由于網(wǎng)絡(luò)傳輸速率、延時(shí),不能滿足通話實(shí)時(shí)語(yǔ)音識(shí)別需求,超百臺(tái)服務(wù)器,進(jìn)行異地多活部署。有了5G后,可以轉(zhuǎn)變?yōu)榧薪y(tǒng)一部署,這可以減少硬件計(jì)算資源空置,減少運(yùn)維管理投入,降低整體建設(shè)成本。
某警務(wù)外出辦案語(yǔ)音轉(zhuǎn)寫(xiě)項(xiàng)目,以前都是需要大內(nèi)存筆記本電腦,或便攜式服務(wù)器部署ASR,成本高。換5G后,可以用5G調(diào)用公安云語(yǔ)音識(shí)別能力,普通筆記本聯(lián)網(wǎng)即可應(yīng)用。
某政府大規(guī)模翻譯項(xiàng)目,5G,帶寬大、低延時(shí),滿足辦公實(shí)時(shí)傳輸大量語(yǔ)音、圖像等數(shù)據(jù)需求;機(jī)器翻譯、圖像識(shí)別等需要的GPU計(jì)算資源,由云平臺(tái)統(tǒng)一提供,提高硬件資源利用率。相較多點(diǎn)部署GPU服務(wù)器,大幅降低成本。
整體來(lái)說(shuō),用5G+云平臺(tái)方式提供AI服務(wù),具備諸多優(yōu)勢(shì):客戶接入快、成本低,計(jì)算資源利用率高、運(yùn)維統(tǒng)一,供應(yīng)商成本低,AI更易推廣。
AI應(yīng)用+云計(jì)算+5G,將構(gòu)建一個(gè)更智能、更高速、算力更強(qiáng)大的智能化產(chǎn)業(yè)互聯(lián)網(wǎng),服務(wù)各行各業(yè)。
來(lái)源: 飛象網(wǎng)
評(píng)論列表
太感謝你了,我們現(xiàn)在都已經(jīng)和好了,謝謝!
如果發(fā)信息不回,怎麼辦?