讓人工智能(néng)語音助手聽上去像人類，這(zhè)是好(hǎo)事(shì)嗎

《連線》網站撰文稱，數字助手的聲音聽上去很像是人類，就(jiù)是好(hǎo)事(shì)情嗎？那的确可能(néng)會(huì)使得人們更想要使用它，但也可能(néng)會(huì)帶來意想不到(dào)的影響：助手的功能(néng)變弱，變得沒(méi)那麼(me)有用。這(zhè)提出了一個重要的問題：人們究竟想要從虛拟助手那裡(lǐ)得到(dào)什麼(me)呢？

　　以下是文章主要内容：

　　向(xiàng)Alexa詢問天氣狀況，它會(huì)用愉快的音調告訴你天氣晴朗。讓它給你講個笑話，它就(jiù)會(huì)用它标志性的斷奏給你講個雙關笑話。叫(jiào)它唱首歌，它就(jiù)會(huì)唱出自動調諧的民謠。亞馬遜的虛拟助手擁有著(zhe)各種(zhǒng)各樣(yàng)像人類的機靈功能(néng)——但它的聲音出賣了它：Alexa還(hái)隻是個機器人。

　　為了幫助Alexa擺脫機器人口音，亞馬遜最近升級了它的語音合成(chéng)标記語言标簽，讓開(kāi)發(fā)者能(néng)夠用來給Alexa的技能(néng)或者應用編造出更加自然的語音模式。那些新标簽可讓Alexa做各種(zhǒng)口頭活動，如低聲說(shuō)話，停頓，爆出咒罵的話，調整語音的速度、音量、語氣強調和音高。這(zhè)意味著(zhe)Alexa和其它的數字助手可能(néng)不久之後(hòu)就(jiù)會(huì)聽上去不那麼(me)像是機器人，而更像是人類。但在這(zhè)兩(liǎng)個極端之間取得良好(hǎo)的平衡對(duì)于語音交互設計師而言仍是一大挑戰，且提出了人們真正想要從語音助手那裡(lǐ)得到(dào)什麼(me)的重要問題。

　　讓表達更加細緻入微

　　先進(jìn)的語言标簽之于計算機生成(chéng)的語音的作用，就(jiù)像是标點符号和表情符号之于文本通訊的作用：增加信息的帶寬。簡單的标記語言可讓語音助手區分1996和1,996，或者區分相同發(fā)音的單詞不同的用法。先進(jìn)的标簽可讓它們傳達比以往多得多的信息。你知道(dào)你是如何看待“聽起(qǐ)來不錯”短信和帶表情符号的“聽起(qǐ)來不錯”短信之間的差異的嗎？發(fā)出抑揚之聲的能(néng)力也將(jiāng)讓數字助手能(néng)夠做出細緻入微的表達。

　　更加細緻的助手可能(néng)會(huì)更有幫助。俄亥俄州立大學(xué)語音心理學(xué)家勞拉·瓦格納(Laura Wagner)表示，“聲音的音樂要素有助于你形成(chéng)一種(zhǒng)期待。”語音的抑揚可帶來更加高效的描述，減少歧義性。它還(hái)有望給Alexa帶來相對(duì)于來自蘋果和谷歌的數字助手的情感優勢。“如果它聽上去像人的話，我們會(huì)很喜歡它。”瓦格納說(shuō)道(dào)。有證據顯示，人們對(duì)于能(néng)夠“随即地進(jìn)行互動”(即能(néng)夠跟另一個人進(jìn)行響應式的來回交談)的物體有更強的連接。“Alexa聽上去越像人，我就(jiù)越想要信任她，越想要使用她。”瓦格納說(shuō)。

　　當然，那也解釋了為什麼(me)亞馬遜想要讓Alexa聽上去盡可能(néng)地像是人類。

　　功能(néng)或弱化

　　不過(guò)，亞馬遜也面(miàn)臨著(zhe)讓Alexa聽上去太像人的風險。2月，該公司發(fā)布了“speechcon”——數十個Alexa能(néng)夠更加準确地發(fā)音的感歎詞，如argh(哎啊)、cheerio(好(hǎo)呀)和d’oh。亞馬遜想要給它的虛拟助手加上一層個性，但像那樣(yàng)的怪異模式會(huì)讓Alexa變得沒(méi)那麼(me)有用。

　　卡内基梅隆大學(xué)計算機科學(xué)家阿蘭·布萊克(Alan Black)表示，“如果Alexa開(kāi)始說(shuō)出諸如‘hmm’和‘well’的話時(shí)，你會(huì)不自覺地跟著(zhe)她那麼(me)說(shuō)話。”布萊克在1990年代幫助開(kāi)辟了語音合成(chéng)标記标簽的應用。人往往會(huì)不自覺地模仿對(duì)話者的會(huì)話風格;讓數字助手的說(shuō)話方式變得太随便的話，人們也會(huì)跟著(zhe)那麼(me)說(shuō)話。“這(zhè)樣(yàng)的代價就(jiù)是，數字助手可能(néng)會(huì)聽不出用戶在說(shuō)些什麼(me)。”布萊克說(shuō)。

　　以功能(néng)弱化為代價來改進(jìn)語音助手的個性，是越來越多的用戶界面(miàn)設計師們將(jiāng)要解決的一個折中問題。舊金山設計咨詢公司Fjord的聊天機器人設計師約翰·瓊斯(John Jones)說(shuō)道(dào)，“我們是想要說(shuō)話的個性，還(hái)是想要給予我們信息的實用功能(néng)？我想很多情況下我們都(dōu)會(huì)更想要可給給予我們信息的實用功能(néng)。”僅僅因為Alexa能(néng)夠說(shuō)出俗語和流行文化用語來，并不意味著(zhe)它應該那麼(me)做。有時(shí)候你隻希望它能(néng)夠帶來效用。數字助手應當用簡短的回複來回應直接的指令，又或許直接沉默不語——而不是發(fā)出“booyah”(一種(zhǒng)喜悅的叫(jiào)法)的聲音。(亞馬遜添加的另一個speechcon。)

　　個性和實用性倒不是相互排斥的。你或許聽說(shuō)過(guò)形式服從功能(néng)這(zhè)一設計準則。Alexa沒(méi)有物質形态可言，但它的用途應當能(néng)夠代表它的外在形象。但數字助手的理解能(néng)力仍然太過(guò)基礎，因而無法魚與熊掌兼得。《對(duì)話界面(miàn)》(Conversational Interface)合著者邁克爾·麥克蒂爾(Michael McTear)指出，“如果數字助手的語音做得很像人類，那可能(néng)會(huì)讓用戶覺得該技術所有其它的元素也都(dōu)同樣(yàng)出色。”數字助手聲音聽起(qǐ)來如何和它能(néng)夠做的事(shì)情之間的鴻溝越大，那它的能(néng)力和用戶對(duì)它的期望之間的落差就(jiù)越大。

　　人們想要從虛拟助手那裡(lǐ)得到(dào)什麼(me)？

　　這(zhè)提出了一個重要的問題：人們想要從虛拟助手那裡(lǐ)得到(dào)什麼(me)？畢竟，交互設計師的訴求應當要反映用戶的訴求——但你會(huì)在想誰能(néng)夠從他們所做的變化中獲益最多。亞馬遜讓Alexa聽上去盡可能(néng)地像是人類的努力表明，用戶希望他們的人工智能(néng)夥伴能(néng)夠不僅僅幫助他們關燈或者帶來天氣預報。他們希望這(zhè)些設備能(néng)夠理解他們，能(néng)夠與他們建立情感連接，甚至可能(néng)跟他們約會(huì)。

　　但忽視開(kāi)發(fā)這(zhè)些産品的公司背後(hòu)的動機會(huì)是幼稚而不現實的。亞馬遜想要向(xiàng)你銷售東西(畢竟，它的設計準則是將(jiāng)Alexa所有者鑒定為“顧客”而非“用戶”)，感情表現力更強的數字助手可用來幫助達到(dào)那個目的。亞馬遜已經(jīng)在嘗試采集來自Alexa用戶語音的情緒信息;理所當然地，情感表現能(néng)力更強的人工智能(néng)也將(jiāng)能(néng)夠更好(hǎo)地分析——以及操控——你的情感。

　　是的，這(zhè)聽上去讓人毛骨悚然，但同時(shí)也很有前景。亞馬遜或許會(huì)利用Alexa的情感表現能(néng)力來向(xiàng)你賣東西，但社交用的機器人也許可以利用同樣(yàng)的技術來給老年人提供更好(hǎo)更周到(dào)的照顧。随著(zhe)開(kāi)發(fā)商繼續使得數字助手聽上去沒(méi)那麼(me)機械呆闆的進(jìn)程，機器人的實用性和陪伴屬性之間的界線將(jiāng)會(huì)變得越來越模糊。未來Alexa是否將(jiāng)會(huì)變得像是一個擁有情感智能(néng)的朋友呢？也許吧。亞馬遜距離打造出能(néng)夠預測你的需求和欲望的虛拟助手仍相距甚遠;在此之前，它還(hái)面(miàn)臨著(zhe)諸多有助重塑這(zhè)些助手融入你的生活的方式的未解問題。