語音助手能(néng)像真人打預約電話,怎麼(me)做到(dào)的?
據國(guó)外媒體報道(dào),在2018年度谷歌開(kāi)發(fā)者大會(huì)Google I/O上,谷歌發(fā)布了升級版的數字助理Google Assistant。谷歌介紹稱,Assistant的“持續性對(duì)話”功能(néng)讓對(duì)話更自然,而“多重行動”功能(néng)讓用戶在一次對(duì)話中可以提出多個問題。此外Pretty Please功能(néng)能(néng)夠讓用戶的措辭更加禮貌規範。在發(fā)布會(huì)之前,CNET造訪了山景城,探究了谷歌Assistant背後(hòu)的Duplex技術以及其他人工智能(néng)。
起(qǐ)初談話看起(qǐ)來并無二樣(yàng)。
加利福尼亞州山景城的谷歌園區中,作者被(bèi)邀請收聽一段預訂晚餐的電話錄音,隻有短短的51秒。
第一個人:晚上好(hǎo)。
第二個人:你好(hǎo)?
第一個人:你好(hǎo)。
第二個人:嗨,呃,我想為三号星期五預訂一個位子。
第一個人:好(hǎo)的,堅持一會(huì)兒。
第二個人:嗯。
第一個人:好(hǎo)的......請稍等。
第二個人:嗯。
第一個人:所以時(shí)間是星期五,十一月三号。多少人?
第二個人:對(duì)...兩(liǎng)個人。
第一個人:兩(liǎng)個人?
第二個人:是的。
當我聽到(dào)一個男人和一個女人在對(duì)話的時(shí)候,谷歌負責數字助理業務的高管正密切關注我的反應。谷歌于當地時(shí)間周二2018年度開(kāi)發(fā)者大會(huì)Google I/O,現在他們正在演示谷歌助理的新功能(néng)。
結果證明這(zhè)個特别的演示非常瘋狂。
那是因為聽起(qǐ)來像一個男人的第二個人根本不是一個人。這(zhè)是谷歌數字助理Assistant。而發(fā)音聽起(qǐ)來完全不像通常從谷歌家庭智能(néng)揚聲器聽到(dào)的那種(zhǒng)半機器人的聲音。當其中的數字助理向(xiàng)你提供天氣的最新信息或告訴你到(dào)達工作地點需要多長(cháng)時(shí)間時(shí),通常是一種(zhǒng)毫無生氣的電子拟人聲。
作為亞馬遜Alexa,蘋果Siri和微軟Cortana的競争對(duì)手,這(zhè)可能(néng)是谷歌數字助理Assistant的下一個演變。這(zhè)聽起(qǐ)來很明顯——甚至是怪異的——隻有人類自己會(huì)在回答問題前停頓一下,使用諸如“嗯”和“呃”等口頭禅。它說(shuō)“嗯嗯”,好(hǎo)似在點頭同意;它拉長(cháng)了某些詞的發(fā)音,好(hǎo)像它正在花時(shí)間去思考一個問題的答案,當然它的反應是由編程算法即時(shí)實現的。
(圖示:在2016年度谷歌開(kāi)發(fā)者大會(huì)上,谷歌首席執行官皮查伊在介紹谷歌數字助理Assistant之前表示,“把它看作開(kāi)發(fā)你自己的谷歌。”)
其背後(hòu)是谷歌稱之為“Duplex”的技術,由紐約、特拉維夫和山景城的谷歌工程師和産品設計師聯合開(kāi)發(fā) ,聽起(qǐ)來好(hǎo)像語音助手的未來已經(jīng)到(dào)來。
嗯,差不多已經(jīng)到(dào)來。
這(zhè)個演示是谷歌計劃在今年夏天發(fā)布的“實驗”計劃的一部分。通過(guò)Duplex技術,一小部分人可以完成(chéng)預訂餐廳、查看假日時(shí)間等通常通過(guò)電話進(jìn)行的活動。所有這(zhè)些交互都(dōu)發(fā)生在後(hòu)端——谷歌數字助理Assistant和餐廳之間。你甚至不會(huì)聽到(dào)發(fā)生的對(duì)話。它將(jiāng)來自一個未指定的電話号碼,而不需要使用用戶自己的号碼。
谷歌對(duì)部署Duplex技術的規模很小心,但表示它會(huì)受到(dào)限制。公司強調,并不是目前所有使用谷歌數字助理Assistant的用戶都(dōu)能(néng)夠體驗Duplex技術。負責谷歌助理和搜索産品設計的副總裁尼克·福克斯(Nick Fox)以及谷歌工程副總裁尤西·馬蒂亞斯(Yossi Matias)均表示,由于Duplex是一項新技術,因此搜索巨頭希望“謹慎行事(shì)”。
谷歌也不會(huì)說(shuō),它的目标是在以後(hòu)將(jiāng)這(zhè)個自然發(fā)聲的助理帶進(jìn)更多的産品——比如從智能(néng)揚聲器Google Home中聽到(dào)它的發(fā)音。
(圖示:谷歌一直在擴大其智能(néng)家居産品線,搭載數字助理Assistant的家用高端音響Home Max售價400美元)
以下是預訂功能(néng)的工作原理:假設您想預約理發(fā)。隻需通過(guò)Google Home詢問谷歌助理Assistant,或從Android手機或iPhone應用程序中發(fā)信息告訴它什麼(me)時(shí)候去哪裡(lǐ)。如果您在星期天中午想要吃點東西,那麼(me)Assistant會(huì)問你是否有備選,以防萬一時(shí)間不夠用——它清楚中午到(dào)下午2點之間的時(shí)間範圍更合适。
如果此前用戶使用過(guò)像OpenTable這(zhè)樣(yàng)的自動在線預訂服務,Assistant將(jiāng)默認使用該系統進(jìn)行預約。但是,如果不以這(zhè)種(zhǒng)方式進(jìn)行自動預訂——而且許多小業務不會(huì)這(zhè)樣(yàng)做——谷歌助理Assistant將(jiāng)會(huì)替你打電話。預定成(chéng)功後(hòu),Assistant將(jiāng)會(huì)和你确認此次行程,并將(jiāng)其添加到(dào)日曆中。
在另一段對(duì)話錄音中,我聽到(dào)兩(liǎng)個女聲在讨論預約理發(fā)。其中一個依舊是采用了Duplex技術的谷歌助理Assistant。 “她”聽起(qǐ)來像是真正的人類。她甚至會(huì)回避問題,同時(shí)在句子的末尾調高語調,聽起(qǐ)來甚至會(huì)讓一些人惱火。
“我們對(duì)它的思考是,‘什麼(me)是完美的助理?’”在谷歌供職已經(jīng)15年的福克斯表示, “當我想要一個助理時(shí),它就(jiù)在那裡(lǐ),随時(shí)準備提供幫助,我不擔心‘我的助手能(néng)不能(néng)做到(dào)。’我的助手可以做任何我想做的事(shì)情。”
大部分時(shí)間福克斯都(dōu)在谷歌從事(shì)搜索廣告業務,目前負責谷歌這(zhè)個标志性項目之一的産品。谷歌在2016年度的開(kāi)發(fā)者大會(huì)Google I/O上發(fā)布了數字助理Assistant,距今已經(jīng)有兩(liǎng)年時(shí)間。當時(shí)谷歌首席執行官桑達爾·皮查伊(Sundar Pichai)解釋了他的願景:Assistant是谷歌的精髓。
皮查伊和團隊的目标是讓谷歌的人工智能(néng)與用戶一道(dào)完成(chéng)一天的工作:如今在Assistant的幫助下,用戶可以從智能(néng)揚聲器Google Home中獲取早間新聞,通過(guò)將(jiāng)手機攝像頭對(duì)準花朵得知物種(zhǒng)名稱,在回家之前打開(kāi)房間内的恒溫器等等。
但是如果谷歌的實驗成(chéng)為現實,Assistant將(jiāng)真正成(chéng)為用戶的數字助理。 “把它想象成(chéng)開(kāi)發(fā)屬于你自己的谷歌,”皮查伊在兩(liǎng)年前如是指出。
(圖示:負責谷歌助理和搜索産品設計的副總裁尼克·福克斯(Nick Fox)表示,“我們不想強迫人們接受,‘數字助理聽起(qǐ)來本應如此’。”)
與此同時(shí),谷歌正試圖用更新後(hòu)的Assistant赢得更多用戶。除了一種(zhǒng)男性發(fā)音和女性發(fā)音之外,這(zhè)個助手還(hái)可以用六個新聲音說(shuō)話。 谷歌還(hái)使用戶能(néng)夠更輕松地提出後(hòu)續問題,并在開(kāi)車并使用谷歌地圖時(shí)自動向(xiàng)某些人發(fā)送你的預計抵達時(shí)間。
人的感覺
如果谷歌的目标是讓Assistant成(chéng)為拟人化的谷歌,那麼(me)仍有很多事(shì)情要做。實事(shì)求是講,到(dào)目前為止谷歌的競争對(duì)手Alexa,Siri和Cortana都(dōu)沒(méi)有兌現他們的承諾。如果谷歌決定將(jiāng)Duplex技術擴展到(dào)Google Home以及其他面(miàn)向(xiàng)消費者的産品,那麼(me)這(zhè)種(zhǒng)情況可能(néng)會(huì)發(fā)生變化。根據我聽到(dào)的簡短對(duì)話,可以感覺到(dào)似乎用戶正在與辦公室的行政助理交談,或者可以說(shuō)像是與斯派克·瓊斯(Spike Jonze)科幻電影《她》(Her)中的操作系統Samantha進(jìn)行對(duì)話。
當然,谷歌并不是第一個進(jìn)入數字助理市場的公司。亞馬遜在2014年發(fā)布了它的Echo智能(néng)揚聲器,同時(shí)用Alexa軟件提供語音功能(néng),這(zhè)讓人震驚。就(jiù)目前而言,智能(néng)揚聲器仍然是與數字助理互動的最普遍方式,而亞馬遜在美國(guó)市場占有69%的市場份額。根據研究公司CIRP的數據,2016年發(fā)布的Google Home占有31%的市場份額。
谷歌和亞馬遜都(dōu)在加強他們的産品線。去年,谷歌推出了40美元的家用迷你音響Home Mini和400美元的家用高端音響Home Max。相比之下,目前亞馬遜有10款Echo産品,價格從40美元到(dào)230美元不等。 2月份蘋果帶著(zhe)售價350美元的HomePod加入了這(zhè)場戰鬥。
但是當數字助理與物聯網設備連接時(shí),可以控制從汽車中控、洗衣機到(dào)電燈等所有設備時(shí),可能(néng)會(huì)賺更多的錢。根據市場研究公司Gartner的數據,到(dào)2020年人們將(jiāng)在物聯網設備上花費1萬億美元。
這(zhè)就(jiù)是為什麼(me)谷歌一直在努力追趕的原因。今天,該公司宣布已經(jīng)向(xiàng)全球發(fā)送了搭載數字助理Assistant的5億台設備,其中包括揚聲器,電話和電視機。 谷歌還(hái)表示,Assistant支持多達30種(zhǒng)語言發(fā)言,并將(jiāng)在今年年底之前支持80個國(guó)家的語言,其中包括7個新國(guó)家,分别是丹麥,韓國(guó),墨西哥,荷蘭,挪威,西班牙和瑞典。同樣(yàng),亞馬遜的Echo能(néng)夠在80多個國(guó)家使用。
(圖示:谷歌工程副總裁尤西·馬蒂亞斯(Yossi Matias)指出,“多年來谷歌一直在緻力于自然語音技術的研究。”)
谷歌上周表示,兼容谷歌助理Assistant的家庭互聯網設備數量從1月份的1500款增長(cháng)到(dào)現在的5000款。這(zhè)對(duì)于谷歌來說(shuō)是一項巨大的進(jìn)步,但不及兼容Alexa設備的一半。目前全球有12000款設備支持亞馬遜Alexa。
谷歌的福克斯一直在試圖淡化與亞馬遜的競争。
“我們很少用競争的方式來看待它,”福克斯說(shuō),“更大的機會(huì)是那些還(hái)沒(méi)有使用任何東西的人。”
盡管如此,兩(liǎng)家科技巨頭都(dōu)沒(méi)有害怕硬碰硬,并且為了智能(néng)家居設備的銷售而相互出手。今年1月份,谷歌切斷了亞馬遜Echo和Fire TV訪問YouTube的渠道(dào)。亞馬遜的電商平台也不會(huì)出售谷歌以及其收購的智能(néng)家庭制造商Nest出品的一些小工具。
“我們并不知道(dào)所有的答案”
特拉維夫谷歌研發(fā)中心負責人馬蒂亞斯則表示,谷歌多年來一直緻力于開(kāi)發(fā)新的自然語音技術。該公司表示,這(zhè)不是一種(zhǒng)适用于各種(zhǒng)電話任務的通用人工智能(néng)技術,相反它是為特定任務(比如預約業務)而量身定制的。馬蒂亞斯欣然承認,這(zhè)項技術并不完美,谷歌正在謹慎行事(shì),因為有更多人性化的人工智能(néng)會(huì)帶來更多棘手的問題。
比如說(shuō)如果軟件開(kāi)始胡言亂語該怎麼(me)辦?馬蒂亞斯告訴我,技術不會(huì)完全失控。他說(shuō),當這(zhè)項功能(néng)真正發(fā)布時(shí),軟件可能(néng)會(huì)告訴另一端的人正在與數字助理進(jìn)行對(duì)話。當然在我聽到(dào)的錄音中,Assistant并沒(méi)有這(zhè)樣(yàng)做。
馬蒂亞斯說(shuō):“我們需要仔細考慮如何在實驗中進(jìn)行這(zhè)種(zhǒng)互動。我們相信用透明度做到(dào)這(zhè)一點是正确的。”
如果對(duì)話确實出錯,軟件將(jiāng)會(huì)退回到(dào)他所謂的“實時(shí)監督培訓”。在這(zhè)種(zhǒng)情況下,軟件會(huì)將(jiāng)對(duì)話權轉交給人來完成(chéng)通話。由于對(duì)話通常不會(huì)受到(dào)人的監控,因此他們必須從頭開(kāi)始。 谷歌并沒(méi)有明确這(zhè)個人是否會(huì)記錄此前通話中已經(jīng)讨論過(guò)的内容。
Duplex技術有些類似于科幻。這(zhè)就(jiù)為我們帶來了一些既有實際意義,又有哲理的問題:一個人應該如何對(duì)待像人一樣(yàng)的人工智能(néng)?人類于機器人之間的正确禮儀是什麼(me)?在不打斷對(duì)話的情況下,人工智能(néng)在與人交談時(shí)表明自己是機器人的最佳方式是什麼(me)?
當被(bèi)問到(dào)這(zhè)些問題時(shí),福克斯承認谷歌工作人員正在思考這(zhè)些事(shì)情。
“我們需要為每個人設定正确的期望,”他說(shuō),“這(zhè)些都(dōu)是技術實現的問題,我會(huì)虛心地說(shuō),我們并沒(méi)有完全知道(dào)所有的答案,并且需要根據我們在現實世界中看到(dào)的情況來加深理解。”
現在在斯坦福大學(xué)工作的矽谷未來學(xué)家保羅·薩弗(Paul Saffo)對(duì)這(zhè)種(zhǒng)情況有自己的看法。他說(shuō),任何現實人工智能(néng)的創造者都(dōu)有義務向(xiàng)與其交互的任何人透露他們正在與機器對(duì)話。
但是随著(zhe)這(zhè)種(zhǒng)技術的應用越來越廣泛,他認為人們會(huì)開(kāi)始意識到(dào)與機器人談話中的“告知”。薩弗指出:“随著(zhe)我們的機器不斷發(fā)展,人們希望自己一開(kāi)始就(jiù)知道(dào)他們是否正在與機器人交談。”
助理無處不在
盡管目前Duplex技術仍然是一個實驗,但谷歌的數字助理Assistant一直在不斷發(fā)展,有些新功能(néng)會(huì)即刻上線。
其中包括更多的發(fā)音。Assistant有六個新的男性和女性美語發(fā)音,。一個女性的聲音柔和舒緩。一個新的男性的聲音稍微低沉。
“我的妻子讨厭那個聲音,她說(shuō)’把它從我的房間裡(lǐ)拿走',”福克斯說(shuō),他播放的是一個像主持人一樣(yàng)興高采烈的男性聲音。名為WaveNet的技術使聲音的擴展庫成(chéng)為可能(néng),該技術大大縮短了錄音員錄制每種(zhǒng)發(fā)音所需的時(shí)間和音頻樣(yàng)本。
這(zhè)些發(fā)音沒(méi)有标明特定名稱。相反,每個都(dōu)用一種(zhǒng)顔色來指定,如紅色,橙色或綠色。您可以通過(guò)滑動手機設置來選擇所需的一種(zhǒng)。當你連接到(dào)Google Home時(shí),隻需選擇您最喜歡的語音設置,揚聲器就(jiù)會(huì)識别你的聲音,并用所選擇的助理發(fā)音回複。
谷歌還(hái)調侃說(shuō),它也會(huì)將(jiāng)歌手約翰·萊金(John Legend)的聲音賦予Assistan。
與大多數更新一樣(yàng),這(zhè)個想法是為了讓助理更加個性化。 “我們不想強迫人們接受,”一個數字助理聽起(qǐ)來本應如此,“福克斯說(shuō)。
將(jiāng)于今年夏天發(fā)布的另一個更新是叫(jiào)做Pretty Please的說(shuō)話模式,其要求你在向(xiàng)助理下命令時(shí)要有禮貌。這(zhè)個模式的目标是鼓勵孩子們說(shuō)“請”和“謝謝”,讓孩子更有禮貌。當然對(duì)于成(chéng)年人也是如此。
亞馬遜上個月發(fā)布了一項類似的功能(néng),用于為孩子們設計的新一代Echo Dot揚聲器。 Alexa的兒童友好(hǎo)型版本提供了正面(miàn)強化,對(duì)一個說(shuō)“請”回應的孩子,Alexa會(huì)回應“謝謝你的問候。”
在亞馬遜發(fā)布這(zhè)項功能(néng)時(shí),谷歌表示已經(jīng)研究Pretty Please有一段時(shí)間。 “所有這(zhè)些都(dōu)是新生事(shì)物,”Assistant産品管理總監莉蓮·雷蒙(Lilian Rincon)表示, “我們都(dōu)在努力解決這(zhè)些問題,這(zhè)并不奇怪。”
還(hái)有很多其他新東西:你現在可以一次提出兩(liǎng)個問題,Assistant將(jiāng)作出連續回答。 (例如:肯德裡(lǐ)克·拉瑪多大年紀,他最新專輯的名字是什麼(me)?)。你也可以在不說(shuō)出“嗨谷歌”的情況下提出後(hòu)續問題,或是重複你的問題。在對(duì)話結束之前,麥克風會(huì)保持8秒鐘的激活狀态。在此之前,麥克風在用戶提出問題後(hòu)就(jiù)暫停拾音。
開(kāi)車過(guò)程中,Assistant可以在你使用谷歌地圖進(jìn)行導航時(shí)向(xiàng)某人發(fā)送預定到(dào)達時(shí)間。當你在手機上訪問Assistant時(shí),它會(huì)顯示更多視覺内容,例如關于最近航班信息和待辦事(shì)項的提醒。你還(hái)可以設置一個“自定義例程”,在關閉早上鬧鈴後(hòu)立即觸發(fā)一組操作。這(zhè)意味著(zhe)可以自動開(kāi)始早間新聞播放,交通狀況更新以及最喜歡的歌曲。
這(zhè)一切都(dōu)很有用。但這(zhè)也意味著(zhe)谷歌智能(néng)助理會(huì)更深入地了解用戶。
這(zhè)值得讨論,因為用戶隐私是科技領域讨論的主要話題。自從Facebook于3月份開(kāi)始與劍橋分析公司(Cambridge Analytica)發(fā)生醜聞以來,矽谷大科技企業的數據收集方法在數周内都(dōu)受到(dào)了額外的審查。一家數字咨詢公司可以在完全不知情的情況下從多達8700萬Facebook用戶那裡(lǐ)獲取個人信息,這(zhè)種(zhǒng)醜聞引發(fā)了關于科技巨頭如何保護用戶數據以及如何賺錢的争論。大多數情況下,谷歌,Facebook和其他公司業務都(dōu)依賴他們收集的有關用戶喜歡什麼(me),不喜歡什麼(me),購物偏好(hǎo),生活方式等個人信息,以便于營銷人員可以投放特定廣告。
谷歌去年的廣告銷售額達到(dào)954億美元,而Facebook的廣告銷售額則達到(dào)了400億美元。
“我們的原則一直是讓用戶控制這(zhè)些信息,”福克斯說(shuō), “在過(guò)去幾周時(shí)間裡(lǐ)強調這(zhè)一點非常重要,但我們一直都(dōu)知道(dào)這(zhè)很重要,對(duì)我們來說(shuō)這(zhè)種(zhǒng)強化是有益的。”
他說(shuō),Assistant查詢的處理方式與常規搜索查詢完全相同,并具有相同的用戶設置。這(zhè)意味著(zhe)用戶可以清除搜索記錄,但這(zhè)可能(néng)會(huì)影響到(dào)所看到(dào)的廣告。
所有這(zhè)一切都(dōu)是我們讨論Assistant的真正原因。正如皮查伊在2016年提到(dào)的那樣(yàng),這(zhè)是谷歌搜索的下一次發(fā)展,人們花在台式電腦上的時(shí)間更少,更多的時(shí)間都(dōu)用在手機和智能(néng)揚聲器以及汽車等互聯網設備上。
當福克斯被(bèi)問及他是否認為Assistant現在是谷歌最重要的項目時(shí),他停頓了13秒。
“Assistant是谷歌一項重要業務,”福克斯說(shuō), “做正确的事(shì)真的很重要。”
來源:網易科技