聲控經濟 科技巨頭之戰

你是否想像過靠語音開啟的一天?語音助理提醒你今天早上的會議地點,順便幫你在星巴克訂購一份早餐,再為你規劃不塞車的通勤路程。囊括生活每個層面的語音助理商機,早已是Google、亞馬遜(Amazon)、蘋果(Apple)與微軟(Microsoft)的兵家必爭之地…

九九○年代,網路世界是一個封閉的地方。許多使用者都用像是美國線上這類入口網站來管理自己的網路瀏覽需求,把資訊都集中在同一個入口網站上,並且列出有用的外部網站,藉此瀏覽體育資訊、金融資訊等。使用者大多都是在封閉的環境裡上網,這種生態也因此稱為「圍牆花園」(walled garden)。後來,Google用鐵鎚擊破圍牆,推出搜尋引擎,讓大家可以自行在網路世界裡輕易找到想要的網頁。從此以後,我們便能在整個網路世界裡自由翱翔。

但是過去幾年來,有一件奇怪的事發生了。Google和亞馬遜竟然在重建花園的圍牆。Google推出即時回答,讓使用者有時候不需要跳出搜尋結果頁面,就可以得到想要的資訊。Google和亞馬遜也都設計出自家的語音助理。語音助理就是一種入口網站,像是數位行銷商Huge的創意總監蘇菲‧柯列伯(Sophie Kleber)說道:「Alexa就是語音世界的美國線上。」

Google助理與Alexa平台上許多熱門的應用程式,也都是Google或亞馬遜自行設計的。要用第三方應用程式,使用者必須先經過Google助理或Alexa。例如,使用者通常會用所謂的「呼喚語」(invocation phrase)呼叫Alexa技能。使用者可能會說:「Alexa,我要聽《華盛頓郵報》的頭條」,或是「Alexa,玩《危險邊緣》」。同樣地,Google助理的使用者也會說:「打開Yelp」或「ESPN上有什麼新聞?」

如果使用者知道自己要用哪一個語音應用程式,這樣的模式就沒有什麼問題;但是如果使用者不知道自己要用的是什麼,會如同矇上眼睛在飛行,就像在沒有搜尋引擎協助的情況下,要找到新的網站。如果使用者詢問的問題或是說出的指令沒有指明要用哪一個應用程式,Alexa或Google助理就會自行決定該如何回答問題或執行指令。如此一來,Google和亞馬遜就握有強大的權力,能夠主導語音流量的去向。

這樣的模式看起來就很像是以前的圍牆花園,會形成這樣的模式,其實也不一定是因為亞馬遜或Google本身渴望握有控制權,但是這些企業肯定很享受這樣的權力所帶來的利益。在語音的世界裡,本來就適合以單一數位實體掌控一切,Siri的原始研發團隊肯定支持這樣的想法。如果沒有一個主宰的語音助手,所有的語音應用程式都會是獨立開發,這樣一來,每個應用程式都有自己的名字、自己的獨特功能、自己的一套指令。「我覺得大家不可能記住數萬個不同的名字和數萬套不同的指令。」切爾說道:「這種模式先天就無法規模化。」

切爾與基特勞斯離開蘋果後,創辦Viv。Viv追求的是另外一個目標:創造獨立運作、全知全能的助理。Google和亞馬遜雖然很明顯地漸漸在扮演資訊守門人的角色,但是它們本身不想要被大眾當成資訊守門人。但是Viv不一樣,該公司開宗明義就明白宣告,他們的目標就是要做出全能的助理——終極的電腦,有了它,就不需要其他的電腦了。的確,Viv的科技其實已和第三方應用程式配合,畢竟切爾一直以來的運作模式都是如此,但是第三方應用程式都是在背後暗中來,使用者不會看到。使用者只會和一個助理互動。Viv在二○一八下半年推出,裝載在全世界數百萬台三星裝置上。

「這是一場競賽。」吉特勞斯說道:「各大企業相爭成為使用者的單一介面。」

各大科技公司表現大盤點

Viv擁有強大的科技,因為它使用的科技是語音助理這個領域最初的先鋒所研發的,但是因為進入市場時間較晚,算是競賽中的一匹黑馬,和其他競爭者競逐成為主導介面。這場競賽在幾年前還似乎比較開放,大家都可以來競爭,但是現在競賽已經比到某種程度,占有優勢的參賽者已經出線了。

現在,我們來盤點每家公司的表現。首先是蘋果,Siri是全世界普及的數位助理,平均每個月接獲的指令數高達一百億則,而且支援二十多種語言。

這是好消息,但壞消息是蘋果並未遵照原始創辦團隊的構想行事,所以Siri並沒有發揮應有的實力。許多科技評論家都開始批評Siri,Siri儼然成為語音人工智慧界的眾矢之的。評論寫道:Siri「很糊塗」又「很難堪」(《華盛頓郵報》);「蘋果錯失的最大契機」〔《休士頓紀事報》(Houston Chronicle)〕「有重大缺陷」(《紐約時報》)。科技分析家傑雷米‧歐陽(Jeremiah Owyang)在接受《今日美國》(USA Today)訪談時表示:「感覺蘋果好像完全放棄了Siri。」

這麼說是有點過頭了,但是蘋果的確該受到批評。蘋果原本是語音人工智慧的領頭羊,但是現在卻落後了。蘋果直到二○一八年二月才推出自家的智慧音響HomePod,比Google Home慢了將近一年半,比亞馬遜Echo慢了整整三年半。HomePod推出後,評論家對其音質表示讚賞,但也提到HomePod價格高昂的問題——一台HomePod要價三百四十九美元,亞馬遜Echo只要九十九美元;而且許多評論家也對Siri提出批評,表示HomePod上的Siri性能很差勁。到了二○一八年六月,HomePod在美國智慧居家音響市場的市占率只有四%。

針對語音科技,蘋果採取的策略其實和公司的本質定位有關。蘋果的本質是電子裝置製造商,因此把Siri當成自家裝置上的優秀功能,而不是把Siri當作獨立出售的產品。然而,Google與亞馬遜都預測在未來環繞運算會成為主流。如此一來,語音科技確實會為蘋果帶來風險。在未來,聰明的人工智慧住在雲端上,透過價格低廉的商品和使用者講話,而蘋果專門販賣高價裝置,在這種情境下,蘋果的地位會受到極大的衝擊。

接下來是微軟。微軟有一個世界級的人工智慧部門,部門裡有八千名員工。微軟有搜尋強大的引擎Bing,提升語音助理的問答能力,而且微軟的虛擬助理Cortana已經確立了自己的地位。

但是,微軟提升Cortana在消費者市場的市占率方面遇上了困難。Bing或Skype都支援Cortana,但是這兩個平台的用戶量卻遠遠不及Google或Messenger。Windows Phone上也能使用Cortana,但是它的市占率一直無法脫離個位數,甚至只有個位數出頭,所以在二○一七年停產了。在智慧音響的戰場上,Cortana裝載在哈曼卡頓的智慧音響Harman Karton Invoke裡,但是這款音響的市占率小到幾乎無法計算。開發人員不想花時間為一個很少人用的平台設計語音應用程式,所以大多數都選擇避開Cortana。

儘管面臨這些挑戰,微軟並沒有放棄。Cortana裝載在Windows作業系統上,而且每個月有一億四千五百萬名活躍用戶。微軟並不是把Cortana定位成全能、全民型的人工智慧,而是定位為職場助理,這很符合微軟近期的總體經營策略:專門為企業提供軟體與雲端服務,而人工智慧語音科技就是其中一種。所以,微軟即便在語音科技的戰場上並沒有總體優勢,但是在企業領域裡,有條件成為一支精實勁旅。

下一頁:臉書在語音世界的未來很難預測

你可能還喜歡