一張表掌握超級平台所推出的代表性AI

目前市場上和IoT一樣被受關注的還有人工智慧(AI,Artificial Intelligence)了。現在被稱為第三次人工智慧的浪潮,也是AI人工智慧實際上在商業實務上的應用,比以往的任何時候都要多。

只是,現在還有一個問題。現在不管什麼都可以稱為AI,例如應用大量數據的機器學習和機會學習、甚至傳統的統計方法、圖像識別等,好像全都可以稱為AI。其實,隨著以深度學習為代表的進化式演算法和自我學習神經網路的發展,未來的AI勢必是走向一個自動分析的世界,筆者本人也非常期待這個時候的到來。

但是,目前的AI還是以輸入大量的數據和學習為前提。如果沒有蒐集、投入大量的數據,很難提高AI的能力,的確這也是目前存在的瓶頸。

我們也經常誤解「只要導入AI,AI什麼都可以做」,在目前這個時點,AI並不是魔杖。基於這樣的考量,以下,筆者將介紹一些有關IoT和AI人工智慧相結合,所帶來的各種可能性。

AI人工智慧的謬誤

2016年12月,顧能(Gartner)曾經發表關於人工智慧(AI)的10個常見誤解。以下介紹的十種狀況,完全是被誤解或是對AI的過度期待,與現實有非常大的一段距離。

①非常聰明的AI已經存在。
②任何人都可以透過導入諸如IBM華生(Watson)之類的人工智慧程式,進行機器學習和深度學習之後,立即可以從事一切「令人讚嘆的事情」。
③有一種單獨存在的技術稱為AI。
④AI導入後,效果可以立竿見影。
⑤「非監督式學習」優於「監督式學習」,因為無須定義就會了。
⑥深度學習是最強的。
⑦可以像選擇電腦語言一樣選擇演算法。
⑧有一種任何人都可以立即上手的AI。
⑨AI是一種軟體技術。
⑩結果AI並不能成為可用之物,所以沒有意義。

像這樣當我們談論AI人工智慧時,我們很容易傾向於AI就是一種非常聰明的東西,應該從事任何的事情,但是AI還沒有達到這樣的能力。還有人會說「工作都要被AI搶走了」,其實到目前為止,這些都還不會成為問題。

目前的AI最有可能的就是,有可能替換處理工廠生產線上的一些簡單的工作。AI能夠處理的,也只不過是類似流線式生產線上不斷重複的單作業模式,這樣的工作AI就能夠勝任。例如建築工地等,許多的工作環節,可能都有不同變化的情況,AI應該是還無法應對。

換言之,諸如事物的創新、決策的制定和錯誤的處理等,不屬於既定行事的處理過程,對AI而言都還是沉重的負擔。

AI的學習需要大量的數據

AI與買回來即可使用的家電是不一樣的。為了提高準確度和能力,必須使用大量的數據進行練習。如果在業界有一家公司,領先業界較早開始使用AI進行學習的話,這意味著這家公司,將具有比較領先的優勢。但是,這也僅是意味著,這家公司為了大量數據的學習,比較願意花費較長的時間罷了,沒有比較大資本企業的投資,還是很難得到比較有成效的結果。

而且,在許多情況下,僅就一個企業或一個業界領域的數據,實在是不足以創造新的商機。如果沒有加入其他各種企業所擁有的數據或是公開資料、SNS上的資訊等,應該很難獲得較有意義的結果。

為了解決這個問題,有必要與擁有數據的各種公司合作並共享資料,如第四章和第五章的5.4所述。或者需要一種能讓數據流通的機制。

然而,AI學習的方向與人類控制機器的學習不同,AI會自己判斷,決定自己要學習的內容,所以學習的結果,也有可能是一個意想不到的方向。由此可知,當決定讓AI進行學習時,必須好好思考希望提供AI什麼樣的數據進行學習。

各大超級平台所推出的代表性AI

Google、IBM、Microsoft和Amazon這些超級的雲端平台,近來先後都發表了屬於他們自己的AI。每一個AI的版本,在現實的模式和功能上,都有稍微的不同,以下我們就簡單地列表說明一下每個版本的功能。

【圖表5-23】各大型平台所提供的AI服務概況

【圖表 5-23】各大型平台所提供的AI服務概況。圖/經濟新潮社
【圖表 5-23】各大型平台所提供的AI服務概況。圖/經濟新潮社

Google DeepMind/Deep Dream Google Cloud Platform IBM Watson Microsoft Cortana Amazon Lex/Rekognition/Polly

主要的提供功能
•圖像辨識 
•自己學習
•繪圖
•圖像辨識
•聲音辨識
•學習資料庫
•圖像辨識 
•自然語音辨識
•精確度判斷
•支援判斷決策
•自然語音辨識
•圖像辨識
•自己學習
•聲音辨識
•聲音合成
•圖像辨識

各家平台所代表的服務摘錄

IBM的AI稱為華生(Watson),也是可以稱之為AI的服務。IBM本身並未將華生認定為AI,但本書從廣義的角度,覺得應該以AI來介紹。華生可以稱為多個認知判斷解決方案Cognitive Services(認知服務)的集合體,這個解決方案提供了大量可用於各種服務的API(Application Programming Interface,應用程式介面)。

Google的AI雖然就是曾經在圍棋比賽,擊敗世界頂級好手而聞名的Alpha GO。但Google在Google 雲端平台還提供了TensorFlow、Speech API、Vision API等多款的API。這些都是經過深度學習的AI資料庫,例如提供經過學習的圖像辨識、語音辨識等API。 

Microsoft的認知服務(Cognitive Service),就如同IBM的華生,主要是語音和圖像辨識的統合環境。在前一章節曾經介紹的Aroba View Colo就是使用了這項經過學習的服務,來進行性別和年齡的判別。

Amazon的AI包括了搭載聲音辨識音箱Echo的語音辨識引擎Amazon lex、聲音合成引擎的Amazon Polly和圖像辨識引擎的Amazon Rekognition。

即使是少量的數據也可以提供AI學習的服務

如果想嘗試將IoT的數據應用於AI時,重要的決策關鍵,就是學習的時間和費用。因此,大約在2016年左右,已經開始出現「AI最少可以縮短多少學習時間?(或是進行AI學習,可以減到最少的數據量?)」,就不斷聽到類似這樣的聲音。

例如,日本的FRONTEO(日文:株式会社 FRONTEO)就提供KITBIT的AI引擎。KITBIT本身非常擅長分析大量的數據,即使是不存在的大量數據,也可以進行有效地學習。以下是該公司的官網,針對KITBIT的介紹中的一段文字。

即使是人工智慧的領域,想在事前就備好充分的學習準備,其實是一件很困難的事。 通常,人工智慧所要的學習數據量,會伴隨著目的、數據的性質、預期達到的表現等,產生許多復雜的變化。KIBIT的存在,就是可以在非常有限的數據量狀況下,進行重複的學習、提高學習的效能,可以使用最少的學習數據量,發揮最高的效能。

根據數據的學習情況,再透過加權的優化計算方式,就可以自動提高需要判斷的結果召回率(Recall)。未來,應該還會有這種非大數據(Non-big data)也可以進行學習的方法會陸續登場。這樣一來必定可以大大加快學習的速度。

【圖表 5-24】FRONTEO官網(https://www.fronteo.com/)圖/經濟新潮社
【圖表 5-24】FRONTEO官網(https://www.fronteo.com/)圖/經濟新潮社

完全圖解物聯網:實戰‧案例‧獲利模式 從技術到商機、從感測器到系統建構的數位轉型指南

(本文摘自八子知礼(YAKO Tomonori)、杉山恒司(SUGIYAMA Koji)、竹之下航洋(TAKENOSHITA Koyo)、松浦真弓(MATSUURA Mayumi)、土本寛子(TSUCHIMOTO Hiroko) 著《完全圖解物聯網:實戰‧案例‧獲利模式 從技術到商機、從感測器到系統建構的數位轉型指南》,經濟新潮社提供)


延伸閱讀

開始Podcast!因為每個人都在做?

Podcast創意 從對的地方找到靈感

Instagram 與千禧世代的反抗