阿里巴巴的數據策略

在資訊爆炸時代,擁有大量資訊可能是災難而不一定是好事,也不等於你有能力用好它。

設這樣一個場景:一個愜意的早上,你一覺醒來。吃著早餐,打開電腦,你突然想查一些資訊,但是卻毫無頭緒,因為資訊太龐雜、太碎片化。苦惱之際,你猛然想起自己無意間養成的一個習慣,每當看到一些感興趣的資訊時,無論文章也好,照片也罷,你都沒有讓它變成過眼雲煙,而是花了點時間保存了起來。這時,你的電腦人工智慧掃描了你的資訊庫,透過你平時保存的資訊,分析出你可能感興趣的章節。你打開一看,發現正是你想看的,頓時你心情大好,開始了新的一天……

你很驚訝,為什麼電腦可以找到這些資訊?因為電腦的計算是人腦無法比擬的。為什麼電腦能夠幫你尋找目標資訊?因為你早已在無意中習慣性地保存了龐大的資訊,建立了屬於自己的資訊庫。這個有點科幻意味的場景是不是很熟悉呢?作為數據界的「老謀」,我敢肯定地告訴你,這一天必定很快會到來。

養兵千日,用兵一時

大數據時代衍生的變化,體現在資訊的產生及獲取變得更為快捷,溝通(包括發布、傳播、互動)從單點到互聯,資訊變得更網狀、無序和碎片化。然而,獲取速度又快、數量又多的資訊,很容易被錯誤地解讀為唾手可得,而且成本越來越廉價。如果你目前有這種想法,那你可能已經在不知不覺間被捲進了「數據越多越有用」的誤區。

在資訊爆炸時代,擁有大量資訊可能是災難而不一定是好事,也不等於你有能力用好它。暢銷書《大數據》(Big Data)的作者邁爾荀伯格(Viktor Mayer-Schönberger)在最近一次演講上也強調了數據相關性的重要性。簡單地說就是,收集、儲存和管理數據的綜合成本不菲,是每個企業必須面對的問題。

根據業務策略而制定的大數據策略變得尤為重要,我們首先需要重新審視或辨識有用資訊,並判斷哪些數據可以放棄。一切數據收集活動的出發點都來自業務需要,或者可以應對未來的業務發展。例如,阿里巴巴的電商數據策略就離不開「人、貨、場」的組合。接下來,就是以短期問題作為出發點,並以中長期的發展趨勢為準來決定資源的優先分配順序。

從業務過程中收集資訊、分類資訊、整合資訊,必須成為日常思維的一部分,這是成為數據驅動型公司的必要條件。例如,在產品設計環節中,除了加入產品需求文件(PRD)之外,還要加入數據需求文件(DRD),以重點描述數據相關的需求及變更。

以此類推,在業務的各個環節中,都要考慮數據的收集、匯總及使用,並評估所收集的數據與主體業務之間的相關性。但目前大部分企業依舊秉持「取之所用,無用則棄」的傳統資訊理念,而不會同時考慮長遠數據策略所需要的積累。僅僅服務於當前,為短期目的所收集的數據肯定會偏於狹隘,大數據更需要為未來業務方向做好儲備,換句話說,數據策略的目的就猶如「養兵千日,用兵一時」。

明確了業務的長、中、短期目標,以及實現這些目標將會面臨的障礙之後,還得理解數據能力對這些目標有何貢獻。作為策略部署,我們還需要系統思考(Systems Thinking),去發現周邊生態的數據與主體業務之間的關聯。

舉個例子,要真正了解淘寶的商品交易細節,除了買家的需求之外,物流、支付、競爭對手、賣方營運等數據,都是整體必不可少的一部分。

有了大方向之後,從數據策略到數據落地策略,大致可分為四個步驟:

•確定業務目標與資訊缺口之間的關係,明確數據收集的方向。

•尋找相關資訊的同時,評估零散資訊整合的難度及數據源的品質。如果數據來自外部,應優先考慮元數據(metadata)較完整的資訊來源。

•關注各種數據資源的使用情況及在場景中的回饋結果,同時盡可能記錄下數據從產生到應用的過程,這是從「計畫經濟」到「市場經濟」的落實點,數據必須運用才有價值,以點帶面地經營數據會更穩健。

•最後回到第一步,識別資訊來源與業務目標的關係,優化資訊收集、儲存、整合的過程。

隨著智慧型物件、人工智慧運用場景的普及,資訊產生的形式和速度也變得難以預測。我們需要更便捷、成本更低的方法尋找及收集多源異構的零散資訊,並把它們縫合起來。所以我一直以來都致力於建立大數據的技術平台,促進以上各個環節都能更自動化地完成。

從我在阿里巴巴管理大數據的第一天開始,我就感受到,數據開發的速度是營運大數據的必然瓶頸。不要小看這個縫合的技術,它是細節上的魔鬼,做好它,才能稱得上真正做好了大數據營運。

▋學會系統思考

在轟轟烈烈的大數據時代,學會系統思考,有利於擺脫線性局限、小數據時代的思維方式,轉變為人工智慧與大數據亦步亦趨的思維方式,這兩者截然不同。為什麼?我還是那句老話:以偏概全怎麼能和以全概偏相比。

什麼是系統?系統是一組相互關聯的主題,在一定時間內,以特定的行為模式相互影響,而且具有自我調整、自我組織及自我演進的能力。當系統受外力觸發時,不同的系統可能會產生不同的結果。一個完整的系統必定由三個點組成:要素(主體)、連接點和目標。當主體與連接點及其功能產生了相對固定的關係時,我們便認為這個系統形成了。

以淘寶為例,簡單來說,這個生態系統 (目前流行的名稱是「平臺」)由賣家、買家、物流商、平臺管理方組成,他們之間互相連接,目的是為了匹配需求方與供應方,然後順利地把貨物從賣家送到買家。情況穩定時,各方相安無事,平臺管理方可以坐享其成。當然,這不是系統的真相,在這個系統中,買家與賣家的連接來自交易,更重要的是交易後買家給賣家的評價。根源是平臺為了減少買賣雙方之間的投訴及糾紛,讓評價好的賣家得到更多曝光機會。

在這個加強版的回饋機制中,平臺讓買家優先看到的都是誠信得分較高的賣家。沒有足夠生意流量的賣家知道,快速得到大量交易和好評,是爭取曝光機會的重要因素。誠信賣家變得奇貨可居,而好評有價,最終促始一個黑色產業——專業刷評師出現,江湖(系統)從此不再太平。平臺與刷評師之間展開了一場博弈,系統中出現了一個旋渦,真假評價之爭讓平臺管理方左右為難,正因如此,賣家更一度圍攻平臺方,不能刪除被懷疑的假評。

以上故事在互聯網時代來臨之前也發生過,只是在互聯網時代,特別是大數據時代,數據更有利於還原真相,大數據也自然成為發現真相的利器。不過,我認為更值得反思的是,如何使用大數據分析去防患於未然,而此時,系統思考就更重要了。

過去,我們習慣在簡單的線性關係中尋找規律,因為我們都假設沒有數據,以及數據稀缺是常態,只能局限於邏輯推敲。這就像螞蟻拚命在二維空間中苦思為什麼無路可走,卻不知道我們其實身處的是三維世界。

大數據的存在,就是讓我們把複雜系統變得可描述、可量化、可溯源。隨著科技的發展,物聯網、人工智慧技術的進一步完善,我們越來越不缺少數據,但大家還未意識到萬物互聯之後的世界,系統思考的重要性。

數據的商戰策略:建立以數據驅動為核心的營運關鍵

(本文摘自車品覺著《數據的商戰策略》,天下雜誌提供)


延伸閱讀

找客戶靠數據 三竅門

同業的報復 IKEA的逆襲

團隊是「感情用事的生物」