作者:Benjamin Liang
(具工程、商管、心理、創業的跨域工作者)
何謂大數據的「大」?
許多人普遍認為,以台灣2300萬人及平日的活躍人數所提供的數據,比其歐美,根本稱不上「大」。
其實這樣的看法存在一個偏見,容易以為樣本數愈大,便愈接近母體(population)。
確實,取樣數愈多,表面上看來愈能支持研究結果;然而以台灣2300萬人,每日只要提供十筆數據,也有2億300萬筆資料,在統計上已經非常大了。
關鍵未必是「大」
大數據的精神與現今的科學分類,其實差別只在前者是源自資料探勘,是一種透過大量數據了解人與事的bottom up取徑科學;而現今科學卻習慣Top down的思考。
許多人都知道啤酒與尿布的強相關案例,該案例之所以有名,在於使用了bottom up的資料探勘取徑,也因為如此,結果才怪異,一直要到人類學家以生活型態的分析結果才看出原因。這個案例的啟發不在真實原因,而是透過資料的單純相關性檢定,即可以獲得行銷人員珍貴的資訊。
客戶是誰?
在行銷的洞見之一,常常也是最關鍵的是「客戶是誰?」這個客戶是誰的基本問題決定了才能讓行銷組合從此展開。然而這個Who的問題,並非狹隘的、確實的人,而是一種模糊的、擴大的、情境的角色。而在此的角色可能包含了人囗背景、人格、生活型態、地理位置、價值觀等等的內容,而這其實是行銷STP(segmentation, target, position)的第一步:區隔。
而在數據分析的技術上,這個區隔的位置便是干擾變項或稱調節變項。舉例來説,大數據的資料或許可以讓你發現某些人總是在夜晚十點會大量購買啤酒,因此你有兩個選擇:一是繼續分析地區因素;二是分析季節因素,為什麼一般人會作這兩個選擇,答應是因為成本與獲利,企業希望更「精準」、更「有效」的進行行銷與庫存管理。
然而,上述的觀念並
請先 登入 以發表留言。