- N +

母嬰電商網站是如何進行個性化推薦的

母嬰相對一般的電子商務網站有一些特點:第一個特點是商品周期短,在母嬰網站上的商品,在線的時間不會超過5-7天,第二個是用戶需求的變化快,在母嬰行業,可能是用戶的需求變化最快的領域,比如是用戶處在懷孕當中,關心的是孕媽的一些問題,幾個月以后,隨著寶寶的落地,就會準備一些紙尿褲和奶粉,而且隨著寶寶的長大,紙尿褲和奶粉的類型也會變化。第三個是移動化,一般有90%的成交是來自移動端的。


   重慶網站建設手機端的屏幕非常的小,可以給客戶的信息非常的有限,所以需要我們幫助用戶找他有興趣的東西,大數據平臺既要為網站的活動提供大數據的支撐,還需要實現個性化的推薦,搜集用戶的行為,全面的了解用戶的購物意圖,推薦用戶感興趣的商品。

  

   下圖是整個大數據平臺的架構圖,最下面的是我們的數據收集,后面會有介紹。計算層包括了離線計算和實時計算,以后搜索引擎,在算法層有協同過濾,分類產生一些用品的商品特征,以后排序的模型。在業務層的話,業務的類型是豐富多彩的,我們會融入一些運營的規則進行調整,包括一些個性化的調整和推薦,以及營銷。

  

  

   BI 層的應用有面向運營的,面向商家的,會涉及用戶的瀏覽日志,在PC上的一些行為,比如是用戶瀏覽了一些什么商品,點擊了一些什么商品,對數據的消費也有二種方式,一種是實時消費,一種是離線消費,這種方式會在每天的凌晨進行一次統計,會有一天的延時,比如是 今天上線的活動,可能明天才知道這個活動的效果,因為我們研發了一套實時的數據研發系統,因此任何需要實時消費的數據報告,只要訂閱就可以了。

   分布式的調度是整個大數據平臺的核心,在大數據平臺處于一個指揮的作用,比如是任務管理,任務監控和任務日志,我們研發了一套分布式的系統,里面有二種角色。Master主要是負責任務的管理,任務的分配,任務的執行,任何的Master掛掉,都不會影響我們系統的運營。

  

   在整個大數據平臺上,很大一部分是推薦的產品,第一類是個性化的排序,個性化排序的特點是在侯選級的情況下,根據用戶的不同的購物的用途,為用戶做個性化的排序,用戶到達我們網站的時候,我們會推薦所有在線的品牌特賣,比如是一天500個,根據用戶的購物的意圖,做個性化的數據。

   第二個是關聯推薦,比如是推薦和這個商品相似的商品,購買的商品可以推薦搭配的商品。第三個是個性化推薦,給指定的用戶推薦他感興趣的商品,比如是在用戶的資料的頁面,我們會直接給用戶推薦他感興趣的商品。

  

   除了這三種推薦的形式,還包括通過個性化的短信,個性化的推送,引導用戶到我們的平臺,我們會給用戶推薦感興趣品牌,我們會對商品進行個性化的排序,還會有相似商品的推薦,用戶交易的環節,還會推薦和這個商品搭配的商品,包括周期購買預測等。

  

   為什么會有這種推薦,可以從二個方面來看,一個是我們網站本身是一個輕搜索重推薦的模式,在我們的網站上搜索的功能是非常的弱化的,我們最近的上線的搜索 框也很不明顯,這是一個推薦商品非常重要的渠道,從推薦的本身來說,也可以看到它的三個方面價值,提升用戶的購物的體驗。幫助商家找到感興趣的用戶,也可 以提高他的銷售額,對整個平臺來說,只有服務好用戶和商家,才能得到一個比較好的持續的發展。

  

   推薦這么的重要,最重要的是用戶畫像,這是我們的吉祥物,我們會對它進行二個部分,一個是靜態的畫像,比如是性別,年齡,寶寶的年齡性別,以及一些動 態的畫像,比如品牌,購買時間,購買渠道等等,我們的這個行業里面,最重要的一個特征就是用戶的性別年齡,不同的寶寶的性別年齡會影響到購物的偏好,很大 的一部分的媽媽是填寫了一些用戶的信息的,比如說寶寶的年齡是0-1歲,可以利用這個用戶的行為特征,比如是它的瀏覽次數,收藏次數,有了這樣子的模型, 就可以來填寫寶寶年齡的預測。

  

 

 

   第二套很重要的標簽是購物偏好,主要是提到的一些動態標簽,比如是品牌內部等等,我們會統計用戶在我們的平臺上的一些行為,根據這些行為的成本給予不同的 選中,包括瀏覽電極,啟發式的做法非常的簡單,也是非常的容易理解,這些參數不好確定,這個時間的衰減應該做如何的衰減的程度。

  

   我們現在正在用機器學習的方式做用戶的偏好預測,把用戶當前的購物的偏好做特征來進行一些購物的偏好。有一個很重要的推薦的類型是個性化的排序,當用戶到 了我們的PC首頁的時候,會展現每天500個在線的專場,用戶很難通過翻頁的方式來瀏覽所有的品牌,我們有一套規則的算法,模型有非常多的特征,可以考慮 非常多的因子,規則往往是只有幾個關鍵的因子,比如是會把GMA往前排,規則是靠經驗和參數的。已經形成了一個優化的問題。還有模型很方便加入用戶的特征 做個性化的特征。

  

   第一檔就提升了6%,至于怎么樣做,這個就是一個學習的流程,主要是離線和在線二個部分,在線系統搜集到了排序以后,也會根據用戶的ID和品牌的ID,構建同樣的特征和模型進行組合,就可以得到用戶對每一個平臺的分數。

  

   那特征是這里面最重要的一部分,有屬性特征,主要是各種維度的特性,還有是統計特征,還有偏好特征,偏好特征是我們做個性化推薦的最基本的推薦,這個是和 用戶有關系的,比如是用戶的畫像。在這里面,我們做了很多的嘗試,剛開始的時候,有點擊率,點擊率很好做,我們發現點擊率的提升和我們的GMA的提升不是 完全一致的。我們用過分類和排序的算法,排序的算法會好一點,非線型的模型也會更有優勢一點。

  

  

   我們到了電商網站的時候,肯定遇到過這樣子的產品,你看過的商品可能是感興趣的商品,在這個行業里面有很規律的算法,但是在母嬰特賣里面,有它自己的特 點,它的商品每一行是代表了一個用戶,每一列是代表的一個商品,第一周上線的商品第三周上線的時候,另外二個已經是下線了,第二個特點是在線的商品比較 少,就會把舉證壓縮,這樣子的話,對這個舉證會變的不這么的稀疏。第三個是這個行業的特點,比如是寶寶的性別,寶寶的年齡是否是一致的,如果是一致的話, 那是否有一個持續性。1-3歲的話,還可以,但是如果是對一個1-3歲的商品,可能就不大合適的。

  

  

  


返回列表
上一篇:閉站不降權!百度“閉站保護”功能大升級
下一篇:百度搜索凈化網絡環境的又一力作“天網算法”