原創(chuàng)|大數(shù)據(jù)新聞|編輯:鄭恭琳|2020-12-07 15:30:03.777|閱讀 337 次
概述:在上周我寫了一篇“基于機(jī)器學(xué)習(xí)的銀行電話營銷客戶購買可能性預(yù)測分析”,那是作為對客戶購買可能性預(yù)測分析的第一次驗(yàn)證案例的嘗試。今天是基于機(jī)器學(xué)習(xí)的客戶購買可能性預(yù)測分析的第二次驗(yàn)證案例:推薦系統(tǒng)。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
在上周我寫了一篇“基于機(jī)器學(xué)習(xí)的銀行電話營銷客戶購買可能性預(yù)測分析”,那是作為對客戶購買可能性預(yù)測分析的第一次驗(yàn)證案例的嘗試。今天是基于機(jī)器學(xué)習(xí)的客戶購買可能性預(yù)測分析的第二次驗(yàn)證案例:推薦系統(tǒng)。
基于熱度推薦:由專家或者一定時期產(chǎn)品銷售情況或者主推產(chǎn)品,制作一個排行榜,在沒有用戶數(shù)據(jù)的情況下根據(jù)排行榜推薦
基于用戶特征推薦:通過歷史數(shù)據(jù),由算法(機(jī)器學(xué)習(xí))根據(jù)用戶特征進(jìn)行推薦,在用戶數(shù)據(jù)能夠填寫一些基本數(shù)據(jù)的情況下
基于知識推薦:通過用戶要求,比如果需要高收益,需要低風(fēng)險(xiǎn)的產(chǎn)品,在數(shù)據(jù)庫對產(chǎn)品進(jìn)行篩選,然后推薦
基于內(nèi)容推薦:通過用戶已經(jīng)購買的產(chǎn)品,推薦內(nèi)容相似的物品,這里的內(nèi)容相似是由專業(yè)人員提供
協(xié)同過濾推薦:通過算法直接計(jì)算物品相識度,注意這里的物品相似度不是2個物品內(nèi)容,而是有購買情況來確定的,比如說購買A(手機(jī))的用戶,大多數(shù)都購買了B(手機(jī)套),算法計(jì)算出A與B是相似的
一些機(jī)器學(xué)習(xí)推薦:通過以一些機(jī)器學(xué)習(xí)算法,比如說FM(因式分解機(jī)),深度學(xué)習(xí),deepfm等
其中對于新用戶通常三選一
對于老用戶,通常是使用多種算法,然后加權(quán)得出最優(yōu)的推薦列表
在這里主要3種方法驗(yàn)證,協(xié)同過濾,FM(因式分解機(jī)),deepFM。
協(xié)同過濾算法
計(jì)算所有物品的相似度(注意不是內(nèi)容相似)
推薦方法:
對用戶夠買(或者評價過)的物品查詢相識度,然后加權(quán)推薦
簡單例子
最終推薦(從左到右)
基于協(xié)同過濾展示 對user=‘1’
Python 打印結(jié)果 這里看過的電影只打印前5 推薦電影只推薦加權(quán)后前10
------WATCHED MOVIES--------
1193 "One Flew Over the Cuckoo's Nest (1975)" 'Drama'
2355 "Bug's Life, A (1998)" "Animation|Children's|Comedy"
1287 'Ben-Hur (1959)' 'Action|Adventure|Drama'
2804 'Christmas Story, A (1983)' 'Comedy|Drama'
595 'Beauty and the Beast (1991)' "Animation|Children's|Musical"
------RECOMMEND MOVIES--------
1196 'Star Wars: Episode V - The Empire Strikes Back (1980)' 'Action|Adventure|Drama|Sci-Fi|War']]
1265 'Groundhog Day (1993)' 'Comedy|Romance'
364 'Lion King, The (1994)' "Animation|Children's|Musical"
260 'Star Wars: Episode IV - A New Hope (1977)' 'Action|Adventure|Fantasy|Sci-Fi'
2571 'Matrix, The (1999)' 'Action|Sci-Fi|Thriller'
2716 'Ghostbusters (1984)' 'Comedy|Horror'
1022 'Cinderella (1950)' "Animation|Children's|Musical"
318 'Shawshank Redemption, The (1994)' 'Drama'
1282 'Fantasia (1940)' "Animation|Children's|Musical"
1580 'Men in Black (1997)' 'Action|Adventure|Comedy|Sci-Fi'
因式分解機(jī)算法
評分矩陣是一種反映用戶對物品喜歡的矩陣,如下圖
因式分解機(jī)一種補(bǔ)全評分矩陣的的算法(紅色為算法補(bǔ)全),然后根據(jù)評分推薦(對用戶1推薦為物品3>物品6>物品1>物品4>物品5)
算法解釋:通過已知的評分去找到P和Q,K為隱藏的特征,可以設(shè)置不同值
因式分解機(jī)算法的效果如下
------RECOMMEND MOVIES--------
318 'Shawshank Redemption, The (1994)'
858 'Godfather, The (1972)'
1198 'Raiders of the Lost Ark (1981)'
50 'Usual Suspects, The (1995)'
2858 'American Beauty (1999)'
912 'Casablanca (1942)'
593 'Silence of the Lambs, The (1991)'
750 'Dr. Strangelove or: How I Learned to Stop Worrying and Love the Bomb (1963)'
908 'North by Northwest (1959)'
1221 'Godfather: Part II, The (1974)'
deepFM算法
deepFM 是一種結(jié)合FM算法和深度學(xué)習(xí)的算法,結(jié)構(gòu)如下
deepFM算法的效果如下
------RECOMMEND MOVIES--------
593 'Silence of the Lambs, The (1991)'
1617 'L.A. Confidential (1997)'
1233 'Boat, The (Das Boot) (1981)'
318 'Shawshank Redemption, The (1994)'
1198 'Raiders of the Lost Ark (1981)'
858 'Godfather, The (1972)'
733 'Rock, The (1996)'
1276 'Cool Hand Luke (1967)'
2571 'Matrix, The (1999)'
953 "It's a Wonderful Life (1946)"
離線實(shí)驗(yàn)的目標(biāo)
最大化預(yù)測準(zhǔn)確度
在滿足一定要求的情況下
比如
慧都大數(shù)據(jù)分析平臺,將學(xué)習(xí)、推理、思考、預(yù)測、規(guī)劃等能力賦予企業(yè)數(shù)據(jù),讓數(shù)據(jù)驅(qū)動決策,創(chuàng)造最高業(yè)務(wù)價值。
歡迎撥打慧都熱線023-68661681或咨詢,我們將幫您轉(zhuǎn)接大數(shù)據(jù)專業(yè)團(tuán)隊(duì),并發(fā)送相關(guān)資料給您!
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn