| 主页 | 频道首页 | 本站地图 | 论坛留言 | 合作联系 | 本站消息 | |
科技动态 技术发展 文化研究 生物生态 人的研究 生命起源 基因工程 科学普及 科学探索 专题其他

个性化推荐猜你心

2012-03-09
个性化推荐
个性化推荐猜你心

和讯链接 http://tech.hexun.com/2012-02-17/138380430.html
个性化推荐猜你心

个性化推荐已悄无声息地成为网站拉拢用户的必备利器。

  MONEY+记者|王茹芳
  Dr. S,喜欢研究各种商家策略,精通公司和品牌吸引顾客的各种门道。他非常乐意带你去揭开生活中的商业秘密,然后为你提供建议,有时还会发你些信息bonus。所以,如果你有疑惑,尽管给他发邮件吧—dr.secret@yicai.com。

  亚马逊中国对个性化推荐系统守口如瓶,哪怕只是相关数据。难怪亚马逊如此小心,现在,个性化推荐以其在电商网站的广泛应用而闻名,它们以顾客的兴趣作为切入点,产生一个推荐列表,也就是你所熟悉的那些“猜你可能会喜欢”。

  亚马逊是零售网站中使用个性化推荐技术的先驱,其个性化推荐系统目前属于网站的核心机密。而据美国科技博客网站VentureBeat的数据,Amazon.com有35%的销售额是来自个性化推荐。当当、京东等电商网的销售额也有很大部分间接受到个性化推荐的影响。

  购物网站的个性化推荐到底是如何成为用户的知心人的?答案是,用“个性化算法”。它属于数据挖掘的范畴,依据一定的逻辑与公式,计算出用户的个人偏好,发掘出他们无法正确表述,甚至还未成形的需求。这件事最有意义的地方在于能把只能凭直觉判断的主观“喜好”彻底量化,达到精准推荐的目的。

  听上去很玄对不对?实际上……它确实不那么简单。这次,我们也“死理性派”一次,逐一分析四种被运用得最多的“个性化算法”。电子科技大学互联网科学中心主任周涛认为,新用户更容易受流行的影响,而老用户的个性化需求会更强。正是由于这一原则,当消费者来到一个陌生的电子商务网站,或者成为网站的注册用户时,接受到的推荐多是热门的、流行的畅销商品。而只有当消费者留下浏览、搜索和购买记录后,他们才能得到更有针对性的推荐。

  关联推荐,渐被淘汰的个性化算法

  这种方法最为简单直白,网站将用户搜索、浏览、购买、已评级的商品视为一个整体,分解出作者、主题、品牌等关键词,进而搜索与此商品最直接相关的东西。例如,消费者在网站浏览了伍迪?艾伦的《中央西路》,那么网站就会默认用户喜欢该导演,伍迪?艾伦的其他作品便会出现在推荐书单里。网站分解出的哪个词出现频率越高,就证明与之相关的东西越代表用户的喜好。看得出,这种方法并不智能。因为它把用户理解得过于简单。正是因为这一缺陷,关联推荐完全OUT了。当当数据分析师张嘉洪说,这是电子商务网站最早期的推荐方法,现在国内只有少数小规模购物网站用的还是这种推荐模式。

  人以群分,基于用户的个性化算法

  “协同过滤”是目前商业应用最广泛的个性化技术,它整合所有用户的信息,为个体服务。基于用户的协同过滤是第一代协同过滤技术。它背后的道理非常简单:人以群分。如果一群消费者常在网站购买同样的商品,那么这些人应该有相似的偏好。网站要做的就是找出那些有相似购物或浏览记录的用户,然后把他们还不曾拥有的东西相互推荐—把甲消费者买过、但乙消费者还没有购买的东西,推荐给乙消费者,反之亦同。

  比起关联推荐,这种方法能帮助顾客发现新的、有趣的商品。然而,用户间的相似度如何判断,需要经过复杂的计算才能得出具体数值。下图是A、B、C、D四位用户在CDNOW网站的购买记录:

  看起来很复杂是吧?你只需要记住,这个公式可以算出不同用户的相似系数。以此类推,A与C的相似系数约为0.41,而A与D的也约为0.41,数值越高,相似度越大,由此可以判断:A与B的品位最为接近,可以将B已经购买、而A尚未购买的商品2推荐给A。事实上,当网站找到了与A相似的多位用户之后,它会将那些A尚未购买,而其他人已经购买的专辑,按照这些专辑被购买的概率,对产品进行排序,最终才把排名靠前的东西推荐给A。

  物以类聚,基于商品的个性化算法

  对当当/京东等大型零售网站来说,它的用户数量远大于商品数量,那么基于用户的个性化算法显然会带来计算量过大的问题。豆瓣工程师阿稳说,计算用户之间的相似性需要计算1000万次左右,而计算商品之间的相似性,10万次左右就够了。

  基于提高计算效率这一思路,亚马逊个性化部门的共同创始人Greg Linden设计和开发了“从商品到商品的协同过滤”技术。这也是目前被使用最多的个性化算法。简单来讲,其原理是先判断哪些商品之间具有潜在相关性,然后根据用户的购买记录,把那些和购买记录中关联度高的商品推荐给用户。

  何为潜在相关性呢?看个经典案例—购物篮分析。1990年代,零售商们在美国中西部超市发现了“啤酒-尿布综合症”:年轻男顾客的购物篮中,尿布和啤酒会同时出现。这其中的联系是,男顾客被妻子打发出来买尿布后,都会拎一箱啤酒回去。向买尿布的年轻男子推销啤酒,成功率会明显增高。当两种看似风马牛不相及的商品被同一用户同时购买的频率越高,那么商品的潜在关联就越强。当面对海量的数据集和用户数量时,从商品到商品的协同过滤会显现出优势—实时做出高品质推荐。因此,当我们在亚马逊等网站浏览某商品后,即便立刻回到主页,主页的推荐也会根据之前的浏览信息立刻做出调整,反应时间被控制在半秒之内,甚至更短。

  你输入的关键字也能成为个性化算法

  有时候用户并不清楚他们想要的是什么,他会通过关键字来进行搜索,而网站会根据这些对商品内容描述的词,推荐更多与你需求类似的东西。如果一件商品的tag,即标签越多,那么它的属性也就越丰富,与之相关联的东西也就越多。网站也会根据这些标签来计算哪些商品的关联度更高。这种个性化算法在业内被称为“基于内容过滤的算法”。豆瓣负责个性化推荐的工程师王可斌说,目前“豆瓣猜”采用的就是“基于内容的算法”和“基于商品的个性化算法”。

  不过,如果网站只采取“基于内容过滤”的个性化推荐也也会产生问题—获取的内容虽与消费者兴趣吻合,但也会让消费者的购买视野越来越窄。

  个性化推荐的风险

  而今,所有的个性化推荐都不会只采用一种算法,而是文中各种算法的结合。不过,愈加智能的个性化推荐仍存在一些风险。豆瓣曾推荐了本《富人不说,却默默在做的33件事》,有网友说:认为谁穷疯了么,你爱推荐给谁给谁,别总给我推荐这类书!当然,这段话已经被我们“翻译”得很温和了。或许,网站应该反思一下如何不让个性化推荐冒犯到用户。

  此外,网站搜集的信息越多,消费者越会感到隐私受侵犯。如果你的朋友都收到了以下推荐:“你的好友最近购买了一些减肥药,你要不要也试试?”这多令人尴尬啊!亚马逊解决这一冲突的方法是,允许消费者修改或删除记录。


真实的投资银行世界
《心智、大脑与计算机——认知科学创立史导论》
脑瘫患者成为博士 已发表20余篇论文
“再牛逼的伟人,也有苦逼的青春”物理版
物理学步入禅境:缘起性空
世界著名咨询公司在华情况
马云在斯坦福大学的演讲
智猪博弈与激励机制设计与企业战略
饶毅的科学成就
屠呦呦和青蒿素
何祚庥:隻怨“谁叫你不幸生在了中国”
Nature上给做科研的四条黄金忠告
北京生命科学研究所所长王晓东谈饶毅落选院士
Foxit十年暗战反胜Adobe的故事
融合东西方智慧破解人类困境
为什么硅谷最牛的人在创业公司?
开曼谎言:中国企业的离岸秘史
Google早期的十个疯狂故事
罗斯柴尔德的中国生意
科学家与他们的上帝
被文明改变的人体
从社会网络角度看农民的生产协作,产品交换,社会资源配置
VIE会导致中国海外上市公司一文不值吗
谁对谁说了什么-Twitter研究进展
三大证据相继破灭:进化论,一个错误的信仰
霍金:天堂和来世只是害怕死亡者的童话故事
我们最该知道的10大科学定律及理论
给笔记本外接一个显示器的方法
世界著名实验室简介
伦理与政治考量过滤科学之真
人大讲座的开场白-大学生社会责任
浅析北美中国老板中的变态者 霍金和霍金辐射
李醒民专访:遨游在科学的三维世界里
人类学家提出可能引发地球崩溃的12个因素
无线WEP和WPA密码及破解原理
丘成桐:感情的培养是做大学问最重要的一部分
没有秘密——阿桑奇的理想
论抽象社会
科学与竞争:以日本物理学为例
《科学》主编:中国论文拒稿率高因投稿最多
“科学家一定需要博士帽吗”
如何培养自然科学领域的巨匠
爱因斯坦是如何获得诺贝尔奖的
美国多名退役军官曝UFO曾多次光顾该国核基地
哲学笔记I--被操纵的人性
PRL:物理定律可能并非全宇宙通用
李晓宁:形式逻辑为何产生于西方
《逻辑起源》连载
自然逻辑的产生、发展及意义
论现代逻辑
评论:被人为割裂的中国互联网
互联网大帝孙正义
城市交通网络拓扑结构复杂性研究
无线上网卡老掉线问题掉线的方法
科学家揭秘章鱼保罗预测的秘密
科学家和《阿凡达》里的科学
许成钢:经济学、经济学家与经济学教育
谢宇:漫谈定量与定性研究方法
如何在顶级科学杂志上发表论文
中国如何招聘教授:十年的变化和今后的趋势
学术资料账号密码全集汇总
混沌中的数学
幂律分布、幂律涌现与幂律谱
数学的若干发展和中国的数学
嘉路兰的螺旋历法理论
基金项目《动态评价网络的统计分析与信息挖掘》
人类文明的斐波那契演进
数学的常数美
科学创新犹如渔夫打鱼
超难的75道逻辑思维题
被禁70年的创富秘诀《硅谷禁书》
RSS文件形式
怀念路遥-贾平凹的BLOG
跨学科交流+开辟自己的领域=创新的境界
大师似苗如何栽
五大疯狂天才剖析
Windows 7下载及使用Windows 7升级
艺术与科学的“姻缘”——谈文艺复兴时期艺术与近代科学兴起的关系
Google TrustRank and Hilltop
实证研究方法
一位北大CCER研究生的经济学、金融学学习感悟
潘晓《人生的路啊怎么越走越窄》
Windows XP系统端口关闭方法
世界上最牛的论文
TXP1atform.exe中毒归来
google使用技巧
Widget发展和Widget的各种应用
身体语言密码29
现代科学研究专题其他1 现代科学研究专题其他2

本栏目主要介绍科学技术方面,包括现代科学研究成果、现代科技、现代科学技术、个性化推荐猜你心等。特别关注有关人与文化的价值方面的研究。

『科学频道首页』 『本栏页首』 『关闭窗口』