摘要:网络书店推荐系统主要使用信息检索、协同过滤和内容推荐等技术。过度使用推荐系统会产生负效应,降低用户满意度,给网络书店自身发展带来威胁。网络书店要吸收新成果,提升用户满意度;诚信经营,承担社会责任。
关键词:网络书店;推荐系统;过度推荐;负效应优化
《开卷2016年全国图书零售市场报告》显示,2016年我国图书零售市场总规模701亿元,网上书店的图书销售业务依然保持30%左右的增长,同时,网上书店销售的总码洋首次超过实体书店,当当一家图书销售码洋就近140亿,网络书店已成为绝对优势渠道。与此同时,面对图书种类的纷繁复杂(如当当2016年在售品种就有110万种,还有显示缺货的480万种)和数量的骤增,用户经常感到无所适从。这种可供选择的多样性在为网络书店产生巨大经济效益的同时,某种程度上也降低了用户的满意度。近年来,推荐系统被证明是一种解决信息超载问题、帮助用户做决策的有效工具,被应用到互联网的各个领域。推荐系统中最核心的部分就是推荐技术,它是利用用户的一些行为数据,通过一定的数学算法,向用户推荐可能喜欢的物品的软件工具和技术。
感受推荐系统带来便利的同时,人们也感觉到它的一些局限和问题,开始对其进行反思,如随着“今日头条”的崛起,一些媒体行业的从业者和观察者指出,推荐系统的算法分化瓦解了媒体品牌、媒体受众、媒体策展的概念,这些新平台上的媒体正与粉丝“失联”,但在现有环境和可预见的将来,“任何媒体的掌门人,都必须直面算法,接受算法,与算法共舞”。网络书店是较早引入推荐系统的领域之一,国外相关资料显示,亚马逊的销售业绩有20%35%要归功于推荐系统,京东报告也显示,搜索对京东订单引入贡献非常大,推荐的贡献更是高速增长,但业界、学界较少对其作用进行反思。本文拟结合自身多年的网络购书经验,通过网络调研、文献研读等方法,归纳描述当当、京东、亚马逊(中国)三大网络书店主要使用的推荐系统技术类型,分析其过度依赖和使用推荐系统带来的问题及成因,并针对性地给出建议,以期出版业更健康地发展。
一、推荐系统原理及主要技术类型
随着电子商务的快速发展,推荐系统与技术不断丰富和提高,三大网络书店根据实际需要,选择了适合自身发展的推荐系统。
1.推荐系统原理
推荐系统主要依据人类行为习惯的可预测性,利用信息检索、信息过滤和文本分类等技术,通过数据挖掘、机器学习和基于知识的系统等方法进行预测和推荐,涉及的知识类型和知识来源主要有三类:一是社群知识,指关于整个用户群体的知识,主要来自用户使用过程中的上下文、评价、行为和人口统计等;二是个人知识,指关于目标用户的知识,主要来自目标用户的评价、行为、人口统计、需求等;三是内容知识,指关于将要被推荐的物品的知识以及泛指其用途的知识,主要来自物品内容、领域知识、上下文知识等。当当、京东、亚马逊中国的推荐系统,就是基于上述研究成果,实现的书目推荐。
2.主要推荐技术类型
一是信息检索。信息检索是最早用于解决信息超载问题的技术,我们在三大网络书店所见到和使用过的图书分类浏览、关键词查询以及网站的主编、专家、作者、读者推荐等,使用的就是信息检索技术。其优点是直观、符合用户传统购书习惯,但推荐的信息有限,浏览选择耗时耗力,且因为很多用户缺乏相关知识准备,难以满足在最短时间内找到满意图书的迫切需求。
二是协同过滤。这种方法的原理是找到与该用户有相同品位的用户,然后将相似用户过去喜欢的物品推荐给该用户。其优点是涉及的知识较少,只用到用户对物品的评价等一些简单且基础的数据,如亚马逊会记录读者购买过的图书及其评价,通过人工智能为某位读者提供可能与他兴趣相仿的人购买的图书(alsobuy功能)。其优点是有可能发掘用户自己未曾意识到的兴趣和需求,缺点是对新用户推荐的质量较差,且由于历史数据质量问题,对老用户的推荐质量也有很大提升空间。
三是基于内容的推荐。这种技术方法主要是通过获取用户的浏览、购买等记录来为用户推荐与其过去的兴趣类似的图书,即我们在网络书店看到的“猜您喜欢”下面的推荐,如“与您浏览过的商品的相关推荐”“根据购物习惯为您推荐”“您最近查看的商品和相关推荐”等。基于内容推荐的核心是能够得到图书的描述及其特征的记录。优点是不需要大规模用户就可以达到适度的精准推荐,而且一旦得到图书的属性就能立即推荐新图书。缺点是对新用户推荐质量差,可分析的内容有限,容易过度特征化。
以上是三大网络书店使用的主要推荐技术类型,各有优缺点。目前三大网络书店基本是以协同过滤为主,吸收其他推荐技术的优点,通过多层面算法和数据交融,提高推荐的个性化和精准度。
二、过度使用推荐系统的负效应
推荐系统为提高了图书被发现的几率,不但给网络书店带来了巨大经济效益,也帮助用户节省了大量时间、选择决策成本,并带来新的阅读发现,有其不可替代的优势。但是,我们也应充分认识推荐系统带来的问题。
1.过度依赖推荐系统,降低客户满意度
一是错误推荐或无效推荐。机器推荐不懂节制,面对铺天盖地、无处不在、大同小异的推荐,用户经常感到无所适从,但最令用户难以忍受的是错误推荐和无效推荐,这主要与推荐系统设计的理论依据有关:人们有共同的兴趣爱好且有闹谛睦恚挥泄餐兴趣的用户有共同的需求;过去的需求能反映用户的喜好等。事实上,这些只是部分反映了用户行为的真实性。因为用户浏览购买―本书可能出于各种目的和需求,他们在网络书店留下的痕迹只记录了他们的行为,并不能说明背后的真实原因,人心幽微且变动不居,很多时候连用户自己都不知道自己的诉求,加之目前推荐技术本身的不完善以及网络书店数据库的质量,以此作为用户的兴趣和喜好进行推荐,难免造成错误推荐或无效推荐,降低用户满意度。
二是过度使用甚或操纵推荐系统。三大网络书店将推荐系统当作营销工具,不但页面充满了明显的“硬广”(从各页面的单品推荐到搜索引擎的营销),而且将其暗中植入看似个性化的推荐列表,通过“软广”操纵用户的选择。关于推荐系统能够影响用户对物品的判断,早在2003年,国外学者就给出了在协同过滤推荐时用户评分行为中从众效应的实证研究。如果我们多了解一些社会心理学和认知心理学的知识,还能发现三大网络书店“自动”推荐的看似“客观”的书目序表,有时其实是人工干预的结果。如我们在三大网络书店的搜索引擎键入“红楼梦”,按照当当默认的“销量”“好评”“出版日期”等综合排序,当当出品的《红楼梦》(当当中小学教辅榜排名90位,五星,970条评论,2016年1月出版)排在了第一位,而人民文学出版社的《红楼梦》(当当小说榜排名47位,五星,86142条评论,2013年1月出版)只排在了第三位;按照京东默认的“销量”“评论数”“出版时间”等综合排序,作家出版社出版的“四大名著”(套装)(中小学教辅销量榜第11位,累计评价7100+,2015年12月出版)排在第一位,人民文学出版社的《红楼梦》(小说销量榜第41位,累计评价8.7万+,2008年07月出版)只排在了第三;按照亚马逊(中国)默认的“相关度”,排位前三的是:《红楼梦》Kindle电子书(Kindle商店免费商品排第2名,4.4星,4160条评论)、北京联合出版社的《红楼梦》(图书商品排第474名,4.0星,11条评论)和《红簟罚ㄉ希Kindle电子书(Kindle商店免费商品排第123名,4.0星,34条评论)。很显然,上述推荐排序利用了社会心理学中的首因效应,将自己主推的图书排在了首位,对用户的购买决策施加潜移默化的影响:用户通常通过图书所在的位置和推荐的优先顺序感受其显著性,除非明显不符合自己的需求,很少逐项浏览推荐序表,更少分析和思考其背后的推荐机制。此外,还暗中使用了认知心理学中的默认效应,利用默认项(实际预设了选项)来展现候选书目,影响用户决策:用户通常默认这样的推荐,一方面由于“知识鸿沟”,有些用户根本注意不到;另一方面,即使有些用户注意到,但因为现状的改变总与某些损失或预期的收益有关,相比于有可能更好的候选书目,因为害怕或厌恶损失,很多用户仍倾向于维持现状,从而购买了网络书店推荐靠前的图书。这种看似机器“自动”推荐的结果更容易迷惑用户,很容易造成用户的多买或误买,降低用户满意度。