农资电子商务智能强烈推荐模型概述
1 绪论
1.1研究的背景和意义
当 google 从人们日常搜索的内容预测到了禽流感疫情的爆发,当电视剧剧组人员的遴选通过社交网络信息的预测来确定,当美国总统大选的智囊团通过智能分析系统去寻找助选帮手,当这所有发生时,人们不禁惊叹新信息时代来的如此迅速,智能强烈推荐技术的能力是如此的惊人。正如曾为《云端时代》写序的钱大群所言我们所面对的,不只是一群随时产生资料的个人,而是一个不断被数据淹没的新世界。在数据爆炸的时代中,运用经过提炼的智慧,创造新的成长机遇和全新的价值,这不是一个简易的数据问题,而是一场从量变到质变的变革。;国际知名互联网数据公司 IDC 在近期发布的互联网数据分析中称:储存或停留在互联网中的数据(范围为全球)将会在未来的十年中激增数十倍,其规模的大小不可想象,届时,在互联网中同一时刻发送即时信息的人数高达百万,同时应用 office 软件的用户(从开始应用到应用结束的一段时间)高达千万,各种各样的数据如视频、音乐等,在互联网上流窜,人们对数据的控制能力将达到极限[1]。如何处理这些数量巨大,信息密度极低,结构极不规则,生成速度又极快的数据呢?如何从中搜寻到属于自己的、对自己有用的信息呢?随着电子商务迅猛发展,商家或网站在为用户提供越来越多项目和服务的同时,其网站中的功能模块以及网站架构也变得错综复杂[2],用户要么在各型各样的网站架构中迷失,要么在海量的项目信息中无从选择,很难顺利找到自己需要的项目和服务。而每个人都有着不同的经历、不同的兴趣爱好和不同的需求[3],甚至可以对某位哲人的至理名言稍作修改,改后则是没有两个人能迈进同一条河流;。个性化强烈推荐技术为此应运而生,它能够针对每一位用户的具体情况提供专属于他自己的强烈推荐信息,而不再让人们去面对堆积如山、毫无次序的信息。
..
1.2智能强烈推荐技术的现状分析
1997 年,oachims 在一篇名为《万维网导游》的文章中提出了 WebWatcher,不同于 Robert 等研发的 Web-Watcher,其思想是在基于用户兴趣的基础上创建一个导航 Agent,给用户浏览网站的时候提供导航。系统由概括用户开始,查询他们的兴趣,每次用户访问一个页面,信息将通过代理 Server 跟踪用户在浏览 WebSite 时的会话,凡是用户可能感兴趣的链接都将被高亮度显示。此类技术已经广泛应用于大型搜索引擎以及新闻网等信息量较大、不容易分清主次和重点内容的门户网站中。1998 年 Wu 等的 Speed Tracer Project 构架在 Chen 等[10]基础上,使用了参考页面和请求页的 URL 作为浏览步骤和重建浏览过程对会话进行识别[11]。同年,Zaiane 着手研发了 WebLogMining 系统,此系统结合在线分析处理 OLAP、数据挖掘技术、多维数据立方体对交互隐式知识进行抽取,系统过滤 Web Log数据后,将它们转化成相关 DB,并在第 2 阶段创建数据立方体,其中每个维代表了相邻域中所有可能的取值。从此以后,OLAP 技术被用来结合数据挖掘技术广泛应用于网页的数据挖掘以及个性化强烈推荐[12]。2001 年,Huang 等[13]提出使用立方体模型精确识别 Web 访问会话,维护会话的顺序,并使用多个属性来描述被访问的页面。
..
2农资电子商务智能强烈推荐系统模型设计
2.1农资智能强烈推荐系统模型的设计
本文通过将多种强烈推荐方式如基于项目、基于用户和基于关键字等不同的强烈推荐模型相结合,分析农村市场、农业用户和农资产品的特性和普通电商强烈推荐系统的不足,设计了一个专门针对农资产品进行强烈推荐的智能强烈推荐模型。该模型以农资电子商务平台为载体,通过网站收取的用户基本信息、购买记录、浏览信息、评分信息和搜索记录等对用户兴趣进行分析,并将三种强烈推荐技术相结合,针对各种强烈推荐技术的不足做出了有效的补充,使强烈推荐的内容更具有科学性、强烈推荐系统更加高效。本模型根据农资用户的需求进行系统设计,所应有的都是现有成熟稳重的强烈推荐技术,首先保证系统的可行性,并逐步使系统功能更加强大、更加稳定。在使系统稳定可行的同时,又根据信息技术发展的趋势以及可能面对的新环境,本模型对未来可能产生的其他强烈推荐应用预留了接口[29],增强系统的可扩展性,从而使系统能够不断更新,便于以后的发展。所以本文将 hadoop 技术引入到了智能强烈推荐系统中,使强烈推荐系统不仅能够处理日常强烈推荐,还能为将来农业大数据时代的到来做好准备。
2.2农资智能强烈推荐模型的设计
在农资智能强烈推荐模型的设计中我们需要对用户的输入、输入方式作出详细的设计。比如输入模块中,在用户注册过程中,需要在保证用户没有厌烦的情况下尽量详尽地记录用户的信息,以保证第一手资料的完整性,而且需要保证在不泄露用户隐私的前提下尽量搜集用户留在网站中的相关信息,以便于更好地分析用户的兴趣和需求[35]。所以农资智能强烈推荐系统的输入方式大体包含以下几种:一是用户在搜索框内输入的信息;二是用户在本网站中购买项目的详细记录;三是用户对所购买项目的评价。对于输出形式我们已经在上文提到,即以网站直接强烈推荐和短信通知为主,其他强烈推荐形式为辅。在农资智能强烈推荐系统中,强烈推荐算法模块的设计是核心中的核心。我们知道基于项目的协同过滤算法的优势是可以处理新产品问题,通过分析项目内容来进行强烈推荐,也就不存在新进项目无法获得强烈推荐的问题;但是对于新进用户,基于项目的强烈推荐系统还是无法强烈推荐。而基于用户的协同过滤算法能很好的缓解这一问题,它通过比较用户之间的相似性进行强烈推荐,对于新用户只需要确定新用户的归属问题即可进行强烈推荐。然而,基于用户的协同过滤算法也不是全面的,它同样无法对毫无历史信息的游客;进行强烈推荐,而且当用户对前两种强烈推荐算法产生的强烈推荐结果不满意时,即用户产生了新的消费思路时,前两种算法都无法很好地解决这种用户新偏好出现的问题,所以本文将基于关键字强烈推荐算法也融入到农资智能强烈推荐系统中,它直接分析用户输入内容区匹配所搜索的项目,并且将本次搜索输入的信息与用户基本信息相结合,修正原有强烈推荐算法的不足、规避了用户手动输入信息时可能出现的错误,并对搜索结果按照强烈推荐顺序进行排序,将能够很好的解决这一问题。所以我们将三者相结合,以求达到更好的强烈推荐效果。
.
3基于项目的智能强烈推荐算法......20
3.1 数据的预处理 ....22
3.2 基于项目属性的强烈推荐算法的设计 ....25
3.3 实验分析 ....26
3.3.1 数据集.......26
3.3.2 评测指标和评测结果.......27
4 基于用户的智能强烈推荐算法......29
4.1 相关技术 ....30
4.2 基于用户强烈推荐模型的设计 ......33
4.3 ROC 聚类分析 ......35
4.3.1 HD-ROC 算法描述 .......36
4.3.2 HD-ROC 算法性能分析 ......37
4.3.3 产生强烈推荐.....38
4.4 实验分析 ....38
5 基于关键字搜索的强烈推荐算法....44
5.1 强烈推荐流程和存在的问题 ....45
5.2 针对关键字分类问题的解决办法 ....46
5 基于关键字搜索的强烈推荐算法
基于关键字搜索的强烈推荐模式是搜索引擎巨头 google 公式为开发自己的广告盈利模式而设计的[41],它通过比对用户搜索过程中的关键词,分析出用户的需求,在用户得到搜索结果的同时将反应用户需要的相关广告强烈推荐给他们。通过前几章的介绍我们知道,已经在网站注册的用户或已经在网站购买过商品、做过评分的用户,他们在登录网站时会在网站的显著位置看到网站为其提供的产品强烈推荐,其强烈推荐方法可能是基于项目的强烈推荐也可能是基于用户的强烈推荐,但是如果该用户觉得网站强烈推荐的商品不符合他当前的需求或者他想尝试某种新型的产品,这对于该用户而言可能是一种新的购物理念的开始,对于网站而言则是新的商机,而这时前两种强烈推荐算法将很难起到良好的强烈推荐作用,对于游客用户也是一样,前两种强烈推荐算法都无能为力,而基于关键字搜索的强烈推荐算法将得到应用。关键字搜索是一般用户登录电子商务网站进行购物前的一个操作步骤,他们在进行搜索时往往还没有确定具体需要的产品的名称,但是心中已经有了产品的类型、特征或其他某种属性,而这种被搜索的关键字往往能代表用户的需求和偏好,对于农资电子商务平台而言,关键字搜索则具有更重要的意义。
结论
本文以建立农资智能强烈推荐模型为目的,通过分析农资产品、农村市场、农民用户的特性,将其与普通智能强烈推荐系统相结合,使之能够对农资产品进行强烈推荐。在本章中首先介绍了智能强烈推荐的研究现状和农业电子商务智能强烈推荐系统的研究现状;然后针对普通电子商务强烈推荐系统缺乏农资产品的针对性的问题,提出了农资智能强烈推荐系统模型的架构设计;最后针对农资智能强烈推荐系统中强烈推荐模块的设计进行了详细的分析,并通过实验验证了三个强烈推荐模式的可行性。以下是对全文内容的详细描述:在文章的第二章中,本文将智能强烈推荐模型分成了三个模块,分别是输入模块、输出模块和强烈推荐算法模块,其中强烈推荐算法模块是设计的核心。本文根据功能的不同将该模块细分为三个次级模块,即数据分析(Data Analysis)、数据预处理(Data preprocessing)和算法设计模块(Algorithm Design),将基于对象的设计思想融入其中,使强烈推荐过程更加细化的同时方便了系统的扩展与删减。
参考文献(略)