Web数据挖掘在电子商务中的应用研究

时间:2020-08-28 16:27:08 电子商务毕业论文 我要投稿

Web数据挖掘在电子商务中的应用研究

[摘要]当今互联网拥有海量的数据,如何对这些Web上的数据进行挖掘提取有用的模式,辅助企业获得成功,是一个刻不容缓的题目。本文对Web数据挖掘的基本内容和相应的技术作了先容,并对Web数据挖掘在电子商务中可应用的范围作了说明。
  [关键字]Web数据挖掘、电子商务
  
   引言
  
   在电子商务领域,通过Web数据挖掘,不仅可以从大量多种多样信息的Web页面中提取出我们需要的有用的知识,还可以得到关于群体用户访问行为和方式的普遍知识,用以改进Web服务设计。更重要的是,通过对用户特征的理解和分析,如对用户访问行为、频度、内容等的分折,提取出用户的特征,从而为用户定制个性化的界面,有助于开展有针对性的电子商务活动。[1][2]
  
   1.Web数据挖掘简介
  
   当今Web上存在着大量的数据,获取有用信息成为人们关注的焦点。但Web 是无结构的、动态的,Web 页面极其复杂。这样就使得人们从成千上万的 Web 站点中找到有用的数据变得比较困难。于是,人们就越来越关注如何开发和利用 Web 上的数据资源。
   Web 数据挖掘就是解决上述题目的一个途径。当数据挖掘技术应用于网络环境下的 Web 中就成为 Web数据挖掘。 Web数据挖掘就是从 Web 文档和 Web活动中抽取感爱好的潜伏的有用模式和隐躲的信息。
   Web挖掘可以分为三类:Web内容挖掘、Web结构挖掘和Web使用挖掘 [3]。Web内容挖掘是用来提取文字、图片或其他组成网页内容成分的信息;Web结构挖掘是用来提取网络的拓扑信息,即网页之间的衔接的信息;Web使用挖掘是用来提取关于客户如何运用浏览器浏览和使用这些衔接的信息。
  
   2.Web数据挖掘的技术先容
  
   从电子商务的角度出发,进行Web上的数据挖掘,主要就是进行客户访问信息的挖掘,得到客户端浏览行为和访问模式,从而找到有用的市场信息。在Web数据挖掘的模式发现中,常有以下几种数据挖掘技术的使用:
   2.1路径分析:使用路径分析技术进行Web使用模式挖掘,最常用的就是网站结构图。它可以被用于判定在一个 web 站点中最频繁访问的路径,还有一些其他的有关路径的信息通过路径分析可以得出,比如:70%的用户端在访问/class/book2 时,是从/class 开始,经过/class/new, /class/book,/class/book1,最后才到的/class/book2。这条规则说明在/class/book2 页面上有有用的信息,但由于客户对站点进行的是迂回绕行的访问,所以这个有用信息并不明显。假如这个页面对网站来说比较重要,可以通过此路径分析改进页面及网站结构的设计,从使客户更轻易的访问/class/book2。
   2.2关联规则:关联规则主要关注事物内的关系。在Web使用挖掘中,关联规则挖掘就是挖掘出用户在一个访问期间从服务器上访问的页面/文件之间的关系,找出在某一次服务器会话中最经常一起出现的相关画面。例如,40%的.客户再购买了CD之后又购买了CD清洁剂。利用挖掘出来的这些相关性,我们可以更好的组织站点,实施有效的市场策略。
   2.3序列模式:序列模式挖掘就是挖掘出交易集之间有时间序列关系的模式,在Web日志中发现所有满足用户规定的最小支持度的大序列模式。序列模式的发现就是在时间戳有序的事务集中,找到那些“一些项跟随另一个项”的内部事务模式。例如:在/class/book1上进行过在线定购的顾客,有60%的人在过往15天内也在/class/bag1处下过订单。发现序列模式能够便于进行电子商务的组织猜测客户的访问模式,对客户开展有针对性的广告服务。通过系列模式的发现,能够在服务器方选取有针对性的页面,以满足访问者的特定要求。
   2.4分类规则:分类技术主要是根据用户群的特征挖掘用户群的访问特征。在Web数据挖掘中,分类规则的发现就是给出识别一个特殊群体的公共属性的描述,这个描述可以用来分类新的项,例如:在/class/book2 进行过在线定购的顾客中有 55%是20-30岁生活在南方的年轻人。得到这一分类后,就可以进行适合这一类客户的商务活动。