基于Web数据挖掘的用户上网兴趣收集VB+CSW

时间:2020-09-01 16:14:07 计算机应用毕业论文 我要投稿

基于Web数据挖掘的用户上网兴趣收集VB+CSW

毕业论文

基于Web数据挖掘的用户上网兴趣收集
 
摘  要 在电子商务活动中,为了研究用户的上网、购买习惯或者提供个性化的服务,往往需要用户注册,这种对个人信息的需求,在1定程度上影响了电子商务的发展。因为互联网用户对个人隐私非常关心,在很多情况下用户不愿提供详细的个人信息。
获取个人信息1方面应在用户可以接受的范围内获取尽可能多的用户信息;另1方面应当以尽可能少的、最有价值的用户信息来保证电子商务活动的需要。本文通过对用户上网兴趣进行收集,得到用户的兴趣模型,即用户兴趣数据库。通过VB 6.0和CSW 5.0分词软件实现了用户在个人电脑上的上网兴趣收集。通过不断地收集活动,更新兴趣数据库。电子商务或其它服务提供商,通过获取该用户的兴趣模型,就可以为用户提供个性化服务,提高了客户或用户与服务提供商交流的效率。
关键词: Web数据挖掘; 用户兴趣收集;用户兴趣模型; 中文分词;网志分析
 
User’s Web-Pages Interests Collection Based On
Web Data Mining
 
Abstract  In order to offer better personal services, E-Business servers often acquire users’ private information registered by the users. This information needs affect the development of E-Business for everyone is concerned with his own information and afraid of being revealed, consequently. he won’t offer detailed information in many conditions. 
So, it is essential to get users’ information as much as possible while extract the most useful information as little as possible to guarantee the E-Business services. In this paper, we build users’ interest model by acquiring users’ interests continuously. We use VB 6.0 and CSW 5.0 to acquire and analyse users interests, at the same time, update the User Interest Database by tracing the users’ behaviours which reflect their interests. As a result, E-Business or other servers can provide personality and improve the communion fluency between users and providers servers with this model.
Keywords:Web data mining; users’ interests collection; users’ interests modeling; word segmente; web log mining
目录
前言 2
1 开发环境 3
1.1 MICROSOFT ACCESS 2003 3
1.2 MICROSOFT VB 6.0 3
1.2.1 Visual Basic 6.0 开发平台 3
1.2.2 Visual Basic 6.0 访问数据库 4
2 WEB数据挖掘及相关技术探讨 6
2.1 WEB数据挖掘的概述 6
2.2 WEB文本挖掘及日志挖掘概述 7
2.3 WEB数据挖掘的相关技术 8
2.3.1 Cookies分析 9
2.3.2 收藏夹分析 15
2.3.3 中文分词介绍 20
2.3.4 钩子 23
2.4 兴趣建模 29
2.4.1 用户兴趣模型的表示 29
2.4.2 建模技术 29
2.4.3 用户兴趣收集数据库 30
3 系统分析与实现 32
3.1 系统分析及可行性研究 32
3.2 总体设计 32
3.3 数据库设计 34
3.4 详细设计 34
3.5 系统关键代码 38
3.6 部分模块测试后的显示结果 40
4 总结 42
参考文献 43
致谢 44
附录1 CSW简介 45
附录2 部分代码 47

 
前言
近年来,Internet技术得到了广泛的应用,并日趋普及,成为全球范围内传播信息的重要手段。目前,Internet用户可以利用搜索引擎工具,通过输入关键字,获得自己所需的信息。Internet上包含了大量的Web站点,每个Web站点就是1个数据源。Web挖掘的数据通常包括3类:(1) 用户的背景信息:此类信息主要来自用户的注册信息。(2) 浏览信息:浏览信息主要来自于浏览者的单击流(Click-stream),这部分数据主要用于考察用户的行为表现。Web上有海量的的数据信息,人们在浏览网站时,包含了大量的潜在信息,如个人姓名和住址,单击了哪1个连接,在哪里浏览时间最多等。 (3) Internet自身信息:这类信息来自Web自身,如网页内容、Web结构等。
在网页迅速增长的`同时,Web用户也迅猛地增长。海量的网页在为人们提供包罗万象、丰富无比的信息资源,同时,也向人们提出了如何快速、有效地从信息海洋中获取其所需信息的挑战。由于信息站点的建立,信息发布是大量的、自由且无序的,如果没有有效的搜索工具,在网络中查找信息如同大海捞针。搜索引擎在网络信息资源查找中起到了相当重要的作用,是最普遍的辅助人们检索信息的工具,比如传统的搜索引擎Yahoo和新1代的搜索引擎Google等。
如今,在许多商务活动中,为了研究用户的上网、购买习惯或者提供个性化的服务,往往需要用户注册,这种对个人信息的需求,在1定程度上影响了电子商务的发展,因为互联网用户对个人隐私非常关心,在很多情况下用户不愿提供详细的个人信息。因此,在这种情况下,服务提供商就不得不从用户浏览信息中的1系列相关动作(比如把感兴趣的网页信息存入收藏夹、在某个网页上的停留时间等)来推测用户的兴趣,进而为用户提供个性化服务。
本文通过研究和验证用户上网兴趣收集的方法,得到提升电子商务价值的途径。把基于内容的Web挖掘和基于日志的Web挖掘两种方法结合起来,在前人的基础上,研究用户兴趣的收集方法并将收集数据进行组织和建模,得到的用户兴趣模型可以应用于电子服务行业,使之能为用户提供更加方便及个性化的服务。为检验模型的实用性,本文设计1种智能网页推荐系统,为网站的每1访问用户迅速提供其真正感兴趣的网页。并给出系统的实现算法。
论文的研究内容有:对用户定制信息的保存和分类;对用户收藏的网页进行分析和特征提取; 对cookies的读取与分析;对用户浏览某网页的动作进行统计分析;综合用户兴趣爱好,统计用户兴趣排行;建立用户兴趣模型。
本论结构及每章的基本内容如下:
前言给出了论文写作的背景、工作、研究目标以及研究内容;
第1章开发环境的主要介绍;
第2章详细介绍了Web数据挖掘及相关技术,包括Web文本挖掘概述、Web日志挖掘概述、Cookies分析、收藏夹分析、中文分词介绍和钩子以及用户兴趣建模的相关情况;
第3章进行系统分析与实现;
第4章对本文作了全面性的总结。

【基于Web数据挖掘的用户上网兴趣收集VB+CSW】相关文章:

1.Web数据挖掘技术探析

2.科技论文发表基于Web数据挖掘技术的研究论文

3.web数据挖掘技术分析与研究

4.基于数据挖掘的成绩分析系统

5.Web数据挖掘在电子商务的应用论文

6.浅析电子商务中的WEB数据的挖掘论文

7.浅谈基于web日志挖掘的网络教学系统的设计与实现

8.基于ASP技术开发Web数据库检索程序

9.Web数据挖掘及其在电子商务中的应用研究论文