web使用模式挖掘及其在电子商务领域的应用

web使用模式挖掘及其在电子商务领域的应用

ID:34410698

大小:142.68 KB

页数:3页

时间:2019-03-05

web使用模式挖掘及其在电子商务领域的应用_第1页
web使用模式挖掘及其在电子商务领域的应用_第2页
web使用模式挖掘及其在电子商务领域的应用_第3页
资源描述:

《web使用模式挖掘及其在电子商务领域的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、科技管理研究2005年第11期2005No11ScienceandTechnologyManagementResearch文章编号:1000-7695(2005)11-0126-02Web使用模式挖掘及其在电子商务领域的应用蔡猷花,张岐山(福州大学管理学院,福建福州350002)摘要:Web使用模式挖掘是Web数据挖掘领域一个重要的应用,对于个性化电子商务网站中发现用户行为特征具有重要的意义。本文首先介绍使用模式挖掘,然后分析了使用模式挖掘在电子商务领域的应用,从而指导电子商务网站资源的组织和分配。关键词:Web

2、使用模式挖掘;电子商务;模式识别;模式分析中图分类号:F716文献标识码:A当今互联网上的信息正在沙漠化,这使得寻找有价值结构模式,可用于网页归类,并可由此获得有关不同网页信息的难度大大增加。在开展电子商务活动的过程中,企间相似度及关联度的信息,有助于用户找到相关主题的权业经营者都希望能够从浩如烟海的商务数据以及其他相关威站点。的数据中发现带来巨额利润的商机。如果能够跟踪客户在使用模式挖掘(又称为日志挖掘),是对用户访问WebWeb上的浏览行为并进行模式分析,构建智能化的Web站服务器时留下的访问记录进行挖掘,从中得出用户的访问

3、点,这样就会缩短销售商与客户之间的距离,让销售商更和访问兴趣的过程,主要用来了解用户的网络行为数据所了解自己客户的需求,有针对性的开展电子商务,从而获具有的意义,是对现代电子商务战略的一个重要支持。得竞争优势。网络内容挖掘、网络结构挖掘的对象是网上的原始数据,而使用模式挖掘面对的是在用户和网络交互的过程中1Web数据挖掘抽取出来的第二手数据。用户访问模式的挖掘是本文研究11什么是Web数据挖掘。Web数据挖掘必须从数据挖掘的重点。谈起。数据挖掘是针对RichDataPoorInformation问题而2使用模式挖掘提出的一项新技术。数据挖掘是指从大

4、量的、不完全的、模糊的、随机的数据中提取出隐含在其中的、潜在的知识用户访问Web获取信息的过程中需要不停的从一个页的过程。数据挖掘的对象不仅是数据库,还可以是任何组面通过超文本链接跳转到另一个页面,这种过程存在一定织在一起的数据集合,如WWW信息资源等。的普遍性,发现此规律即是用户访问模式的挖掘。近年来,为了实现个性化的主动信息服务,Web数据21使用模式挖掘的数据源。传统数据挖掘与使用模式挖挖掘技术成为一个新的研究热点。Web数据挖掘是数据挖掘主要的不同在于数据源的不同。前者的挖掘对象多为数掘技术的一个重要应用,它是指在大量训练样本的基础上,据库,后者

5、的挖掘对象通常包括:Web服务器日志(包括得到数据对象间的内在特性,并以此为依据在网络资源中服务器日志、代理日志和引用日志)、Web站点的拓扑结构进行有目的的信息提取。和站点文件、用户注册信息、用户调查信息、Cookies以及12Web数据挖掘的类型。Web数据挖掘总的来说可以分与网站服务相关的数据库数据等等。这些数据可以来自于为三种类型:网络内容挖掘、网络结构挖掘以及使用模式服务器端、客户端、代理服务器端或者公司的数据库。挖掘。网络内容挖掘即从网络的内容、数据、文档中发现22使用模式挖掘的一般过程。用户模式的挖掘通常要经有用信息的过程,是通过对网络

6、信息内容的准确定位,揭过以下四个步骤:示众多信息之间的关系,挖掘出隐藏在网络数据或文档中第一步:数据预处理。这是用户导航信息挖掘最关键的知识内容。网络信息资源类型众多,从网络资源的形式的阶段,数据预处理包括数据清洗、用户识别、会话识别来看,包括文本、图像、音频、视频等形式的数据。整个和事务识别4个步骤:(1)数据清洗主要是对数据源中与Web空间里,有用的知识不仅包含在Web页面的内容之中,数据挖掘不相关的冗余数据删除,判断是否有重要的访问而且也包含在页面的结构之中。网络结构挖掘是挖掘Web没有被记录、对用户访问页面时发生错误的记录进行处理潜在的链接结构模式,

7、是对Web页面超链接关系、文档内等。Web日志记录包括用户IP地址、用户ID、用户请求访部结构、文档URL中的目录途径结构的挖掘。通过分析一问的URL页面、请求方法、访问时间、传输协议、传输的个网页链接和被链接的数量及对象来建立Web自身的链接字节数、错误代码等属性,而与数据挖掘相关的数据只是收稿日期:2005-01-20基金项目:福建省自然科学基金资助项目(A0210013)蔡猷花等:Web使用模式挖掘及其在电子商务领域的应用127其中一部分。冗余数据包括以下几类:请求访问失败的记一个内容页组成,导航页是到达内容页所走的路;事务仅录;访问方式不是GET的记

8、录;URL的后缀为gif、jpeg、由多个内容页组成

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。