维普资讯 http://www.cqvip.com
2008年第2期 福建 电脑 163 数据挖掘技术在电子商务中的应用 朱春 (广东省新闻出版高级技工学校广东广州510000) 【摘要】:二十一世纪是信息化的时代,g三产业在各国的比重不断上升,特别是服务业,信息服务业成为21世纪的 主导产业.这导致了电子商务的产生和发展。在全球信息化大势所驱的影响下,各国的电子商务不断的改进和完善,电子商 务成为各个国家和各大公司争夺的焦点。 f关键词】:电子商务、数据挖掘 1.序言 在当前信息化时代,世界电子商务发展速度非常快。传统行 业的电子商务也得到了广泛的应用。金融、流通、制造等传统行 业已开始大规模进入电子商务领域。各行业应用企业的积极参 与和实践.极大地推动了我国电子商务在各领域中的发展。电子 商务之所以能以如此迅猛的势头发展。有其内在必然性:网络的 优势在于”更快、更广、更丰富、更互动、更低成本”地传递信息。 和传统商务比.电子商务具有新产品发布快、价格低、远程选购、 24小时服务等突出特点.具有巨大的市场和无限的商机。调查显 示.尽管对网络交易安全表示疑虑,9o%的网民打算参与电子商 务活动。 面对这个现状.许多商家已经充分认识到Wleb是潜在的成 本最低的通道.于是网络经营成为企业经营的必由之路。从技术 层面上讲,建立一个电子商务网站开展网上交易并不难。但是, 电子商务网站像传统商业一样都要靠效益来生存.因此电子商 务网站必须吸引客户,增加能带来效益的客户忠诚度。对于电子 商务网站来说.目前网络上的web信息是一些信息素材和粗加 工的信息,无法应用到实际的决策中。所以,如何获取有用的信 息对开展电子商务显,得很重要。 2.Web挖掘的概念 Web挖掘是利用数据挖掘技术从www的资源f即Web文 档)和行为f即Web服务)中自动发现并提取感兴趣的、有用的 模式和隐含的信息。它是一项综合技术,涉及到I'ntemet技术、人 工智能、计算机语言学、信息学、统计学等多个领域。 3.Web挖掘的基本架构 由于Web数据的复杂性.所以Web挖掘最重要的工作就是 确定有价值的数据源。正是这些数据源的挖掘结果给电子商务 网站建设带来了许多启示。Web访问log日志包括服务器端的 Berver log、proxy server log和客户端的cookie log等。server log 顺序记录用户的点击f文件请求)和事务操作,通过它可以知道谁 访问了站点、访问了哪些页面以及事务执行的状况。pfoxy serv. erlog包含访问者的访问位置和引入站点的关键词和路径 cookie是用户访问站点时由服务器传递到用户浏览器的少量信 息。cookie log详细描述了访问者访问站点时浏览了哪些地方 当访问者返回到同一Web站点时.cookie能够确定访问者的身 份和偏好。尽管cookie的使用引起了有关个人隐私的争论.但对 于电子商务网站而言cook/e是提供个性化页面和产品的关键营 销工具。访问者注册时提供的个人信息或在访问站点中提交的 表单都能够为随后的挖掘产生有价值的数据库 Web交易记录 中的信息以及会计系统、自动销售数据库等非Web信息库的数 据可以为当前或潜在的市场营销策略提供有价值的建议。结合 从其他第三方因特网数据提供商处购买的个人在线行为数据. 能够编译出有用的结果 许多Web站点都有电子邮件链接.它使得访问者能及时查 询产品和服务或提供关于公司的电子商务网站或产品的反馈。 Web挖掘能够在聚集的客户电子邮件响应数据上实施.并产生 对商业趋势和利润分析有价值的信息。比如web站点根据挖掘 结果自动地用电子邮件通知某些访问者或那些关心优惠或打折 信息的目标用户群体。 4.Web挖掘的过程 电子商务中的Web挖掘过程一般由3个主要的阶段组成: 数据准备、挖掘操作、结果表达和解释。 (1)数据准备。这个阶段又可进一步分成3个子步骤:数据 集成、数据选择、数据预处理。数据集成将多文件或多数据库运 行环境中的数据进行合并处理。解决语义模糊数据准备,这个阶 段又可进一步分成为处理数据中的遗漏等。数据选择的目的是 辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质 量 预处理是为了克服目前数据挖掘工具的局限性。 (2)数据挖掘。这个阶段进行实际的挖掘操作,包括的要点 有:决定如何产生假设;选择合适的工具;发掘知识的操作;证实 发现的知识。 f3)结果表述和解释。根据最终用户的决策目的对提取的信 息进行分析.把最有价值的信息区分开来,并且通过决策支持工 具提交给决策者。因此,这一步骤的任务不仅是把结果表达出 来.还要对信息进行过滤处理,如果不能令决策者满意,需要重 复上述过程。 5.在电子商务中Web挖掘的对象 在Web挖掘中.一个关键性步骤是为Web挖掘提供合适 的数据即挖掘对象。同样。把Web挖掘技术应用到电子商务中, 也需要选择合适的目标数据集合。电子商务网站每天都可能有 上百万次的在线交易.生成大量的记录文件和登记表。这些数据 具体分为以下几种: ●服务器日志数据 Web服务器日志记录了用户访问电子商务站点的浏览行 为.是使用Web挖掘的主要数据来源。日志文件格式中最常用 的公用日志格式(Common Log Format)提供了关于访问者物理 访问站点的信息。 ●Cookie日志数据 Coolde日志是服务器为了自动跟踪电子商务网站访问者而 为单个浏览器生成的标志。用于自动标记和跟踪站点的访问者。 并由客户端持有。Cookie通常存储的是类似于购物手推车状态 信息或者客户最近连接电子商务网站所访问的网页等信息。在 电子商务网站.存储在Cookie日志的数据主要是交易信息。 ●客户信息 在电子商务的交易过程中.须经过银行的信用授权才能进 行交易。在这一过程中.大量有关客户的个人资料等信息会传到 电子商务网站。把这些数据经过清洗,然后存入网站的数据仓库 中作为长期趋势的分析数据.供数据挖掘之用。所需的数据类型 取决于在线购物时的商业类型和所使用的数据本身。 ●其他数据源 电子商务是基于Intemet进行各种交易的.在其上面有大量 的异质数据源.里面隐含了大量的有价值的信息有待挖掘。可以 利用智能Agent来进行抽取而获得有用的信息.这有助于电子 商务活动的开展。 (下转第131页) 维普资讯 http://www.cqvip.com 2008年第2期 福建 电脑 以下程序为关闭数据库连接 public void CloseStmt 0 { try 131 3.本考试系统采用的关键技术 本系统采用数据库存储的信息动态地生成Web页,每一个 页面在提交时都会访问一次数据库。Java语言通过JDBC API提 供了一个标准SQL数据库访问接口,使得Java程序直接数据 库连接,将SQL命令发送给数据库服务器,大大提提高了访问 速度。下面给出本系统与数据库连接的Java文件: package exam; (stmt.Close0: 】 eateh(SQLExeept ion e】 { e.printStackTrace 0 import javmsq1.; public class exam ) publ ic void closeConn 0 try { Stirng strDBDrlver=”sun3bc.MbcjdbcOdbcdriver'’: Sting rstrDBUrl=’'jdhc:odhc:exam”:lid—exslll为本Java文件名 Prirate Connection eonn=nun; Private Statement stmt—null; ResulISet r 一一null: Publie exam0 Class.forNam e(strDBDriver); 】 care av&lang.ClassNotFoundException e) l system.err.pfindn(”examO:”+e.getnessag删: 下面语句为建立数据库连接和定义数据查询 l conn.Close 0 】 cateh(SQLExcept ion e】 l e.printStaekTraee0 】 4、本系统的界面及效果 Public ResultSet executeQuery(String sq1) rs=null try l conn=DfiverManger.getConnection(strDBUr1.”sa” l ̄=stmt.execute Que州sq1) ) cateh(SQLException ex) l system.err.prinfln(”aq.exeeuteQuery:”-vex.getMe ssage0): } return rs } public void executeUpdate(String sq1) { Stmt=nul1: rs--rlul1: try 此系统在我院的CAD教学及初、中级培训中多次试用,效 果良好。由此可见,随着信息技术的发展,传统的课堂教育已不 能满足学生们的要求.我们可以利用J2EE和JSP技术能实现灵 活的动态页面和强大的交互功能。 参考文献: 1.蔡翠平Java程序设计.北京:北方交通大学出版社.2003 2.扬 ̄rJsp入门与提高.北京:清华大学出版社.2002. 3.薛为民.Java应用教程.北京:清华大学出版社.2005. 4.孙Java程序设计培训教程.清华大学出版社.2002 { eonn=DriverManager.getConneetion(strDBUr1.”sa”.””1: stmt.executeQuery(sqI): stmt.Close0: eonn.Close } catch(SQLExeept ion ex) System.err.print In(”aq.executeQuery:’’+ex.gerM eBsageo): (上接第163页) 6.数据挖掘在电子商务中的前景 已经开始起步,并以惊人的速度在发展。这一新兴领域不但有很 电子商务正在企业和商贸领域占据着越来越多的市场份 好的研究和应用前景,而且有很好的商业机会,相信在不久的将 额,Web挖掘主要用于商品的市场定位和消费分析。商家不但可 来。就会取得不错的成果。 以用来辅助制定市场策略.还可以用来分析购物模式和预测销 售行情。现在世界上的主要数据库厂商纷纷开始把数据挖掘功 参考文献: 能集成到自己的产品中。IBM、Microsof【等大公司都在自己的产 1.jiawei Hart.Michdine Kamber.数据挖掘:概念与技术.高等教育出版 品或相应产品上增加了在线分析处理 P)。IBM公司开发的 社.2001 w.H.Inmon.数据仓库.机械工业出版社2003 QUEST和Intelligent Miner系统可以挖掘客户的购物行为模式。 2.杨坚争电子商务基础与应用(第四版)西安电子科技大学出版社2006 Microsoft公司El前发布了一个基于XML的数据访问协议.该协 3.4.Margarent H.Dunham数据挖掘教程一一世界著名计算机教材精选 议能帮助开发商为各类客户和开发平台提供数据分析 我国在 2OO5 这一领域正处在研究开发阶段,应用和产品还相对滞后,但现在