密级:公开
Web Site 个性化聚类算法的研究 与实现
Study and Implementation of Clustering Algorithms for Web Site Personalization
(申请清华大学工学硕士学位论文)
院 ( 系,所 ) :计算机科学与技术系 专 研 指 究 业:计算机系统结构 生:王启新
导 教 师:王克宏
2001 年 5 月
摘 要
Web 站点个性化已经成为当前研究的一个热点,人们通过各种方法,对网站 内容,结构,用户行为等进行数据挖掘,建立用户兴趣模型,为网站用户提供 更好的服务,加强网站的竞争力.当前网站个性化的主流方法可以分为很多类, 但是从自动化程度,技术可行性以及最终效果等多方面综合考虑,基于用户行 为分析的类型是最具有竞争力的一类方法.PageGather 算法[8]就是这个类型中 最为典型和著名的算法之一. 但是[8]中所介绍的 PageGather 算法是静态的,投入到电信级网站时还会遇 到很多问题,主要是存在输入数据量过大,时间复杂度高与需要海量训练集之 间的矛盾. 本文作者的主要工作如下: (1)通过引入渐进学习和分布式计算的机制,设 计了 PG+和 PG++两种优化的 PageGather 算法,明显降低了输入数据量和算法复 杂度,使得 PageGather 算法在电信级网站的运行成为可能. (2)提出了"最小 相关浏览过程数约束" 作为对[8]中 PageGather 算法描述的补充, , 使之更加合理; (3)证明了 PG+和 PG++与静态 PageGather 算法的等效性,保证了原静态算法的 海量训练集不会被破坏. (4)发现了(新闻)网页的访问时间局部性原理并对 其进行了数学描述,为今后对(新闻)网站个性化,网站服务器(机群)体系 结构优化等多方面研究课题的进一步深入提供了有力的依据. 本文组织如下:第一章对当前网站个性化的各种方法进行了综述,介绍了 PageGather 和 SCML[18]算法的思想. 第二章介绍了作者对 PageGather 算法的实 现和实验结果.第三章主要介绍作者创新性的工作——介绍并分析了作者提出 的 PG+和 PG++两种改进算法,介绍了等效性定理和(新闻)网页的访问时间局 部性原理等.第四章讨论 PageGather 算法与个性化推荐系统的结合方法.第五 章指出下一步工作的方向.第六章进行总结. 关键词:Web,个性化,机器学习,渐进式,分布式
I
- 算法静态评估 > web site 个性化聚类算法的研究与实现pdf
-
web site 个性化聚类算法的研究与实现pdf
下载该文档 文档格式:PDF 更新时间:2005-12-03 下载次数:0 点击次数:15文档基本属性 文档语言: Simplified Chinese 文档格式: pdf 文档作者: 微软用户 关键词: 主题: 备注: 点击这里显示更多文档属性 经理: 单位: 微软中国 分类: 创建时间: 上次保存者: 修订次数: 编辑时间: 文档创建者: 修订: 加密标识: 幻灯片: 段落数: 字节数: 备注: 演示格式: 上次保存时间:
- 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
- PDF格式下载
- 更多文档...
-
上一篇:引入意图的中国象棋计算机博弈系统探讨
下一篇:实时操作系统μC/OS-II的改进与应用研究
点击查看更多关于算法静态评估的相关文档
- 您可能感兴趣的
- 固定资产评估算法 aes算法评估 养老保险2011年算法 算法导论 钢筋工下料算法 生男生女预测算法秘诀 遗传算法 二进制算法 数据结构与算法
- 大家在找
-
- · 芜湖红旗机床厂
- · 2012外星人真来地球
- · www.24ddd.cpiom
- · 机床电气控制与plc
- · 计算机基础知识
- · 甘肃电大在线
- · 幼儿保健常识
- · 公司法司法解释
- · 小学二年级语文教案
- · 汉字书法电脑输入法
- · 北京朝阳区物流公司
- · 北京手递手厨师招聘
- · 妇产科护理学
- · cad官方免费下载2008
- · 杨幂曝被潜规则经历
- · 电路分析课件下载
- · 财务风险的案例分析
- · 兽医免疫学
- · 葫芦丝歌谱简谱网
- · 湖北高等教育自学考试
- · 英语通课件下载网址
- · 全国导游基础知识总结
- · 热处理工操作教材
- · 篮球教学视频
- · 文明主题班会主持稿
- · 单机游戏汉化版网站
- · 东北电力大学教务处
- · 中医妇科学第2版
- · i酷2.1下载
- · 淮南矿业集团孔令昌
- 赞助商链接