• 算法静态评估 > web site 个性化聚类算法的研究与实现pdf
  • web site 个性化聚类算法的研究与实现pdf

    免费下载 下载该文档 文档格式:PDF   更新时间:2005-12-03   下载次数:0   点击次数:15
    文档基本属性
    文档语言:Simplified Chinese
    文档格式:pdf
    文档作者:微软用户
    关键词:
    主题:
    备注:
    点击这里显示更多文档属性
    密级:公开
    Web Site 个性化聚类算法的研究 与实现
    Study and Implementation of Clustering Algorithms for Web Site Personalization
    (申请清华大学工学硕士学位论文)
    院 ( 系,所 ) :计算机科学与技术系 专 研 指 究 业:计算机系统结构 生:王启新
    导 教 师:王克宏
    2001 年 5 月
    摘 要
    Web 站点个性化已经成为当前研究的一个热点,人们通过各种方法,对网站 内容,结构,用户行为等进行数据挖掘,建立用户兴趣模型,为网站用户提供 更好的服务,加强网站的竞争力.当前网站个性化的主流方法可以分为很多类, 但是从自动化程度,技术可行性以及最终效果等多方面综合考虑,基于用户行 为分析的类型是最具有竞争力的一类方法.PageGather 算法[8]就是这个类型中 最为典型和著名的算法之一. 但是[8]中所介绍的 PageGather 算法是静态的,投入到电信级网站时还会遇 到很多问题,主要是存在输入数据量过大,时间复杂度高与需要海量训练集之 间的矛盾. 本文作者的主要工作如下: (1)通过引入渐进学习和分布式计算的机制,设 计了 PG+和 PG++两种优化的 PageGather 算法,明显降低了输入数据量和算法复 杂度,使得 PageGather 算法在电信级网站的运行成为可能. (2)提出了"最小 相关浏览过程数约束" 作为对[8]中 PageGather 算法描述的补充, , 使之更加合理; (3)证明了 PG+和 PG++与静态 PageGather 算法的等效性,保证了原静态算法的 海量训练集不会被破坏. (4)发现了(新闻)网页的访问时间局部性原理并对 其进行了数学描述,为今后对(新闻)网站个性化,网站服务器(机群)体系 结构优化等多方面研究课题的进一步深入提供了有力的依据. 本文组织如下:第一章对当前网站个性化的各种方法进行了综述,介绍了 PageGather 和 SCML[18]算法的思想. 第二章介绍了作者对 PageGather 算法的实 现和实验结果.第三章主要介绍作者创新性的工作——介绍并分析了作者提出 的 PG+和 PG++两种改进算法,介绍了等效性定理和(新闻)网页的访问时间局 部性原理等.第四章讨论 PageGather 算法与个性化推荐系统的结合方法.第五 章指出下一步工作的方向.第六章进行总结. 关键词:Web,个性化,机器学习,渐进式,分布式
    I

    下一页

  • 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
  • 免费下载 PDF格式下载
  • 您可能感兴趣的
  • 固定资产评估算法  aes算法评估  养老保险2011年算法  算法导论  钢筋工下料算法  生男生女预测算法秘诀  遗传算法  二进制算法  数据结构与算法