第二十六届中国数据库学术会议论文集:1-7,2009.10
高效的XML关键字查询改写和结果生成技术
黄静 陆嘉恒 孟小峰
(中国人民大学信息学院 北京 100872) (huangjingruc@ruc.edu.cn)
Efficient XML Keyword Query Refinement with Meaningful Results Generation
Huang Jing, Lu Jiaheng, and Meng Xiaofeng
(School of Information, Renmin University of China, Beijing 100872) Abstract Keyword search method provides users with a friendly way to query XML data, but a user's keyword query may often be an imperfect description of their intention. Even when the information need is well described, a search engine may not be able to return the results matching the query as stated. The task of refining the user's original query is first defined to achieve better result quality as the problem of keyword query refinement in XML keyword search, and guidelines are designed to decide whether query refinement is necessary. Four refinement operations are defined, namely term deletion, merging, split and substitution. Since there may be more then one query refinement candidates, proposes the definition of refinement cost, which is used as a measure of semantic distance between the original query and refined query, and also a dynamic programming solution to compute refinement cost. In order to achieve the goal of finding the best refined queries and generate their associated results within a one-time node list scan, a stack-based algorithm is proposed, followed by a generalized partition-based optimization, which improves the efficiency a lot. Finally, extensive experiments have been done to show efficiency and effectiveness of the query refinement approach. Keywords XML; Keyword Search; Query Refinement;Query Rewriting; Query Suggestion; SLCA 摘要 用户使用关键字查询时,可能不能准确的表达他们的意图,即使用户正确的表达了查询意图,查询引擎也可能不能准确地返
回查询结果.针对这一问题,重点研究了在 XML 关键字查询中如何进行有效的查询改写并生成有意义的结果.提出四种查询改写操 作和查询改写代价的概念,给出了动态规划的方法计算查询改写代价.为了找出最优的查询改写,给出了基于栈的查询改写和结果 生成算法,并提出了基于划分的优化算法.最后通过丰富的实验对提出的方法进行了验证. 关键词 XML; 关键字查询; 查询改写; 查询重写;查询推荐;SLCA 中图法分类号 TP391
0 引言
关键字查询为用户提供了友好便捷的查询方式, 如何使用关键字查询从XML数据中获取所需信息已 经成为学术界近期研究的一个热点问题[1-5].这些工作 主要研究如何过滤无关的查询结果来提高查准率.本 文关注的是另一个方面:当查询没有结果返回或是返 回太少结果时,如何通过改写原始查询,使得新的查询 获得好的查全率.这种情况是普遍存在于关键字查询 中的,由于用户可能不能准确表达查询意图,输入的查 询可能存在拼写错误或不相关的词,这样使得某些关 键字在文档中找不到匹配的结点,导致没有结果返回.
- 2011小升初成绩查询 > 高效的xml关键字查询改写和结果生成技术
-
高效的xml关键字查询改写和结果生成技术
下载该文档 文档格式:PDF 更新时间:2003-08-02 下载次数:0 点击次数:1文档基本属性 文档语言: English 文档格式: pdf 文档作者: Paula S Reyes 关键词: 主题: 备注: 点击这里显示更多文档属性 经理: 单位: Wayne State University 分类: 创建时间: 上次保存者: 修订次数: 编辑时间: 文档创建者: 修订: 加密标识: 幻灯片: 段落数: 字节数: 备注: 演示格式: 上次保存时间:
- 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
- PDF格式下载
- 更多文档...
-
上一篇:查询CXP83508供应商
下一篇:贵阳市普通话水平等级测试分组名单
点击查看更多关于2011小升初成绩查询的相关文档
- 您可能感兴趣的
- 2011小升初成绩查询网 2011年小升初成绩查询 2011年小升初成绩 2011小升初毕业成绩 2011小升初考试成绩 永善县2011小升初成绩 小升初试卷及答案2011 2011年小升初数学试题 2011小升初英语试卷
- 大家在找
-
- · 地球公转动画
- · 独宠魔妃全文下载
- · 乌鲁木齐焊机租赁
- · 电压力锅排行榜
- · 东风日产6万左右车
- · 中国福利彩票双色球
- · amd速龙5000怎么开4核
- · 第三套人民币错版五角
- · netfilter
- · 维尼夫妇kiss动图
- · 男士着装礼仪论文例文
- · 人教版初一语文说课稿
- · 灿烂的青铜文化课件
- · 变速齿轮热键失效
- · 新視野經濟寃4上答案
- · cad点怎么改成
- · 天津大沽化工厂
- · 一吨猪饲料的配方
- · 轴承内孔公差带
- · 常用统计分析方法spss应用
- · 第一代计算机的特点
- · 金属矿开采
- · 半条命2攻略
- · thelastkiss
- · 量子通信范永胜
- · 班主任情景答辩题
- · 阿里旺旺下载2011官方
- · 济南历下区解放东路
- · 潍坊百姓网买二手吊车
- · 串口232组网电路
- 赞助商链接