当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于分类的term重要性识别方法

发布时间:2017-07-02 16:24

  本文关键词:基于分类的term重要性识别方法,由笔耕文化传播整理发布。


【摘要】:在传统的搜索引擎和信息检索中,用户Query中的term-weight通常是以一种上下文无关的方式得到的。现有的大多数信息检索技术都使用词袋方法,例如布尔模型、向量空间模型和概率模型等,这些方法均没有考虑Query中term之间的相关性。为了能够充分利用Query中的信息来提高term-weight的准确度,提出了一种有监督的机器学习方法来学习用户Query中的term-weight。该方法基于分类的方法,并引入了句法分析作为分类的一项重要的特征来训练模型。考虑用户Query中term之间的关系后,既避免了由Query到单个term的信息丢失,又增加了短文本的特征,同时使分类器实现软输出,能够给term的重要程度一个更为准确的量化值。
【作者单位】: 辽宁工程技术大学软件学院;辽宁工程技术大学系统工程研究所;
【关键词】分类 依存句法分析 查询词权重 查询分析 term重要性 搜索引擎 信息检索
【基金】:国家自然科学基金(70971059) 辽宁省创新团队项目(2009T045)资助
【分类号】:TP391.3
【正文快照】: 2012年第30次中国互联网发展状况统计报告[1]指出,截止至2012年6月底,中国网民数量达到5.38亿,其中搜索引擎用户规模达到4.29亿,较2011年底增长2121万人,在网民中的渗透率攀升为79.7%,依旧是仅次于即时通讯的第二大网络应用。搜索引擎作为互联网的基础应用,是网民在互联网中

【相似文献】

中国期刊全文数据库 前10条

1 董立岩;刘光远;苑森淼;李永丽;孙铭会;;混合式朴素贝叶斯分类模型[J];吉林大学学报(信息科学版);2007年01期

2 刘慧婷;倪志伟;李建洋;刘政怡;;基于交叉覆盖算法的时间序列模式匹配[J];计算机应用;2007年02期

3 张勇;;一种新的多类别多标签关联分类方法的研究[J];福建电脑;2007年08期

4 周屹;;基于Naive Bayes的文本分类器的设计与实现[J];黑龙江工程学院学报;2007年02期

5 陈建林;樊兴华;王国胤;;基于两步策略的英文文本分类[J];广西师范大学学报(自然科学版);2007年04期

6 王皓;孙宏斌;张伯明;;PG-HMI:一种基于互信息的特征选择方法[J];模式识别与人工智能;2007年01期

7 孙岳;毛国君;刘旭;;数据流中概念漂移检测的集成分类器设计[J];计算机应用研究;2008年01期

8 朱红斌;;基于Adaboost算法的交通事件检测[J];计算机时代;2008年01期

9 吴开兴;杜晶;韩范玉;;基于层次型Adaboost的动态车牌定位方法[J];商场现代化;2008年07期

10 尚春红;赵明昌;;复杂背景图像中军用靶子识别算法研究[J];计算机应用;2008年05期

中国重要会议论文全文数据库 前10条

1 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年

2 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年

3 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年

4 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

5 沈钱波;何加铭;;连笔手写识别搜索算法研究[A];浙江省电子学会2008年学术年会论文集[C];2008年

6 王先梅;林子钰;;基于HMM的脱机手写大写金额识别中的单分类器性能分析[A];2006中国控制与决策学术年会论文集[C];2006年

7 王颖;毋立芳;关媛;王涓涓;;基于LBP的SVM人脸姿势估计方法[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年

8 龚妙昆;万福永;许建强;袁震东;;心电图小波压缩特征提取及SVM分类分析[A];2005中国控制与决策学术年会论文集(下)[C];2005年

9 李玉良;王良松;李晶;;图像中数字字符识别技术概览[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年

10 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年

中国重要报纸全文数据库 前10条

1 ;“营销通”:集CRM与OA于一体[N];计算机世界;2003年

2 郑依华;部署搜索应用开发环境[N];计算机世界;2006年

3 ;电子政务数据交换平台解决方案[N];计算机世界;2006年

4 顾春;金创集团实现会计电算化[N];中国黄金报;2007年

5 张海军;输配网GIS一体化破解“信息孤岛”[N];中国电力报;2006年

6 雷阳;BEA借技术开拓SOA市场[N];电脑商报;2006年

7 本版编辑 中国科学院计算技术研究所数字媒体研究中心 山世光 陈熙霖 高文 徐昕 刘洪宇;你的脸,你的身份证明[N];中国计算机报;2006年

8 刘琳;地理信息系统发展趋势[N];中国测绘报;2008年

9 ;Ework助电子政务迈上新台阶[N];中国高新技术产业导报;2004年

10 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年

中国博士学位论文全文数据库 前10条

1 王U,

本文编号:510675


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/510675.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户aca43***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com