当前位置:主页 > 科技论文 > 搜索引擎论文 >

搜索引擎营销应用范围_主题搜索引擎的研究与应用

发布时间:2016-11-10 19:14

  本文关键词:主题搜索引擎的研究与应用,由笔耕文化传播整理发布。


了字典占用内存4.28M,分词速度每秒11k字节;本论文中提到的中文分词子系统实验平台和中文分词软;8.学位论文任海一基于上下文分析的中文分词算法研;随着Internet的迅速发展,网上信息不断丰富;本文专注于中文分词的优化性的研究,通过研究比对机;本文的结构如下:第一章首先讲述搜索引擎的现状,由;9.期刊论文李艳欣.LIYan-xin搜索引擎中;针对目前最

了字典占用内存4.28M,分词速度每秒11k字节的实验数据。实验表明,这个分词软件包可以满足当前校园网搜索引擎课题的使用。

本论文中提到的中文分词子系统实验平台和中文分词软件包是在 JDK 1.4和Oracle9i上实现的。

8.学位论文 任海一 基于上下文分析的中文分词算法研究 2006

随着Internet的迅速发展,网上信息不断丰富和发展起来。越来越多的人习惯在网上发布和获取信息。但是这些信息却是以各种形式庞杂无序地散布在无数的服务器上,更新变化快,用户要得到真正有价值的东西有很大的困难。因此,网络搜索引擎应运而生。然而,对于中文来讲,汉语以字为基本的书写单位。作为能够独立活动的有意义的最小语言成分的却是词。这与拉丁语系的语言以空格作为词界不同。在汉语中词与词之间没有明显的区分标记。因此在搜索引擎的整理加工阶段,重点需要解决的问题就在于如何准确的进行词的切分。

本文专注于中文分词的优化性的研究,通过研究比对机械匹配算法和词频统计算法的各自的优缺点,提出应用马科夫链来表示中文分词的切分过程,并基于概率论提出语义切分理论,同时总结出语义信息函数,针对目前分词不准确,易于产生歧义等主要问题,对分词系统进行了优化处理,并最终提出了基于上下文分析的中文分词的算法。通过实验证明了基于上下文分析的中文分词算法的准确率提高,是目前较好的中文算法之一。

本文的结构如下:第一章首先讲述搜索引擎的现状,由此进行对比中外搜索引擎的不同,同时引出中文搜索引擎的分词问题;第二章介绍中文分词的相关概念以及技术难点和基本状况;第三章主要阐述中文分词目前的研究成果和对主流的中文分词系统的分析;第四章主要讲解本文提出的基于上下文分析的中文分词算法的基本思想和实现目标。算法实现的过程,,包括设计思想和实现的方法;第五章总结算法的不足之处,以及需要今后继续提高的部分。

9.期刊论文 李艳欣.LI Yan-xin 搜索引擎中中文分词的研究 -电脑知识与技术(学术交流)2007,2(8)

针对目前最常用的分词算法--最大匹配算法效率低,长度受限等缺点,在对中文编码体系和中文分词的算法进行研究的基础上,提出了一种新的词库数据结构.它支持首字Hash和标准二分查找,而且不限制词条的长度.然后介绍了基于该词库设计的一种快速的分词算法,并给出了算法的实现过程.

10.学位论文 陆宵宏 基于P2P的搜索引擎的关键技术研究 2009

Peer-to-peer(P2P)技术的一个优势便是开发出强大的搜索工具。随着互联网的快速发展,搜索引擎作为一个网络用户所需的信息检索工具,其作用性越来越受到人们的重视。就中文用户而言,提高搜索引擎的效率的关键因素是中文分词匹配效率与搜索引擎索引检索效率的提高。

本文首先对P2P技术进行了阐述,包括P2P的定义、P2P模式与C/S模式的比较、P2P的特点以及P2P技术在搜索方面的应用及优势;其次对P2P搜索算法进行了分类探讨,重点研究和分析了几种P2P搜索算法,并指出它们的优缺点。对以传统索引方和倒排索引方这两种索引方式为核心的基于P2P的搜索引擎和其他几种典型的搜索引擎也进行了各方面的比较。接着,为了克服传统的集中式搜索引擎的缺点,针对中文分词本文提出了基于树状词库进行中文分词,这种经过优化的分词方法使传统的匹配算法效率得到大大地提高,并结合XML技术为中文分词提出并实现了可行的解决方案:本文设计了基于XML与B+树的倒排索引算法建立索引器的索引解决了传统的正、倒排索引模型实时更新性能差的缺点。将搜索引擎架设在P2P分布式网络结构之上,利用P2P的良好的分布式特性,使搜索引擎从集中式走向分布式,使搜索引擎能更深度、更广度地搜索互联网上的用户可用的信息。

基于树状词库与XML的中文分词方法使得搜索引擎对中文文段进行分词时更为准确。基于XML的倒排索引建立解决方案从新的角度探索了中英文混合检索的底层机制,使得搜索引擎在索引器中进行索引检索、寻找其相关的文档更为快捷。

当前,这方向的研究还处于试验、探索阶段,某些方面在理论上还需要有所突破,逐步使搜索引擎更好地服务于用户。

本文链接:

下载时间:2010年5月14日

 

 

下载地址:主题搜索引擎的研究与应用_图文37.Doc

  【】

最新搜索

主题搜索引擎的研究与应用_图文

梯形轨枕

数据与计算机通信 中文版 课后答案70

色字开头的成语接龙

90科普大篷车 观后感

中国大地新景观

58碳化硅多孔陶瓷制备工艺研究

建筑管理的认识

38工 会 组 建 程 序

浅析我国精神损害赔偿制度的发展与法律价值取向


  本文关键词:主题搜索引擎的研究与应用,由笔耕文化传播整理发布。



本文编号:170306

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/170306.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0c303***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com