当前位置:主页 > 科技论文 > 搜索引擎论文 >

中文分词技术对中文搜索引擎的查准率及查全率的影响

发布时间:2016-06-09 08:00

  本文关键词:支持智能中文分词的互联网搜索引擎的构建,由笔耕文化传播整理发布。


值的信息,从而指导企业的发展。“数据挖掘”则是以众多原始数据为基础,利用科学的数学模型对其加以分析,从而获得结论。“数据挖掘”所需要的原始数据,要求覆盖面广,并具有一定时间的积累。例如在预测分析某项商品的市场销售时,原始数据只能反映销售状况,而“数据挖掘”却能给决策者很好的指导作用,可以帮助决策者看清未来市场的走向,对于新产品的开发及应用方向,同样能够起到很好的指导作用。当然,信息系统要能够支持“数据挖掘”,就必须努力提高技术和规模层次。总之,现今的数据资源已经不单纯是统计报表,它对企业的经营甚至发展战略的制定都起着至关重要的作用。

数据和信息系统是相辅相成、缺一不可的。数据是信息系统的加工对象,没有信息系统,数据将失去价值;数据是信息系统的灵魂,缺少了数据,信息系统也就变得毫无意义。因此,信息系统建设的价值通过数据资源表现出来。

3.3 信息化使得企业更好地融入国际环境

我国在正式加入WTO后,经济逐步融入到国际社会中去。要想更好地融入国际环境中,就必须不断深化企业改革,不能固守国内市场,大力开拓国际市场,同时保持国内行业市场的传统优势。从管理层来看,为了保持企业的良好发展潜力,保证企业持续和谐发展,就必须扩大企业目标的市场范围,改革经营方式,提高工作效率。

如今,经济全球化发展迅速,企业要想在国际竞争中立于不败之地,就必须提高企业的核心竞争力,重点是企业的软实力。信息化就成为提高软实力最有力的支持和最(上接第184页)

3.2 在搜索引擎当中,利用理解的分词方法,需要大量的语言知识和信息。然而,一直由于中文的语言知识一直是比较复杂的,每个词都有好几种意识,基于理解的分词方法难以将各种的语言组织成一定的词组,导致中文分词技术对搜索引擎的查准率有一定的局限作用。

3.3 基于字符串的中文分词方法在搜索引擎当中有着一定的优点,能够在一定的程度上促进检索的查全率。但是由于在对字符进行匹配时,由于中文语言的复杂性,会在一定程度上限制了用户所需要信息的准确性,这时对检索的查准率产生了一定的阻碍。

3.4 中文分词技术中,利用统计的分词方法,将词组在搜索引擎中出现的次数进行统计,然后可以出现新的词组,然后对分词进行切分,利用它们的语言特征进行统计,从而,能够提高搜索引擎中检索的查准率。

3.5 中文分词的各种技术都会对搜索引擎产生或大或小或优或劣的影响。这就需要科研人员以及相关的技术人员对中文分词进行一定的分析,将那些不好的影响运用相关的技术加以改善,让中文分词技术在搜索引擎中发挥出最大的良好的影响。虽然,依照我国目前的现状看来,中文分词技术没有很好的研究队伍,让这项技术服务于更多的产品还有很长的路走,但是,现代的分词技术对搜索引擎中的查准率还有查全率都有着一定的促进作用。

259│Computer CD Software and Applications

有效的手段。

4 结语

信息化建设举足轻重,我们必须将其摆在企业发展战略的高度上,利用信息化建设,推动企业的未来发展,为企业带来更多的经济效益。此外,信息化建设是一项长远投资项目,靠IT技术人员独立操作是无法实现的。不仅需要得到领导者充分的重视,而且需要企业所有员工上下一心,切勿急功近利,需要整体规划、分步实施,依靠全体员工的共同努力才能够最终成功实施。

总而言之,信息化不是企业产品,不能直接转化为企业效益,但在企业经营的过程中,信息化所发挥的作用举足轻重。就现代企业而言,无论是传统产业还是新兴的高技术产业,,无论是面对国内市场还是要做大做强走出去的国际型企业,信息化都将对企业的管理和结构产生重大的变革。只要我们进行正确的分析规范的管理,在信息化建设的道路上应该会收获成功。

参考文献:

[1]龚炳铮.加速发展企业信息化的思考[J].电子与信息化增刊,1999.

[2]赵颖,姜宏.中小企业管理信息系统建设模式分析[J].信息系统工程,2003(04):26-28.

[3]杨梅枝,蒲清泉.信息化是加快实现工业化和现代化的必然趋势[J].当代思潮,2003(1).

[作者简介]丁宁(1980-),女,工程师。

4 总结

在网络信息化高速发展的时代,给人们的生活方式、生产方式带来了极大的方便。尤其是中文分词技术在搜索引擎中的应用,不仅提高了人们的生活水平,也推动了信息化的发展。在搜索引擎当中,查准率与查全率只能存其一,不能够同时存在。在利用中文分析技术后,对搜索引擎的查全率与查准率有着一定的推动作用,这就需要研究人员要全面的发展中文分词技术,改善搜索引擎中出现的问题,保证查全率与查准率能够同时出现,全面发展。

参考文献:

[1]曹羽中,曹勇刚,金茂忠,刘超.支持智能中文分词的互联网搜索引擎的构建[J].计算机工程与设计,2006,27(23):36-39.

[2]何莘,王琬芜.自然语言检索中的中文分词技术研究进展及应用[J].情报科学,2008,26(05):03-05.

[3]郑京华.提高搜索引擎检索准确率的策略[J].科技情报开发与经济,2007,21(17):67-69.

[作者简介]冯佳捷(1990.8-),男,河北石家庄人,研究方向:计算机算法应用,工程实践;单位:华中师范大学软件工程2010级;王瑞(1991.1-),男,重庆人,研究方向:计算机网络安全,华中师范大学软件工程2010级。


  本文关键词:支持智能中文分词的互联网搜索引擎的构建,由笔耕文化传播整理发布。



本文编号:55105

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/55105.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d25f2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com