当前位置:主页 > 科技论文 > 搜索引擎论文 >

搜索日志中命名实体识别

发布时间:2023-04-12 01:23
  【目的】搜索日志中命名实体识别对于优化搜索意图,提高搜索引擎服务质量存在重要意义。【方法】利用种子命名实体和模板匹配原则抽取候选命名实体并聚类,聚类后进行候选命名实体识别特征抽取,包括频次、不同模板数、模板权重特征。融合这些特征构造命名实体识别权重计算公式,并合理调整特征影响参数。【结果】对根据权重提取的命名实体进行标注和统计,发现P@500值平均达到75%左右,比Pa@ca方法高出7%。【局限】对模板敏感性弱的命名实体不能精确抽取。【结论】通过计算该方法抽取结果指标P@N值,并和其他方法抽取结果指标进行比较,证明该方法的有效性。

【文章页数】:8 页

【文章目录】:
1引言
2相关工作
3命名实体抽取框架
3.1类别框架
3.2抽取过程
(1) 种子命名实体搜集
(2) 命名实体模板抽取和模板过滤
(3) 特征和命名实体抽取
4候选命名实体识别和特征抽取
4.1特征提取
(1) 命名实体识别模板权重计算
(2) 候选命名实体聚类及特征提取
4.2权重计算
(1) 命名实体权重计算与抽取
5实验结果评价与分析
5.1P@N结果统计和对比
5结语



本文编号:3790140

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3790140.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2aa4b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com