当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于语法结构的源代码搜索的研究

发布时间:2017-08-25 09:10

  本文关键词:基于语法结构的源代码搜索的研究


  更多相关文章: 源代码搜索 Lucene 抽象语法树 语法分析 代码爬虫 Heritrix


【摘要】:现有的源代码搜索引擎大都是基于文本的搜索,没有利用代码在语法上的特性,因此在搜索准确性方面受到极大的限制。本文从语法结构角度,提出一种源代码的过滤方法,构造基于语法结构的代码过滤器,从而抽取对搜索有用的信息。通过该方法实现了一个基于语法结构的源代码搜索引擎。实验表明本文所建立的源代码搜索在搜索准确度、搜索结果展示的友好性方面都有改进。
【作者单位】: 湖南科技学院;
【关键词】源代码搜索 Lucene 抽象语法树 语法分析 代码爬虫 Heritrix
【基金】:湖南科技学院科学研究项目,项目编号:12XKYTB004
【分类号】:TP311.5
【正文快照】: 1.背景和意义在软件行业中,开源运动蓬勃发展,网络上出现了越来越多的开源代码。全球最大的开源软件开发平台和仓库SourceForge.net已经收集了448,706个开源项目。在搜索领域,大量的开源代码为源代码的搜索提供了原始的数据集。源代码搜索引擎自通用的搜索技术发展而来,它是

【参考文献】

中国期刊全文数据库 前1条

1 刘石;李合;王啸吟;张路;谢冰;;基于语法与语义分析的代码搜索结果优化[J];计算机科学;2009年08期

中国硕士学位论文全文数据库 前1条

1 罗玫;基于LUCENE2.0的源代码搜索引擎架构的实现[D];西北工业大学;2007年

【共引文献】

中国重要会议论文全文数据库 前1条

1 李怡康;赵婷;孙歆;颜立;;基于贝叶斯网络的静态源代码安全缺陷评价方法[A];2012年电力通信管理暨智能电网通信技术论坛论文集[C];2013年

中国硕士学位论文全文数据库 前3条

1 赵旭;搜索引擎关键技术研究及性能优化[D];江南大学;2008年

2 张金磊;Web2.0环境下内容提取与信息发布系统研究与实现[D];新疆大学;2010年

3 刘大伸;垂直搜索引擎技术的研究及实现[D];东北大学;2008年

【二级参考文献】

中国期刊全文数据库 前6条

1 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期

2 丁承,邵志清;基于字表的中文搜索引擎分词系统的设计与实现[J];计算机工程;2001年02期

3 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期

4 陈庆伟,刘军;基于Lucene的网站全文搜索的设计与实现[J];科技情报开发与经济;2005年15期

5 张校乾,金玉玲,侯丽波;一种基于Lucene检索引擎的全文数据库的研究与实现[J];现代图书情报技术;2005年02期

6 黄昌宁;中文信息处理中的分词问题[J];语言文字应用;1997年01期

【相似文献】

中国期刊全文数据库 前10条

1 王学辉;金丹;;Lucene与关系型数据库对比[J];电脑知识与技术(学术交流);2007年03期

2 李武装;;基于语义的企业搜索引擎的研究与实现[J];电脑知识与技术(学术交流);2007年08期

3 朱海丰;秦杰;;基于Lucene与JSF的搜索引擎[J];福建电脑;2008年10期

4 申剑;鲍春燕;;基于Lucene的搜索策略研究[J];现代计算机(专业版);2008年12期

5 李永春;丁华福;;Lucene的全文检索的研究与应用[J];计算机技术与发展;2010年02期

6 任惠静;;基于Lucene的面向主题搜索引擎的索引技术的研究[J];电脑知识与技术;2010年04期

7 侯云;;构建基于Lucene的网站站内搜索[J];信息与电脑(理论版);2010年02期

8 刘建湘;杨文涛;;基于Lucene的搜索引擎在Struts中的应用[J];软件导刊;2007年03期

9 温艳鸿;;基于lucene的文件搜索引擎的设计与扩展[J];福建电脑;2007年08期

10 叶分波;韩坚华;;基于Lucene的Web站点全文检索研究与实现[J];现代计算机(专业版);2009年01期

中国重要会议论文全文数据库 前10条

1 李明宙;罗艳;王宗义;;Lucene全文检索引擎的研究及应用[A];广西计算机学会2010年学术年会论文集[C];2010年

2 申兵一;巩青歌;;基于Lucene桌面搜索引擎系统的设计和实现[A];江苏省电子学会2010年学术年会论文集[C];2010年

3 李应兴;付婷;李勇;;基于LUCENE的藏文信息检索的研究与应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

4 戴莉;周明全;武仲科;王永恒;王燕妮;周曼;;Lucene在智能答疑系统中的应用研究[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年

5 刘寿强;;基于Lucene的分级鉴权企业搜索引擎研究与设计[A];第二十一次全国计算机安全学术交流会论文集[C];2006年

6 董文莉;孟洛明;;XML网管接口一致性测试中XML解析器的开发[A];第六届全国计算机应用联合学术会议论文集[C];2002年

7 张威;李辉;毕学军;宫云战;;内存泄漏故障静态测试方法研究[A];第四届中国测试学术会议论文集[C];2006年

8 王富强;马德涛;张立朝;王建明;;地方志数据库全文信息检索研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年

9 苏毅;王文力;阎姗;邓峰;;基于Ajax技术信息动态查询的设计与实现[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

10 刘源;詹舒波;;基于Solr的行业垂直搜索平台的研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

中国重要报纸全文数据库 前3条

1 中国联通大连分公司通信工程师 高红;Oracle数据库参数优化[N];计算机世界;2006年

2 ;IBM优化技术提升DB2性能[N];网络世界;2001年

3 ;1988年世界上第一个英汉机器翻译产品商品化[N];中国计算机报;2009年

中国博士学位论文全文数据库 前6条

1 王胜军;ATLAS语言编译系统[D];吉林大学;2006年

2 张立勇;软件源代码安全分析研究[D];西安电子科技大学;2011年

3 徐建国;网络化制造系统中虚拟加工若干关键技术研究[D];南京理工大学;2007年

4 李虎;基于本体和规则的受控自然语言系统模型研究[D];华中科技大学;2010年

5 李素建;汉语组块计算的若干研究[D];中国科学院研究生院(计算技术研究所);2002年

6 刘西洋;演化测试中面向分支到达的适应度函数设计研究[D];西安电子科技大学;2007年

中国硕士学位论文全文数据库 前10条

1 王冬坡;基于Lucene的主题搜索引擎的研究与实现[D];河北科技大学;2010年

2 张彬;基于lucene的搜索引擎[D];上海师范大学;2010年

3 高欣;基于Lucene的全文检索系统的研究与实现[D];天津师范大学;2010年

4 闻峥;基于Lucene的搜索引擎优化[D];北京交通大学;2011年

5 杜先撰;基于Lucene全文索引系统设计与实现[D];南京大学;2011年

6 周月红;基于Lucene的站内搜索引擎的设计与开发[D];华东理工大学;2011年

7 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年

8 陈航哲;基于Lucene的垂直搜索引擎的研究与应用[D];暨南大学;2010年

9 岳莉;基于Lucene的全文检索系统的研究与应用[D];西安电子科技大学;2010年

10 苏景春;基于Lucene的全文检索系统的研究与应用[D];北京交通大学;2010年



本文编号:736242

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/736242.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户46b42***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com