当前位置:主页 > 经济论文 > 微观经济论文 >

林产品供求垃圾信息的过滤研究

发布时间:2017-04-14 07:01

  本文关键词:林产品供求垃圾信息的过滤研究,由笔耕文化传播整理发布。


【摘要】:随着互联网的普及以及电子商务在林产品贸易中的快速发展,通过林产品贸易网站发布和获取林产品贸易信息已经成为广大林产品经营者的重要途径之一。在这些供求信息里,不免存在一些违背相关法律、破坏网络环境的不良信息,除此之外,用户还可能发布一些与林产品供求不相关的其他信息,如其他电子商务网站的广告信息。如何将这些与林产品不相关的信息过滤掉,为用户提供及时有效的林产品供求信息,是当前林产品贸易网站需要解决的一个重要问题。本文结合林产品贸易网站供求信息的特点,定义了林产品供求信息中垃圾信息的概念范围,并且界定出敏感词和林产品两类信息,以此构建了基于有限状态自动机的哈希森林字典,通过哈希结构中的标识字段来区分两类信息。采用改进的多模式匹配算法对林产品贸易网站中的供求信息进行匹配过滤。在本论文的研究环境下,通过对比现有AC算法和本文改进的算法,结果表明改进算法在运行时间上要优于AC算法,并且改进算法能够通过一次遍历将两类信息过滤出来。通过对比不同数量模式串下的运行效率得出,模式串数量对运行时间影响不明显。此外,在过滤机制上实现了从用户注册到用户发帖,再到帖子过滤的完整检测与过滤机制。
【关键词】:垃圾信息 过滤 自动机 哈希 多模式匹配
【学位授予单位】:北京林业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F724.6;F323.7
【目录】:
  • 摘要4-5
  • ABSTRACT5-8
  • 1 引言8-14
  • 1.1 研究背景与研究意义8-9
  • 1.1.1 研究背景8-9
  • 1.1.2 研究意义9
  • 1.2 研究现状9-12
  • 1.3 研究内容及技术路线12-14
  • 2 模式匹配相关理论与技术基础14-23
  • 2.1 模式匹配概论14
  • 2.2 单模式匹配算法14-18
  • 2.2.1 BF算法14-15
  • 2.2.2 KMP算法15-17
  • 2.2.3 BM算法17-18
  • 2.3 多模式匹配算法18-21
  • 2.3.1 WM算法19
  • 2.3.2 AC算法19-21
  • 2.4 确定性有限状态自动机21-22
  • 2.5 本章小结22-23
  • 3 基于有限状态自动机和哈希森林的匹配算法23-34
  • 3.1 林产品贸易供求垃圾信息定义与特点分析23-25
  • 3.2 林产品贸易供求关键词的获取与哈希森林结构的构建25-31
  • 3.2.1 林产品贸易供求关键词库25-27
  • 3.2.2 关键词存储与哈希字典27-28
  • 3.2.3 构建哈希森林结构28-31
  • 3.3 基于有限状态自动机和哈希的匹配算法31-33
  • 3.4 本章小结33-34
  • 4 林产品供求垃圾信息过滤机制34-41
  • 4.1 林产品贸易Web网站的搭建34
  • 4.2 垃圾信息过滤流程34-40
  • 4.2.1 用户控制34-35
  • 4.2.2 文本信息预处理35-38
  • 4.2.3 多模式匹配过滤38-39
  • 4.2.4 人工审核39-40
  • 4.3 本章小结40-41
  • 5 系统实现与实验结果分析41-49
  • 5.1 系统架构41
  • 5.2 系统环境41-42
  • 5.3 数据来源与数据处理42-43
  • 5.4 代码与界面设计43-44
  • 5.5 系统功能44-46
  • 5.6 实验结果及分析46-48
  • 5.7 本章小结48-49
  • 6 结论与展望49-50
  • 6.1 结论49
  • 6.2 展望49-50
  • 参考文献50-53
  • 个人简介53-54
  • 导师简介54-55
  • 获得成果目录55-56
  • 致谢56

【相似文献】

中国期刊全文数据库 前10条

1 郑淑荣;;斩断垃圾短信黑手——国外整治垃圾短信启示录[J];中国电信业;2006年07期

2 祀人;;全球重拳整治垃圾电邮、垃圾短信[J];生态经济;2008年10期

3 李志宇;;对付垃圾短信消费者动力不足[J];通信世界;2008年23期

4 江林芯;蒋艳青;;四川成立12321网络不良与垃圾信息举报受理中心[J];通信与信息技术;2010年01期

5 程德杰;;互联网时代垃圾信息的预防和遏制[J];互联网天地;2012年05期

6 禾刀;;根治垃圾短信需力推“红名单”经验[J];广西质量监督导报;2012年04期

7 雷泓霈;;打击谣言一样打击“垃圾短信”[J];上海企业;2013年11期

8 陈建新;;国外如何有效惩治垃圾短信[J];中国防伪报道;2014年03期

9 张功耀;“垃圾输入-垃圾输出”原理的推广[J];自然辩证法通讯;2004年06期

10 ;关于开展垃圾短信息整治专项行动工作方案的通知[J];信息安全与通信保密;2008年07期

中国重要报纸全文数据库 前10条

1 ;立法打击垃圾信息成为共识[N];网络世界;2005年

2 李韬;保卫手机[N];计算机世界;2006年

3 程蓉 记者 王春;上海:呼吁立法控制垃圾信息[N];科技日报;2006年

4 谷慧;垃圾短信重打不下[N];民营经济报;2006年

5 通讯员  周 莺;上海市人大代表呼吁制定反垃圾信息法[N];人民代表报;2006年

6 刘恒 通讯员  田源;重庆联通大力整治垃圾短信[N];人民邮电;2006年

7 周戎;巴基斯坦:垃圾信息不胜烦[N];光明日报;2008年

8 洪黎明;部开通网络不良与垃圾信息举报受理中心[N];人民邮电;2008年

9 中国互联网协会秘书长 黄澄清;治理垃圾信息 营造绿色网络[N];人民邮电;2008年

10 周净;垃圾短信人均每周12条[N];消费日报;2008年

中国博士学位论文全文数据库 前1条

1 黄文良;垃圾短信过滤关键技术研究[D];浙江大学;2008年

中国硕士学位论文全文数据库 前10条

1 吉超;论垃圾短信的法律规制[D];内蒙古大学;2012年

2 李春野;我国垃圾信息的法律规制[D];吉林大学;2010年

3 石晶;一种高效垃圾短信过滤系统的实现[D];电子科技大学;2010年

4 李文龙;论垃圾短信的法律规制[D];延边大学;2009年

5 贾晓舟;中国“垃圾短信”法律治理探究[D];吉林大学;2013年

6 张婷;一种基于数据挖掘技术的垃圾短信用户预识别方法[D];兰州大学;2013年

7 刘梦玲;广告型垃圾短信法律问题研究[D];中国政法大学;2009年

8 黄诚;智能手机垃圾短信过滤技术的研究[D];华中科技大学;2012年

9 付少波;我国手机垃圾短信法律问题研究[D];西南政法大学;2011年

10 李恺明;广东移动通信垃圾信息分析与治理方案设计[D];北京邮电大学;2011年


  本文关键词:林产品供求垃圾信息的过滤研究,,由笔耕文化传播整理发布。



本文编号:305425

资料下载
论文发表

本文链接:https://www.wllwen.com/weiguanjingjilunwen/305425.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户56134***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com