当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的农业文本分类方法研究

发布时间:2023-02-19 15:38
  随着网络技术、数据库技术、计算机技术的迅速发展和Internet的日渐普及,特别是大数据时代的到来,在我们的实际生活中,每一个领域都在以史无前例的速度生产着海量的信息和数据,尤其的海量的杂乱无规则的文本信息,农业领域也不例外,我国在农业信息化发展进程中建设了大量的涉农网站、数据库、信息系统、专家系统等,积累了丰富的农业新闻、技术、市场等信息。随着移动互联网、智能手机等新技术在偏远农村的迅猛普及,制约农业信息化发展的“最后一公里”问题已经得到有效地解决,农业信息化服务的模式也将必然从传统的网站式服务逐步转为以信息推送为主。而农业文本的分类及相关预处理是实现农业信息有效推送的关键,因此,如何实现农业文本的自动分类,迅速挖掘有效信息,为人们所深度利用成为一个迫在眉睫的问题。为了有效地组织和管理杂乱无序的海量农业信息,针对目前农业文本分类系统不完善、农业语料库稀缺的问题,本文的主要研究内容及研究成果如下:(1)详细的阐述了农业文本语料库的构建以及预处理的过程,设计了基于机器学习的农业文本分类流程,并按照流程对爬虫程序获取的农业网页进行清洗,获取农业文本,采用Java语言实现了中文文本分词和预处...

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 课题的研究背景及意义
    1.2 国内外研究现状
    1.3 本文的研究内容
    1.4 本文的组织结构
第二章 农业文本语料库的构建及预处理
    2.1 农业文本语料库的构建
    2.2 农业文本语料库的预处理
        2.2.1 基于机器学习的农业文本分类流程
        2.2.2 基于CHI值的特征词提取
        2.2.3 文本分词
        2.2.4 特征词条的选取
        2.2.5 分类性能的评估标准
    2.3 农业文本分类实验方法
    2.4 本章小结
第三章 基于机器学习的农业文本分类方法分析
    3.1 常用文本分类的机器学习方法
    3.2 基于朴素贝叶斯的农业文本分类分析
        3.2.1 贝叶斯原理
        3.2.2 极大后验假设与极大似然假设
        3.2.3 事件的独立性
        3.2.4 朴素贝叶斯原理
        3.2.5 基于朴素贝叶斯的农业文本分类方法实现
        3.2.6 基于朴素贝叶斯的分类器分类性能分析
    3.3 基于支持向量机的农业文本分类分析
        3.3.1 最优超平面的构建
        3.3.2 线性可分支持向量
        3.3.3 线性不可分支持向量
        3.3.4 核函数的选取
        3.3.5 基于支持向量机的分类器分类性能分析
    3.4 基于LSTM的农业文本分类分析
        3.4.1 递归神经网络
        3.4.2 LSTM原理
        3.4.3 基于LSTM的农业文本分类方法实现
        3.4.4 基于LSTM的分类器分类性能分析
    3.5 本章小结
第四章 基于机器学习的农业文本分类实验结果分析
    4.1 分类精度
    4.2 训练速度
    4.3 泛化效果
    4.4 本章小结
第五章 总结及展望
    5.1 总结
    5.2 展望
参考文献
致谢
攻读硕士期间发表论文



本文编号:3746488

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3746488.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户399a2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com