当前位置:主页 > 科技论文 > 安全工程论文 >

基于互联网新闻的灾情信息采集系统构建

发布时间:2024-03-24 17:45
  近年来,全球范围内自然灾害频发,造成了严重人员伤亡和财产损失。灾情信息作为灾害发生时应急决策重要依据,及时、准确、全面的收集灾情信息,能够让救援力量快速的到达受灾位置,开展救灾行动。国务院办公厅颁布的《国家综合防灾减灾规划(2016—2020年)》中提到要加强基础理论研究和关键技术研发,推进“互联网+”、大数据、物联网、云计算、地理信息、移动通信等新理念新技术新方法的应用,提高灾害发生时的信息获取能力。本文借助机器学习、文本分类、文本信息挖掘、互联网爬虫等技术方法开展基于互联网新闻的灾情信息收集研究,以期能拓展灾时的信息来源,提升灾情信息收集的能力,为应急管理工作提供信息支持,并以湖南省为案例地区,开发系统原型。本文的工作主要包括以下几方面:新闻分类器构建。利用机器学习和文本分类的方法,通过采集的新闻语料构建新闻分类器,对比了不同文本分类方法、不同文本表示方法、均衡数据集与非均衡数据集以及集成模型与单个模型间的性能差异,最终的结果显示以词向量模型作为文本表示方法,基于均衡数据下所训练的四种新闻分类器所构成的集成分类器的性能最为优异,F1值为0.926,并将此分类器作为系统最终使用的新闻...

【文章页数】:68 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状
        1.2.1 灾情信息采集系统建设现状
        1.2.2 互联网灾与情信息收集
    1.3 研究目标
    1.4 研究内容与论文结构
    1.5 技术路线
第2章 关键技术与方法
    2.1 文本分类
        2.1.1 概念
        2.1.2 文本表示方法
        2.1.3 分类方法
    2.2 文本信息提取
        2.2.1 概念
        2.2.2 提取方法
    2.3 互联网信息采集技术
        2.3.1 概念
        2.3.2 工作原理
第3章 新闻分类器构建
    3.1 新闻分类器构建流程
    3.2 性能评价指标
    3.3 实验准备
        3.3.1 新闻数据的来源
        3.3.2 新闻数据标注
        3.3.3 词向量模型训练
    3.4 实验结果
        3.4.1 非均衡数据集下实验结果
        3.4.2 均衡数据集下实验结果
        3.4.3 分类器集成与验证
    3.5 小结
第4章 灾情信息提取研究
    4.1 文本预处理
    4.2 时间信息提取
        4.2.1 提取规则
        4.2.2 时间提取流程
    4.3 地理位置信息提取
        4.3.1 地点信息识别与提取
        4.3.2 地名与空间位置匹配
    4.4 灾损信息提取
        4.4.1 常用词与结构特征归纳
        4.4.2 灾损信息提取流程
    4.5 小结
第5章 系统原型设计与实现
    5.1 系统功能与架构设计
        5.1.1 系统功能设计
        5.1.2 系统架构设计
    5.2 系统实现与功能介绍
        5.2.1 灾情新闻收集
        5.2.2 灾情信息提取
        5.2.3 系统管理
        5.2.4 信息展示
    5.3 实际运行情况
    5.4 小结
第6章 结论与展望
    6.1 结论
    6.2 展望
参考文献
致谢



本文编号:3937804

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/anquangongcheng/3937804.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户45f37***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]