当前位置:主页 > 文艺论文 > 环境艺术论文 >

大数据环境下慢病管理信息系统的研究与设计

发布时间:2017-08-03 18:32

  本文关键词:大数据环境下慢病管理信息系统的研究与设计


  更多相关文章: 分布式计算 医疗大数据 大数据技术 实时数据计算 批量增量数据计算


【摘要】:伴随着医疗信息技术的发展以及医疗数据的快速增长,传统的医疗信息系统已经无法适应新的行业需求,尤其是随着数据的爆炸式增长,对于海量数据的价值挖掘,是传统的技术不能够实现的。将大数据技术以及其先进的计算理念应用到医疗行业,不仅能够辅助医生做有效的决策,而且还能够实现各大医疗机构的数据进行无缝结合、海量数据弹性存储、有效的管理以及高效率的分析利用,从而提高应用可拓展性。本课题设计了大数据环境下慢病管理信息系统,充分的将大数据处理技术应用到医疗行业,设计了面向行业的专业化健康大数据架构。从而解决了传统医疗信息不能够有效存储、不能适用于大规模的医疗应用、不能够互相共享医疗数据、不能够协助医生做有效决策等问题。在本课题中,首先详细研究了大数据相关技术、提出了以Spark为分布式计算框架、HDFS为存储系统、HBase、Hive为在线、离线数据库以及数据仓库、Echarts为页面展示技术,构建可用于计算海量数据的高效慢病管理信息系统。搭建了面向专业的医疗健康大数据平台,使用Hibench进行基准测试,使得平台具有高可用性以及高容错性能。其次,将数据从Oracle中使用Sqoop导入到Spark平台,采用批量增量计算降低计算时间并且保证离线数据计算结果的正确性。接着,使用Kafka、Spark Streaming进行实时数据计算。
【关键词】:分布式计算 医疗大数据 大数据技术 实时数据计算 批量增量数据计算
【学位授予单位】:南昌大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.52
【目录】:
  • 摘要3-4
  • ABSTRACT4-8
  • 第1章 绪论8-16
  • 1.1 研究背景及意义8-10
  • 1.2 国内外研究现状10-13
  • 1.3 研究内容与创新点13-16
  • 1.3.1 研究内容13-15
  • 1.3.2 创新点15-16
  • 第2章 关键技术介绍16-25
  • 2.1 慢病管理信息系统概述16
  • 2.2 大数据及其关键技术16-24
  • 2.2.1 大数据概述16-17
  • 2.2.2 关键技术介绍17-24
  • 2.3 本章小结24-25
  • 第3章 系统架构设计25-32
  • 3.1 系统架构设计思路25-26
  • 3.2 概念模型设计26-27
  • 3.3 逻辑模型设计27-29
  • 3.4 物理模型设计29-31
  • 3.5 本章小结31-32
  • 第4章 大数据平台构建32-49
  • 4.1 集群搭建32-39
  • 4.1.1 安装环境32-33
  • 4.1.2 功能规划33-34
  • 4.1.3 集群拓扑结构34-35
  • 4.1.4 集群环境搭建35-39
  • 4.2 集群HA39-43
  • 4.2.1 HDFS HA39-41
  • 4.2.2 Spark HA41-43
  • 4.3 基准测试43-48
  • 4.3.1 测试目的43
  • 4.3.2 测试原理与方案43-45
  • 4.3.3 测试过程45-48
  • 4.3.4 测试结论48
  • 4.4 本章小结48-49
  • 第5章 系统实现49-73
  • 5.1 批量数据抽取49-53
  • 5.2 批量增量计算53-63
  • 5.2.1 增量计算介绍53-54
  • 5.2.2 批量增量计算算法介绍54-58
  • 5.2.3 批量增量计算场景58-62
  • 5.2.4 批量增量计算性能评估62-63
  • 5.3 实时数据流处理63-71
  • 5.3.1 数据流介绍63-64
  • 5.3.2 实时数据流处理介绍64
  • 5.3.3 HBase数据库设计64-69
  • 5.3.4 实时数据流处理69-71
  • 5.4 Oozie自动调度71-72
  • 5.5 本章小结72-73
  • 第6章 总结与展望73-75
  • 6.1 全文总结73-74
  • 6.2 工作展望74-75
  • 致谢75-76
  • 参考文献76-80
  • 攻读学位期间的研究成果80

【参考文献】

中国期刊全文数据库 前10条

1 王岩;王纯;;一种基于Kafka的可靠的Consumer的设计方案[J];软件;2016年01期

2 ;深入理解Spark Streaming执行模型[J];电脑编程技巧与维护;2015年20期

3 薛瑞;朱晓民;;基于Spark Streaming的实时日志处理平台设计与实现[J];电信工程技术与标准化;2015年09期

4 王毅;;大数据时代高职院校网络信息化教学模式探究[J];电子世界;2015年16期

5 ;国务院办公厅印发《关于运用大数据加强对市场主体服务和监管的若干意见》[J];电子政务;2015年07期

6 罗旭;刘友江;;医疗大数据研究现状及其临床应用[J];医学信息学杂志;2015年05期

7 ;阿里大健康——开始抢占医院的地盘![J];领导决策信息;2015年18期

8 张贝贝;;华为牵手东华 诠释“全联接”医疗[J];软件和信息服务;2015年05期

9 李彦广;;基于Spark+MLlib分布式学习算法的研究[J];商洛学院学报;2015年02期

10 李海阳;;“2015华为中国合作伙伴大会”医疗行业看点[J];中国数字医学;2015年04期



本文编号:615766

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/huanjingshejilunwen/615766.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f7489***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com