当前位置:主页 > 管理论文 > 证券论文 >

基于数据挖掘组合模型的股价预测研究

发布时间:2017-04-10 19:03

  本文关键词:基于数据挖掘组合模型的股价预测研究,由笔耕文化传播整理发布。


【摘要】:改革开放以来,随着我国经济的快速发展,股票市场也应运而生。我国股市自成立以来,历经了风风雨雨之后,获得了快速的成长,逐步发展壮大。一方面在推动实体经济发展,完善市场经济机制,合理分配社会资源,促进生产要素重新组合与合理流动等方面发挥着越来越积极的作用;另一方面随着人民生活水平的日益提高,人们剩余的闲置的资金也越来越多,股票也成为了人们投资、财富保值增值的重要手段。股票市场由于其高风险高回报的特性,长期以来,不断吸引人们投入到其中,逐渐成为许多人投资的重要手段之一。越来越多的人将手头的闲置资金投入到股市,以期获得较为可观的回报。但是,股票市场是一个极其复杂的、不断变化的经济系统,它受到宏观经济运行、政策变化、行业发展周期、投资者群体等多种因素的综合影响,使得人们很难准确地找到股票价格走势的规律和逻辑。由于专业知识的缺乏、信息的不对称性等等原因,人们对于股市的投资往往带有盲目性、投机性,很难获得较好的收益。因此,对于股票市场,寻求一套有效的方法,降低人们投资的风险,同时提高人们投资的收益就显得尤为重要。 目前常用的股票投资的分析方法主要有如下两种:基本面分析法和技术分析法,其中基本面分析主要着眼于投资标的股票的选择上,而技术分析则主要在具体投资买卖操作的时间和空间判断上起作用,试图用以提高投资分的析可靠性和准确性。对于中小投资者来说,在做基本面分析时常常会受到资料不足、分析工具不全面、个人知识面不够和分析能力欠缺的制约。技术分析以传统的证券分析理论为基础,以股票市场交易价格走势作为主要研究对象,以预测股票价格走势趋势为主要目的,往往从股票过去交易的图表和数据入手,试图找到股票市场波动规律并用以指导投资操作。比较著名和常用的有波浪理论、江恩理论、道氏理论等。 在股票市场中,时刻都会产生大量的交易数据,上市公司也会定期发布大量的财务数据,如何有效地利用这些数据,减少投资者的投资风险,从而给投资者带来较高的回报便成为了一个非常值得分析和研究的问题。上市公司定期发布的财务报告数据具有很重要的信息含量,这些信息含量包括各种财务比率指标。综合这些财务指标,能够一定程度上反映公司整体的经营运行状况和赚取利润的能力,有利于投资者判断公司的内在价值,从而有助于投资者更好地判断上市公司股票价格的未来变化。对于中长期的投资者来说,如何利用这些信息来判断股票的未来投资价值,显得尤为重要。 而本文试图通过数据挖掘技术,来研究上市公司财务比率指标的动态变化和股票价格变化趋势的内在联系,期望挖掘出财务数据中有用的信息,从而对股票的投资决策做出更好的判断。传统的统计模型对于数据有较高的要求,对于数据的假定较多,要求过于严格,实际中的数据往往很难达到这种要求,而数据挖掘技术对于数据的要求相对较低,能够相对较好地处理非正态、非平稳、高噪声的数据。数据挖掘通过结合统计学、机器学习和人工智能等技术对于处理海量数据和高频数据往往能够达到不错的效果。另外数据挖掘还能够对不断获得的新数据进行模型的动态更新,非常适合应用于新环境。数据挖掘是当今国际上统计学、人工智能和数据库研究方面最富活力的新兴领域,从大型数据库中挖掘有效信息的问题已经成为近年来数据分析研究领域中的一个新热点。股票投资风险与机遇并存,如何把握风险,使投资回报最大化?是投资者追求的目标。在上市公司公布的财务数据以及股票行情数据库中积累了大量的历史数据,如何充分利用这些历史数据,为投资者提供决策依据,把数据挖掘方法运用于股市投资研究和探索变得很有意义。因此,本文尝试用数据挖掘中的方法来以及组合模型对上市公式财务数据进行分析,目的是发现公司财务数据的变化和股票未来价格变化的联系,为投资者提供参考。 本文基于国内外相关方面研究成果,介绍了数据挖掘的相关理论,并且引入数据挖掘的相关方法对上市公司两年间的财务比率指标的变化量和股票价格变化之间的关系进行了研究分析,最后运用组合模型对数据挖掘的几种方法进行组合和优化。文章中用到的数据挖掘技术包括决策树分类、神经网络模型以及logistic回归模型三种方法,将三种方法运用于股票价格预测分析中,通过三种方法来研究上市公司公布的财务比率指标两年之间的变化量与股票当年的价格涨跌之间的内在联系,并试图寻找哪些财务指标对于上市公司的股价的变化有较大的影响,并且对三种方法取得的结果进行评估和对比分析,比较各种模型在进行实证分析时取得的效果,评价各个模型在预测精确度和稳定性方面的优劣。组合模型是基于几个单一模型,希望能够在一定程度上避开它们的缺点的组合方法,通过几种单一模型达到它们性能的结合于互补,克服它们各自的缺点。希望能够在最终的模型中使得股票分类预测变得更加精确、稳健并更容易理解。本文试图通过决策树模型来挑选上市公司的有效财务指标,剔除冗余指标对预测结果的干扰,并且利用logistic回归计算出分类的概率p值。将挑选出来的有效指标和p值作为输入层建立混合神经网络模型,最后得出组合模型的预测结果。本文以上市公司公布的财务比率指标计算出两年的动态变化量作为输入变量,以个股相对收益率作为被解释变量,并结合历史数据建立模型。从而更好判断股票的投资价值。文中建立模型时以上市公司公布的两年财务指标差额作为输入变量,为便于不同上市公司的比较,财务指标均选取财务比率指标。并为了综合反映公司的运行状况,从公司盈利能力、偿债能力、发展能力、运营能力以及现金流五个大的方面来选取指标,以更为准确的反映公司的内在价值。此外,以个股相对收益率作为目标变量建立模型。其中个股相对收益率为二元变量,当股票一年期的涨跌幅大于大盘指数的涨跌幅时取“1”,否则便取“0”。文章的思路便是以综合反映上市公司运行状况的财务比率指标的变化量为输入变量,以个股相对收益率为目标变量,来研究分析上市公司公布的财务比率指标和上市公司个股相对收益率是不是存在关系,如果存在关系,哪些财务比率指标对个股赢率的影响较大以及哪种模型预测效果较好,这些都是文章中要研究和解决的问题。
【关键词】:数据挖掘 决策树 神经网络 logistic回归 组合模型 财务指标 股票投资
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:F832.51;F224
【目录】:
  • 摘要4-7
  • Abstract7-11
  • 1. 绪论11-20
  • 1.1 研究背景11-12
  • 1.2 论文研究意义12-14
  • 1.3 国内外研究综述14-18
  • 1.4 研究框架18-20
  • 2. 股票市场与数据挖掘技术概述20-29
  • 2.1 股票市场概述20-22
  • 2.2 数据挖掘技术概述22-24
  • 2.3 数据挖掘的优点及运用于股票市场的适用性24-29
  • 2.3.1 数据挖掘的探索性24-25
  • 2.3.2 数据挖掘方法的多样性25-26
  • 2.3.3 数据挖掘方法稳健可靠的评估26-28
  • 2.3.4 数据挖掘运用于股票市场的适用性28-29
  • 3. 数据挖掘与组合模型理论介绍29-37
  • 3.1 决策树(DECISION TREES)介绍29-32
  • 3.2 LOGISTIC回归介绍32-34
  • 3.3 神经网络模型介绍34-36
  • 3.4 组合模型构建思想介绍36-37
  • 4. 公司财务指标概述及分类37-45
  • 4.1 上市公司财务指标的选取37-43
  • 4.2 上市公司的分类标准43-44
  • 4.3 数据来源及筛选44-45
  • 5. 基于数据挖掘方法的实证分析45-59
  • 5.1 基于决策树分类的实证分析45-49
  • 5.1.1 模型设计45-46
  • 5.1.2 实证结果46-49
  • 5.2 LOGISTIC回归方法及实证分析49-52
  • 5.2.1 模型设计50
  • 5.2.2 实证结果50-52
  • 5.3 基于神经网络模型的实证分析52-56
  • 5.3.1 模型设计53
  • 5.3.2 实证结果53-56
  • 5.4 组合模型的实证分析56-59
  • 5.4.1 实证结果56-57
  • 5.4.2 组合模型与单一神经网络模型对比分析57-59
  • 6 总结59-61
  • 参考文献61-64
  • 致谢64

【相似文献】

中国期刊全文数据库 前10条

1 杨辉;数据挖掘及其在商业银行中的应用[J];中国金融电脑;1998年11期

2 刘桂霞,崔永铎,高平和;关于数据挖掘的研究[J];工业技术经济;2000年03期

3 何东峰;数据挖掘要适当[J];互联网周刊;2000年Z1期

4 石艳芬;数据挖掘,你做了没有?[J];企业活力;2001年12期

5 宋海岚;浅叙数据挖掘在商业中的应用[J];计划与市场;2002年03期

6 吴载斌,王斌会;数据挖掘中的预测及其应用[J];统计与预测;2002年01期

7 洪崎;数据集中与数据挖掘[J];中国金融电脑;2002年10期

8 刘锡京,宣慧玉;客户关系管理与数据挖掘[J];中外管理导报;2002年10期

9 朱慧云,钱颖;数据挖掘在客户关系管理中的应用[J];江苏商论;2003年04期

10 ;数据挖掘的发展与电信行业的应用[J];通信企业管理;2003年08期

中国重要会议论文全文数据库 前10条

1 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

2 李久丹;陈剑;覃涛;;数据挖掘技术理论研究[A];广西计算机学会2010年学术年会论文集[C];2010年

3 张秋彤;;数据挖掘与高校图书馆个性化信息服务[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年

4 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年

5 毛定祥;;数据挖掘与实证经济学[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年

6 段培俊;周东岱;;数据挖掘研究综述[A];2003年中国智能自动化会议论文集(下册)[C];2003年

7 雷宇;;论行业信息资源的数据挖掘[A];中国烟草行业信息化研讨会论文集[C];2004年

8 吴以凡;吴铁军;欧阳树生;;面向生产过程质量控制的动态数据挖掘方法[A];05'中国自动化产业高峰会议暨中国企业自动化和信息化建设论坛论文集[C];2005年

9 孙明;康红梅;莫一;;数据挖掘在科技奖励管理系统专家库中的应用[A];2005年十二省区市机械工程学会学术年会论文集(湖北专集)[C];2005年

10 邵红全;杨菊梅;潘建雄;;数据挖掘的策略与实现技术[A];中国系统工程学会决策科学专业委员会第六届学术年会论文集[C];2005年

中国重要报纸全文数据库 前10条

1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年

2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年

3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年

4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年

5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年

6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年

7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年

8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年

9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年

10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年

中国博士学位论文全文数据库 前10条

1 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年

2 巩建光;面向电信领域的数据挖掘关键技术研究[D];哈尔滨工程大学;2012年

3 李建强;基于数据挖掘的电站运行优化理论研究与应用[D];华北电力大学(河北);2006年

4 余小高;电子商务环境中分布式数据挖掘的研究[D];武汉理工大学;2007年

5 李国旗;本体辅助的先验知识融入生物信息数据挖掘的方法研究[D];上海交通大学;2007年

6 翟坤;基于数据挖掘的成本管理方法研究[D];大连理工大学;2012年

7 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年

8 刘洪波;汉语认知脑数据挖掘相关算法及应用研究[D];大连理工大学;2006年

9 朱廷劭;数据挖掘及其在汉语文语转换中应用的研究[D];中国科学院研究生院(计算技术研究所);1999年

10 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年

中国硕士学位论文全文数据库 前10条

1 杨毅超;基于Web数据挖掘的作物商务平台分析与研究[D];湖南农业大学;2008年

2 徐进华;基于灰色系统理论的数据挖掘及其模型研究[D];北京交通大学;2009年

3 俞驰;基于网络数据挖掘的客户获取系统研究[D];西安电子科技大学;2009年

4 冯军;数据挖掘在自动外呼系统中的应用[D];北京邮电大学;2009年

5 于宝华;基于数据挖掘的高考数据分析[D];天津大学;2009年

6 王仁彦;数据挖掘与网站运营管理[D];华东师范大学;2010年

7 彭智军;数据挖掘的若干新方法及其在我国证券市场中应用[D];重庆大学;2005年

8 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年

9 贾治国;数据挖掘在高考填报志愿上的应用[D];内蒙古大学;2005年

10 马飞;基于数据挖掘的航运市场预测系统设计及研究[D];大连海事大学;2006年


  本文关键词:基于数据挖掘组合模型的股价预测研究,由笔耕文化传播整理发布。



本文编号:297361

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/zhqtouz/297361.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e4d0e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com