当前位置:主页 > 管理论文 > 品牌论文 >

基于随机森林模型的二手车价值评估研究

发布时间:2024-02-19 18:29
  伴随我国经济的发展,汽车市场日渐繁荣,在新车保有量逐年攀升的同时,也有更多的消费者从观念上接受了二手车。截止2019年底,我国二手车交易量已高达1492.28万辆,交易量的上涨不但促进了二手车行业的发展,也对二手车价值评估提出了更高的要求。但由于我国不同地域的二手车市场发展不平衡,评估数据缺乏、评估信息不对称和评估过程成本高等问题会限制传统三种评估方法的使用。因此,寻找到一种能满足我国二手车市场需求的评估方法十分重要。随机森林作为一种机器学习模型,采用计算机算法实现,在数据处理上有独特的优势,如能够应对样本中有一定噪声和数据缺失的情况,因此本文在二手车价值评估研究中引入随机森林模型。首先,根据均方误差的平均递减程度对分类赋值量化后的15个特征变量进行重要性排序与筛选,组建二手车价值评估的特征变量体系。体系中共有10个特征变量,按照不同属性分为实体变量、功能变量和市场变量三类。其次,通过多次测试对随机森林模型中两个重要参数,单棵决策树每次生长时随机抽取的变量个数和决策树数量的最优选值进行确定,并将样本按照8:2的比例分成训练集和测试集,依据训练集数据建立基于随机森林的二手车价值评估模型。...

【文章页数】:56 页

【学位级别】:硕士

【部分图文】:

图2-1随机森林回归预测模型操作流程示意图

图2-1随机森林回归预测模型操作流程示意图

河北经贸大学硕士学位论文14随机选取一定数量的特征变量,依据均方误差MSE或平均绝对误差MAE寻找到最好的切分节点。二是Bagging算法能够降低了决策树间的相关性,减少模型出现过度拟合以及泛化误差大的情况,因此在建立随机森林回归预测模型时,不需要通过决策树剪枝行为来提高模型精度....


图3-1特征变量重要性次序图

图3-1特征变量重要性次序图

基于随机森林模型的二手车价值评估研究29使用随机森林模型,不需要对样本数据进行归一化处理,因此直接将所有量化好的包含1805个样本数据的Excel表格投入到R软件中。以默认的数值,即单棵决策树每次生长时随机抽取的变量个数mtry为4、决策树数量ntree为500,建立随机森林模型....


图3-2二手车价值评估特征变量体系鱼骨图

图3-2二手车价值评估特征变量体系鱼骨图

基于随机森林模型的二手车价值评估研究31功率、变速箱类型、排放标准和新车价格。因此选择这10个特征变量作为二手车价值评估模型中的特征变量体系,用鱼骨图表示如下。图3-2二手车价值评估特征变量体系鱼骨图


图4-1决策树数量ntree测试图

图4-1决策树数量ntree测试图

河北经贸大学硕士学位论文34mtry=1)#建立名为model.forest_mtry的随机森林模型,模型因变量为price即二手车价值,data=train表示建模数据来源是训练集,决策树数量ntree为300,单棵决策树每次生长时随机抽取的变量个数mtry为1。>print(....



本文编号:3903135

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/pinpaiwenhualunwen/3903135.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户c166d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com