当前位置:主页 > 科技论文 > 地质论文 >

利用大数据挖掘矿石中主要矿物之间的关系

发布时间:2024-02-07 06:22
  近年来,借助于大数据技术的发展,地质学迎来了新的发展机遇,但目前利用大数据技术来分析矿物之间关系的研究还比较少。矿物是岩石、矿石的基本组成要素,通常都是以共存集合体的形式产出。矿物的产出不是随机的,而是按照一定的规律共生、伴生在一起。通过大数据技术挖掘出这种矿物的共伴生规律,能够更好地认识矿物之间的关系,对于指导找矿实践有积极作用。本文利用频繁模式挖掘、关联规则、网络分析以及社团检测这些常用的大数据挖掘方法进行了矿石主要组成矿物的大数据分析。所使用的矿石矿物组成数据来自于美国地质调查局的全球矿产资源数据系统(MRDS),该数据集收集了来自于全球的大量矿床中矿石的矿物组成数据。研究结果显示,通过关联规则可以挖掘出隐藏在矿石矿物成分大数据集中的频繁矿物组合,对于找矿勘查和认识矿物之间的关系有积极作用;关联规则挖掘出的规则是一种量化的推理规则,通过兴趣度度量指标能够定量地表征规则的强弱,这种规则相比于经验总结的规律更加定量化和精细化;通过网络分析能够对矿石中主要矿物之间的关系和共伴生规律进行动态、多维、定量的可视化;再结合社团检测可以从矿石矿物数据集中发现隐藏在其中的矿物之间的关系。

【文章页数】:10 页

【部分图文】:

图1矿物出现频次统计

图1矿物出现频次统计

对经过预处理的数据进行了词频统计,结果显示预处理之后的数据集中囊括的矿物共包括652种,其分布呈现出指数分布规律(图1,图中横坐标是按照数据库中的矿物统计频次排名的名次,纵坐标为出现次数),说明少数矿物在各类岩石矿石中广泛存在(如石英),大部分矿物则只出现在特定的岩石和矿石中,分....


图2词云图

图2词云图

图1矿物出现频次统计通过R语言的arules包来进行频繁模式和关联规则挖掘,主要用到两个函数eclet和aporior。前者用来找出频繁项集,后者用来找出关联规则。表2列出了出现频次排名前15的频繁项集。


图3矿石中主要矿物组分构成的复杂网络(a)及其网络局部放大(b)

图3矿石中主要矿物组分构成的复杂网络(a)及其网络局部放大(b)

以上网络分析和社团挖掘结果说明,通过网络分析可以对矿石中主要矿物之间的关系和共伴生规律进行可视化,通过社团检测可以找出哪些矿物之间存在密切联系。4结论与展望


图4矿物关系谱系图(部分展示)

图4矿物关系谱系图(部分展示)

(2)关联规则是一种有效的离散数据知识发现方法,其发现的规则是一种定量化的推理规则,通过兴趣度度量指标能够定量地表征规则的强弱,这种规则相比于经验总结的规律更加定量化和精细化,实用性更强。(3)通过网络分析能够对矿石中主要矿物之间的关系和共伴生规律进行可视化,再结合社团检测可以从....



本文编号:3896911

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/diqiudizhi/3896911.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户e70ad***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com