基于Spark的零部件尺寸测量数据聚类分析技术研究

发布时间：2024-04-22 04:24

　　零部件的互换性是其生产过程影响甚广的重要性质,其中选配工作就极依赖这个性质,对零部件分组能够显著提升组内的互换性。选配工作是对两种或多种配合零件选择配对,是生产工作中耗时耗力的步骤。一般采用分组选配方案,传统分组是将每种零件按实际测量尺寸形成公差带,根据公差带进行分组。这种分组方法只能适用于单个维度尺寸的分组,本文选用了效果好、依赖少的谱聚类算法对尺寸测量数据进行聚类分组,能够对多维度尺寸数据进行分组,极大提高了零件的互换性。谱聚类是一种不同于k-means等基于质心的传统聚类算法,对数据分布没有过多假设,且多方面评价指标有优势的算法。本文对谱聚类算法进行了两方面的改进,第一利用了堆数据结构快速搜索出每个样本点的k近邻邻域,获得远高于原始基于排序的经典算法的执行效率;第二利用额外的邻域累计信息来去除不可靠的相似连接来提高聚类结果的可靠性和真实性。最后结合以上两个策略形成了新算法HCKNNSC(K-Nearest Neighbor Spectral Clustering algorithm based on Heap and Consensus,基于堆和邻域共识的k近邻谱聚类算法),比起...

【文章页数】：68 页

【学位级别】：硕士

【部分图文】：

图１．１?Ｈａｄｏｏｐ架构??

ＭａｐＲｅｄｕｃｅ是Ｈａｄｏｏｐ的处理组件，是个可扩展、并行处理编程模型和软件框??架，提出了计算向数据移动的新思路减少了数据传输时间［２８］。Ｈａｄｏｏｐ、ＭａｐＲｅｄｕｃｅ、??ＹＡＲＮ和Ｓｐａｒｋ的层次依赖、包含、可插拔关系如图１．１所示：??Ｈａｄｏｏｐ?１?Ｈａｄｏｏｐ....

图２．１最小割与规范割结果对比??但这样一来就将问题转化成ＮＰ难问题，优化问题又入

用简单算法聚类，这也是谱聚类名字的由来。因此，即使在簇呈任意形状时它也能避开??局部最优的陷阱并收敛于全局最优。经典的谱聚类就基于这样的思想，大致的算法流程??如图２．２：??１１??

图２．２谱聚类流程图??如流程图２．２所示，先对数据集计算生成距离矩阵Ｚ）加ｅｉＴ”，这里采用欧式距离??度量每对样本点之间的远近，公式如式（２．５）所不：??ｄ（ｘ，，ｘ）＝?ｌｆｘ＾－ｘ）２??

结束??图２．２谱聚类流程图??如流程图２．２所示，先对数据集计算生成距离矩阵Ｚ）加ｅｉＴ”，这里采用欧式距离??度量每对样本点之间的远近，公式如式（２．５）所不：??ｄ（ｘ，，ｘ；）＝?ｌ＾ｆｘ＾－ｘ＾）２??ｈ?（２．５）??其中，ｘ，和ｘ，分别是给定数据集女＝１，２，中的两....

图２．３相似图近似技术??

存储和计算限制促使我们想到矩阵稀疏化，将大多数元素清零，这允许使用更少??的存储空间有效地存储稀疏矩阵，而不是存储所有Ａ７２个元素。构造相似图有多种不同??方法，现在来讨论最常见的类型。图２．３描绘了多个相似图近似改进的方向，并随后列??举了几种流行的相似图近似方法。??稠密相似....

本文编号：3961925

资料下载

论文发表

支付宝下载
微信下载
会员下载

本文链接：https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3961925.html

上一篇：基于IAG-ABC算法的路径覆盖测试用例生成技术
下一篇：基于变因子加权学习与邻代维度交叉策略的改进CSA算法