知识库 : FCM节点使用说明

Edit Document

 

 

 

 

 

 

 

 

 

FCM节点使用说明

 

 

 

作者 :张青松


目录

1.               FCM 算法

2.               FCM 节点

 

1.     FCM 算法

FCM 节点采用了 Fuzzy -C- Means 算法对数据进行聚类的 , FCM 算法是一种基于划分的聚类算法,其思想是是的被划分到同一簇的对象之间的相似度最大,不同簇之间的相似度最小。 FCM 是普通硬聚类( HCM )的改进,用隶属度确定每个数据点属于某个聚类的程度。

FCM 算法是一个简单的迭代过程,在每次迭代中,用欧氏距离量化每个数据点与同一簇数据点的相似度。

FCM 的理论可以知道, FCM 算法对于满足正态分布的数据聚类效果较好,并且对于孤立点是敏感的。

2.     FCM 节点

DataStudio 中, FCM 在“建模 聚类”目录下,与其他建模节点相同,在工作流中为 FCM 节点添加数据输入节点。如下图:

 

1  FCM 工作流

 

在输入数据中,必须有数值类型的字段。本文中的输入数据字段类型如图:

 

2 输入数据字段信息

 

打开 FCM 设置面板,在设置面板的表格中显示了输入数据中所有数值类型的字段,选择要用作聚类计算的字段,此处做全选。如图:

 

3 选择参与聚类的数值字段

 

切换到模型页签,设置 FCM 算法参数,如图:

4  FCM 模型参数设置

 

根据数据以及聚类要求设置各项的值,其中

1)         加权指数的取值范围在

2)         对于孤立点的处理,可以选择使用噪声聚类,在噪声聚类中,可以直接设置 delta 的值,也可设置 lambda ,通过 lamdba 计算适合每一个数据点的 delta 值。

3)         选择是否在内存中聚类和是否在结果中显示聚类性能指标等选项。

 

执行后查看聚类结果 , 如下图:

 

1 聚类结果

 

本例中选择了噪声聚类,并将 delta 设置为 0.2 ;表中前 5 列数据来自于输入数据,第六列的 cluster_0 cluster_2 是根据设置产生的三个聚类,每一列对应该对象对于该聚类的隶属度,由于已经对每个数据点的所有聚类的隶属度做了归一化处理,所以每个数据点的所有聚类隶属度之和为 1 NoiseCluster 表示噪声聚类,如果不选择噪声聚类,不会产生这一列。最后一列表示,根据隶属度确定该数据点所属的聚类。

查看模型中对于聚类结果的描述信息,如下

5 聚类信息

 

在左侧生成的模型中查看 FCM 聚类信息,可以从中查看 FCM 设置的聚类参数,以及聚类中心。如果选择了聚类性能指标,则还会显示聚类内差异、聚类间差异、划分系数、划分熵、 Xie-Beni 指标和 Fuzzy Hypervolumns 等聚类信息。

Attachments:

FCM节点使用说明.docx (application/vnd.openxmlformats-officedocument.wordprocessingml.document)
FCM节点使用说明.docx (application/vnd.openxmlformats-officedocument.wordprocessingml.document)