知识库 : DataStudio模型训练预测过程

Edit Document

目录

模型训练 , 预测过程使用说明

数据输入

模型训练

模型存储

预测数据输入

预测

结果可视化

结果发布

              模型训练 , 预测过程使用说明              

Data Studio 是一种结构化的数据挖掘流程设计器,它模拟数据挖掘的整个过程,一般的数据挖掘流程可分为,

模型训练过程:数据输入,数据探查,数据预处理,模型训练,模型校验,模型存储

预测过程:预测数据输入,预测,结果可视化,预测评估,结果发布

DataStudio 会不断加入新的节点,覆盖挖掘的整个流程。

先针对现有节点介绍挖掘的整个流程,部分过程可能涉及不到,随着节点的不断加入,后续会不断修正此文档。

数据输入

DataStudio 现提供两种输入数据节点:文件,数据库读取。

前者可以读取数据文件,比如 CSV ,后者可以读取数据库中的数据。

 

模型训练

建模部分提供多种算法节点,包括回归,分类,聚类,时间序列算法节点。

模型存储

生成的模型可以直接保存至服务器端,如下图所示,选中生成的模型,右键可将模型存储至服务器端。

 

预测数据输入

同数据输入,不过此时的数据为预测用数据。

预测

拖拽模型视图中的节点至工作区,引入预测数据可以执行预测过程。

结果可视化

提供多种图表,对数据结果集合的可视化,包含基础图表,也包含对挖掘模型可视化的针对性图表,比如平行坐标轴图表,是用来展现关联规则的。

图表会不断的丰富。

结果发布

预测结果数据可存储为本地文件,或者输出至数据库。

Attachments:

DataStudio模型训练预测过程.docx (application/vnd.openxmlformats-officedocument.wordprocessingml.document)