过寻找不可预见的模式和奇怪现

象来探索数据。这可以增加对数据的理解和想法。而且,它还细化了披露过程,因为如果没有可视化,或者视觉本身不清楚,可以通过统计技术(聚类、因子分析等)来完成。 修改——通过创建、选择和转换变量来修改数据以集中模型选择,并且可以必要地添加任何附加信息或变量以使信息输出有意义。

每当有新信息可用时就可以更新或

修改数据挖掘方法。 模型– 通过允许软件以自动方式搜索可靠预测理想结果的数据混合来对数据进行建模。例如,时间序列分析、基于记忆的推理   巴西电话号码数据   等统计模型。 评估——通过评估数据发现是否足够有价值(有用)和可靠来评估数据。在此阶段,还可以通过数据来衡量其表现如何。如果数据模型有效,它应该在保留样本和构建样本上都能正常工作。

然而需要注意的是在的这些阶段之前

本身不仅仅是一种信息挖掘技术。具体来说,它是 SAS Enterprise 开发的功能工具集,而不是广泛的数据挖掘工具。它专注于 SAS Enterprise Miner 软件,该软件可用   英国电话号码  作任何迭代信息挖掘系统的主要方面。简而言之,SEMMA 专注于数据挖掘的模型开发方面。SEMMA 周期中每个阶段的结果都可以进行评估,这将非常有用,因为模型开发人员可以为过去的结果和结果提出的新查询决定适当的演示。这样,它就可以返回探索阶段以获得对信息的任何额外细化。

Leave a Reply

Your email address will not be published. Required fields are marked *