丰富数据的可用性以及支持决策以创建业务解决方案的信息需求以及技术领域的基础设施支持是数据挖掘技术诞生的先行者。数据挖掘是一项非常有用的技术,可以帮助从数据仓库中找到急需的信息。数据挖掘是使用某些技术从大型数据集中提取重要信息或知识的活动。数据挖掘涉及使用方法或工具来检测模式并执行预测任务。通过使用现有的相关数据,数据挖掘创建多个模型来识别数据集中属性之间的模式。
其中些模式是描述性的解释各
种属性之间的相互关系或相似之处)和预测性的(预测将发生的“值/结果”)。数据挖掘中使用的方法是基于发现的,其中使用模式匹配和其他算法来 加拿大电话号码数据 确定正 在探索的数据中的关键关系。 数据挖掘的四种主要模式类型是关联、预测、聚类/分段和顺序关系。关联是通常一起发生的一组事物,例如 10 个人购买甜炼乳,这 10 个人中有 5 个人购买奶酪,然后得出结论:如果顾客购买甜炼乳,他也会购买奶酪。
预测根据已经发生的事情解释了
关于某些事件的未来事件的基本特征,例如以时间序列的形式预测股票价格。聚类是根据已知特征对事物进行分组,或将数据、观察结果分组到相似的类别中,例如根 英国电话号码 据人口统计数据对消费者进行分组。 如果分为 3 个主要类别,它们是预测、关联和聚类。根据从历史数据中提取这些模式的方式,数据挖掘方法可以分为监督式或无监督式。