在此应用程序中,您将找到有关Data Waherouse和Data Mining的详细课程,练习和更正
首先是什么“数据仓库”? :
它是一种数据库,其中包含大量数据,可帮助组织内的决策。这种类型的数据库的特点是其内部结构与用户在所谓的星型模型中从指标和分析轴上需要的内容保持一致,及其应用程序:系统决策支持和数据挖掘。
数据仓库通常包含历史数据,这些历史数据是从发生许多输入和更新操作的应用程序中使用的常用数据库中的数据中提取和提取的,并且数据仓库还可以包含来自其他来源的数据,例如文本文件和其他文档。
什么是“数据挖掘”? :
它是一种计算机化的手动搜索数据知识的方法,而没有关于该知识可能是什么的初步假设。数据挖掘也被定义为分析大量数据(通常是大量数据)以找到一种逻辑关系的过程,该逻辑关系以一种新的方式汇总了数据,这对于数据所有者而言是可以理解和有用的。 “模型”称为从数据挖掘中获得的关系和摘要数据。数据挖掘通常处理出于数据挖掘目的以外的目的而获得的数据(例如,银行中的交易数据库),这意味着数据挖掘的方法数据不会影响数据本身的收集方式。这是数据挖掘与统计不同的领域之一,因此,数据挖掘过程称为辅助统计过程。该定义还表明,数据量通常很大,但是如果数据量很小,则最好使用常规统计方法对其进行分析。
当处理大量数据时,会出现新的问题,例如,如何识别数据中的不同点,如何在合理的时间内分析数据以及如何确定表观关系是否反映了数据性质的事实。 。通常,提取的数据是数据集的一部分,通常目标是将结果概括为所有数据(例如,分析产品消费者的当前数据以预期未来需求)消费者)。数据挖掘的目标之一也是减少或压缩大量数据以表达简单数据而无需泛化。