在此應用程序中,您將找到有關Data Waherouse和Data Mining的詳細課程,練習和更正
首先是什麼“數據倉庫”? :
它是一種數據庫,其中包含大量數據,可幫助組織內的決策。這種類型的數據庫的特點是其內部結構與用戶在所謂的星型模型中從指標和分析軸上需要的內容保持一致,及其應用程序:系統決策支持和數據挖掘。
數據倉庫通常包含歷史數據,這些歷史數據是從發生許多輸入和更新操作的應用程序中使用的常用數據庫中的數據中提取和提取的,並且數據倉庫還可以包含來自其他來源(例如文本文件和其他文檔)的數據。
什麼是“數據挖掘”? :
它是一種計算機化的手動搜索數據知識的方法,而沒有關於該知識可能是什麼的初步假設。數據挖掘也被定義為分析大量數據(通常是大量數據)以找到一種邏輯關係的過程,該邏輯關係以一種新的方式匯總了數據,這對於數據所有者而言是可以理解和有用的。 “模型”稱為從數據挖掘中獲得的關係和摘要數據。數據挖掘通常處理出於數據挖掘目的以外的目的而獲得的數據(例如,銀行中的交易數據庫),這意味著數據挖掘的方法數據不會影響數據本身的收集方式。這是數據挖掘與統計不同的領域之一,因此,數據挖掘過程稱為輔助統計過程。該定義還表明數據量通常很大,但是如果數據量很小,則最好使用常規統計方法對其進行分析。
當處理大量數據時,會出現新的問題,例如,如何識別數據中的不同點,如何在合理的時間內分析數據以及如何確定表觀關係是否反映了數據性質的事實。 。通常,提取的數據是數據集的一部分,通常目標是將結果概括為所有數據(例如,分析產品消費者的當前數據以預期未來需求)消費者)。數據挖掘的目標之一也是減少或壓縮大量數據以表達簡單數據而無需泛化。