Dalam aplikasi ini Anda menemukan kursus + latihan + koreksi secara rinci tentang Data Waherouse dan Data Mining
Apa itu "Gudang Data" pertama? :
Ini adalah jenis database yang berisi sejumlah besar data untuk membantu membuat keputusan dalam organisasi. Jenis basis data ini ditandai oleh kesesuaian struktur internal dengan apa yang dibutuhkan pengguna dari indikator dan sumbu analisis dalam apa yang disebut model bintang-bintang, dan aplikasinya: sistem dukungan keputusan dan penambangan data.
Gudang data biasanya berisi data historis yang telah diperoleh dan diekstraksi dari data dalam database biasa yang digunakan dalam aplikasi tempat banyak operasi input dan pembaruan berlangsung, dan gudang data juga dapat berisi data dari sumber lain seperti file teks dan dokumen lainnya.
apa itu "Penambangan Data"? :
Ini adalah pencarian terkomputerisasi dan manual untuk pengetahuan tentang data tanpa hipotesis awal tentang apa pengetahuan ini bisa. Penambangan data juga didefinisikan sebagai proses menganalisis sejumlah data (biasanya dalam jumlah besar), untuk menemukan hubungan logis yang merangkum data dengan cara baru yang dapat dimengerti dan berguna bagi pemilik data . "Model" disebut hubungan dan data ringkasan yang diperoleh dari penggalian data. Data mining umumnya berkaitan dengan data yang telah diperoleh untuk tujuan selain dari data mining (misalnya, database transaksi di bank), yang berarti bahwa metode penambangan data tidak mempengaruhi cara data itu sendiri dikumpulkan. Ini adalah salah satu bidang di mana penambangan data berbeda dari statistik, dan untuk alasan inilah proses penambangan data disebut proses statistik sekunder. Definisi ini juga menunjukkan bahwa jumlah data umumnya besar, tetapi jika jumlah data kecil, yang terbaik adalah menggunakan metode statistik reguler untuk menganalisisnya.
Ketika berhadapan dengan volume data yang besar, masalah baru muncul seperti bagaimana mengidentifikasi titik berbeda dalam data, bagaimana menganalisis data dalam waktu yang masuk akal dan bagaimana memutuskan apakah hubungan yang jelas mencerminkan fakta dalam sifat data. . Biasanya, data diekstraksi yang merupakan bagian dari kumpulan data, di mana tujuannya biasanya untuk menggeneralisasi hasil ke semua data (misalnya, menganalisis data konsumen saat ini dari suatu produk untuk mengantisipasi permintaan di masa depan. konsumen). Salah satu tujuan dari penambangan data adalah juga untuk mengurangi atau memampatkan sejumlah besar data untuk mengekspresikan data sederhana tanpa generalisasi.