Dalam aplikasi ini anda dapati kursus + latihan + pembetulan secara terperinci mengenai Data Waherouse dan Data Mining
Apa itu "Data Warehouse" dahulu? :
Ini adalah sejenis pangkalan data yang mengandungi sejumlah besar data untuk membantu membuat keputusan dalam organisasi. Jenis pangkalan data ini dicirikan oleh kesesuaian struktur dalamannya dengan apa yang pengguna perlukan dari petunjuk dan paksi analisis dalam apa yang disebut model bintang-bintang, dan aplikasinya: sistem sokongan keputusan dan perlombongan data.
Gudang data biasanya mengandungi data sejarah yang telah diturunkan dan diekstrak dari data dalam pangkalan data biasa yang digunakan dalam aplikasi di mana banyak operasi input dan kemas kini berlangsung, dan gudang data juga dapat berisi data dari sumber lain seperti fail teks dan dokumen lain.
apa itu "Perlombongan Data"? :
Ini adalah carian berkomputer dan manual untuk pengetahuan data tanpa hipotesis awal mengenai apa pengetahuan ini. Perlombongan data juga didefinisikan sebagai proses menganalisis kuantiti data (biasanya sejumlah besar), untuk mencari hubungan logik yang merangkum data dengan cara baru yang dapat difahami dan berguna bagi pemilik data . "Model" disebut hubungan dan data ringkasan yang diperoleh dari perlombongan data. Perlombongan data secara amnya berkaitan dengan data yang telah diperoleh untuk tujuan selain daripada perlombongan data (misalnya, pangkalan data transaksi di bank), yang bermaksud bahawa kaedah perlombongan data tidak mempengaruhi cara pengumpulan data itu sendiri. Ini adalah salah satu bidang di mana perlombongan data berbeza dengan statistik, dan untuk alasan ini proses perlombongan data disebut sebagai proses statistik sekunder. Definisi ini juga menunjukkan bahawa jumlah data pada amnya besar, tetapi jika jumlah data kecil, lebih baik menggunakan kaedah statistik biasa untuk menganalisisnya.
Ketika berurusan dengan sejumlah besar data, masalah baru muncul seperti bagaimana mengenal pasti titik yang berbeda dalam data, bagaimana menganalisis data dalam waktu yang wajar dan bagaimana memutuskan apakah hubungan yang jelas mencerminkan fakta dalam sifat data. . Biasanya, data diekstraksi yang merupakan bagian dari kumpulan data, di mana tujuannya biasanya untuk menggeneralisasikan hasil ke semua data (misalnya, menganalisis data terkini pengguna suatu produk untuk mengantisipasi tuntutan masa depan pengguna). Salah satu tujuan perlombongan data juga adalah untuk mengurangkan atau memampatkan sejumlah besar data untuk menyatakan data sederhana tanpa generalisasi.
Dikemas kini pada
20 Okt 2024