V tejto aplikácii nájdete kurzy + cvičenia + opravy v detailoch Data Waherouse a Data Mining
Čo je „Dátový sklad“ ako prvý? :
Je to typ databázy, ktorý obsahuje veľké množstvo údajov, ktoré pomáhajú pri rozhodovaní v rámci organizácie. Tento typ databázy sa vyznačuje zhodou svojej vnútornej štruktúry s tým, čo užívateľ potrebuje od ukazovateľov a analytických osí v tzv. Hviezdicovom modeli a jeho aplikáciami: systémy podpora rozhodovania a získavanie údajov.
Dátové sklady obvykle obsahujú historické údaje, ktoré boli odvodené a extrahované z údajov v obvyklých databázach používaných v aplikáciách, v ktorých sa uskutočňuje veľa operácií vstupu a aktualizácie, a sklady údajov môžu obsahovať aj údaje z iných zdrojov, napríklad z textových súborov a iných dokumentov.
čo je „dolovanie údajov“? :
Ide o počítačové a manuálne vyhľadávanie poznatkov o údajoch bez predbežných hypotéz o tom, čo tieto znalosti môžu byť. Dolovanie údajov je tiež definované ako proces analýzy množstva údajov (zvyčajne veľké množstvo) s cieľom nájsť logický vzťah, ktorý sumarizuje údaje novým spôsobom, ktorý je zrozumiteľný a užitočný pre vlastníka údajov. , „Modely“ sa nazývajú vzťahy a súhrnné údaje získané získavaním údajov. Dolovanie údajov sa vo všeobecnosti zaoberá údajmi, ktoré sa získali na iný účel ako na účely ťažby údajov (napríklad databáza transakcií v banke), čo znamená, že metóda ťažby údaje neovplyvňujú spôsob zhromažďovania samotných údajov. Toto je jedna z oblastí, v ktorých sa získavanie údajov líši od štatistík, a preto sa proces získavania údajov nazýva sekundárny štatistický proces. Definícia tiež naznačuje, že množstvo údajov je vo všeobecnosti veľké, ale ak je množstvo údajov malé, je najlepšie na ich analýzu použiť bežné štatistické metódy.
Pri riešení veľkého množstva údajov vznikajú nové problémy, ako napríklad ako identifikovať odlišné body v údajoch, ako analyzovať údaje v primeranom čase a ako rozhodnúť, či zjavný vzťah odráža skutočnosť v povahe údajov. , Spravidla sa extrahujú údaje, ktoré sú súčasťou súboru údajov, pričom cieľom je zvyčajne zovšeobecniť výsledky na všetky údaje (napríklad analyzovať súčasné údaje o spotrebiteľoch produktu s cieľom predvídať budúce požiadavky). spotrebiteľov). Jedným z cieľov získavania údajov je tiež zníženie alebo kompresia veľkého množstva údajov na vyjadrenie jednoduchých údajov bez zovšeobecnenia.
Aktualizované
20. 10. 2024