Šioje programoje rasite kursus + pratimus + informacijos apie „Data Waherouse“ ir „Duomenų gavyba“ taisymą
Kas yra „duomenų sandėlis“ pirmiausia? :
Tai yra duomenų bazės rūšis, kurioje yra didžiulis kiekis duomenų, padedančių priimti sprendimus organizacijos viduje. Šis duomenų bazės tipas pasižymi tuo, kad vidinė struktūra atitinka tai, ko vartotojui reikia iš rodiklių ir analizės ašių, vadinamoje žvaigždės žvaigždės modelyje, ir jos taikymo: sistemos. sprendimų palaikymas ir duomenų gavyba.
Duomenų saugyklose paprastai yra istorinių duomenų, kurie buvo gauti ir išgauti iš duomenų įprastose duomenų bazėse, naudojamose programose, kuriose atliekama daug įvesties ir atnaujinimo operacijų, o duomenų saugyklose taip pat gali būti duomenų duomenys iš kitų šaltinių, tokių kaip tekstiniai failai ir kiti dokumentai.
kas yra „duomenų gavyba“? :
Tai yra kompiuterizuota ir rankiniu būdu ieškoma duomenų duomenų be išankstinių hipotezių, kokios šios žinios gali būti. Duomenų gavyba taip pat apibrėžiama kaip duomenų kiekio (paprastai didelio kiekio) analizės procesas, siekiant rasti loginį ryšį, kuris duomenis apibendrina nauju būdu, suprantamu ir naudingu duomenų savininkui. . „Modeliai“ yra vadinami ryšiais ir apibendrinus duomenis, gautus gavus duomenis. Duomenų gavyba paprastai yra susijusi su duomenimis, gautais ne duomenų gavybos tikslu (pavyzdžiui, operacijų duomenų bazėje banke), o tai reiškia, kad duomenys neturi įtakos pačių duomenų rinkimo būdui. Tai yra viena iš sričių, kurioje duomenų gavyba skiriasi nuo statistikos, ir dėl šios priežasties duomenų gavybos procesas vadinamas antriniu statistiniu procesu. Apibrėžimas taip pat nurodo, kad duomenų kiekis paprastai yra didelis, tačiau jei duomenų yra nedaug, analizuojant geriausia naudoti įprastus statistinius metodus.
Kai tvarkomi dideli duomenų kiekiai, iškyla naujų problemų, tokių kaip, kaip atpažinti atskirus duomenų taškus, kaip analizuoti duomenis per pagrįstą laiką ir kaip nuspręsti, ar akivaizdus ryšys atspindi duomenų pobūdžio faktą. . Paprastai gaunami duomenys, kurie yra duomenų rinkinio dalis, kai paprastai siekiama apibendrinti rezultatus su visais duomenimis (pavyzdžiui, analizuoti dabartinius produkto vartotojų duomenis, kad būtų galima numatyti būsimus poreikius). vartotojai). Vienas iš duomenų gavybos tikslų yra sumažinti arba suspausti didelius duomenų kiekius, kad būtų galima išreikšti paprastus duomenis be apibendrinimų.