V tej aplikaciji najdete tečaje + vaje + popravek v podrobnostih o Data Waherouse in Data Mining
Kaj je najprej "Skladišče podatkov"? :
Gre za vrsto podatkovnih baz, ki vsebuje ogromno podatkov, ki pomagajo pri odločanju znotraj organizacije. Za to vrsto podatkovne baze je značilna skladnost njene notranje strukture s tem, kar uporabnik potrebuje od kazalnikov in osi analize v tem, kar imenujemo model zvezda-zvezda, in njegove uporabe: sistemi podpora odločanju in rudarjenje podatkov.
Shrambe podatkov običajno vsebujejo pretekle podatke, ki so bili pridobljeni in pridobljeni iz podatkov v običajnih bazah podatkov, ki se uporabljajo v aplikacijah, v katerih potekajo številne vnosne in posodobitvene operacije, skladišča podatkov pa lahko vsebujejo tudi podatki iz drugih virov, kot so besedilne datoteke in drugi dokumenti.
kaj je "podatkovni rudarjenje"? :
Gre za računalniško in ročno iskanje znanja o podatkih brez predhodnih hipotez o tem, kakšno je lahko to znanje. Izvajanje podatkov je opredeljeno tudi kot postopek analize količine podatkov (ponavadi velike količine), da bi našli logični odnos, ki podatke povzame na nov način, ki je razumljiv in uporaben za lastnika podatkov . "Modeli" se imenujejo razmerja in zbirni podatki, pridobljeni pri pridobivanju podatkov. Podatkovno rudarjenje na splošno obravnava podatke, ki so bili pridobljeni z namenom, ki ni namenjen pridobivanju podatkov (na primer podatkovna baza transakcij v banki), kar pomeni, da metoda rudarjenja podatki ne vplivajo na način zbiranja podatkov. To je eno od področij, na katerem se rudarjenje podatkov razlikuje od statističnega, zato se postopek pridobivanja podatkov imenuje sekundarni statistični proces. Opredelitev tudi kaže, da je količina podatkov na splošno velika, če pa je količina podatkov majhna, je za njeno analizo najbolje uporabiti redne statistične metode.
Pri obravnavi velikega obsega podatkov se pojavijo nove težave, na primer, kako prepoznati različne točke v podatkih, kako analizirati podatke v razumnem času in kako se odločiti, ali navidezni odnos odraža dejstvo v naravi podatkov. . Običajno se pridobivajo podatki, ki so del nabora podatkov, kjer je ponavadi cilj posplošiti rezultate na vse podatke (na primer analizirati trenutne podatke potrošnikov izdelka, da se predvidijo prihodnje zahteve potrošniki). Eden od ciljev rudarjenja podatkov je tudi zmanjšanje ali stiskanje velikih količin podatkov za izražanje preprostih podatkov brez posploševanja.
Posodobljeno dne
20. okt. 2024