Ebben az alkalmazásban talál tanfolyamokat + gyakorlatokat + javítást a Data Waherouse és az Data Mining részleteiben
Mi az első az "Adattárház"? :
Ez egy olyan típusú adatbázis, amely hatalmas mennyiségű adatot tartalmaz a szervezeten belüli döntések meghozatalához. Az ilyen típusú adatbázist az jellemzi, hogy belső struktúrája megfelel a felhasználó igényeinek, az indikátorok és az elemzési tengelyek alapján, az úgynevezett csillagmodellben, és annak alkalmazásaihoz: rendszerek döntéstámogatás és adatbányászat.
Az adattárak általában tartalmaznak olyan előzményadatokat, amelyeket az olyan alkalmazásokban használt szokásos adatbázisokból származtattak és kinyertek, amelyekben sok beviteli és frissítési művelet zajlik, és az adattárak is tartalmazhatnak más forrásokból származó adatok, például szöveges fájlok és egyéb dokumentumok.
mi az "adatbányászat"? :
Ez egy számítógépes és kézi adatkeresés az adatok előzetes hipotézisek nélkül, mi lehet ez a tudás. Az adatbányászat egyúttal egy adatmennyiség (általában nagy mennyiségű) elemzésének folyamataként is meghatározható, hogy olyan logikai összefüggést lehessen találni, amely az adatokat az adattulajdonos számára érthető és hasznos módon új módon összegzi. . A „modelleket” kapcsolatoknak és az adatbányászatból nyert összefoglaló adatoknak nevezzük. Az adatbányászat általában olyan adatokkal foglalkozik, amelyeket az adatbányászattól eltérő célra szereztek be (például egy bankban lebonyolított tranzakciók adatbázisa), ami azt jelenti, hogy a bányászati módszer Az adatok nem befolyásolják az adatok gyűjtésének módját. Ez az egyik olyan terület, amelyben az adatbányászat különbözik a statisztikától, és ezért az adatbányászati folyamatot másodlagos statisztikai folyamatnak nevezik. A meghatározás azt is jelzi, hogy az adatmennyiség általában nagy, de ha az adatmennyiség alacsony, akkor a legjobb, ha rendszeres statisztikai módszereket használ fel az elemzéshez.
Nagy mennyiségű adat kezelése során olyan új problémák merülnek fel, mint például az adatok különálló pontjainak azonosítása, az adatok ésszerű időn belüli elemzése, és annak eldöntése, hogy egy nyilvánvaló kapcsolat tükrözi-e az adat jellegében szereplő tényt. . Általában olyan adatot nyernek, amely az adatkészlet részét képezi, ahol a cél általában az, hogy az eredményeket minden adatra általánosítsák (például egy termék fogyasztójának jelenlegi adatainak elemzése a jövőbeli igények előrejelzése céljából). fogyasztók). Az adatbányászat egyik célja a nagy mennyiségű adat csökkentése vagy tömörítése az egyszerű adatok általánosítás nélkül történő kifejezésére.