I denne applikasjonen finner du kurs + øvelser + korreksjon i detaljer om Data Waherouse og Data Mining
Hva er "Data Warehouse" først? :
Det er en type database som inneholder en enorm mengde data som hjelper deg med å ta beslutninger i organisasjonen. Denne typen database er preget av at den interne strukturen er i samsvar med det brukeren trenger av indikatorene og analyseaksene i det som kalles star-star-modellen, og dens applikasjoner: systemer beslutningsstøtte og data mining.
Datavarehus inneholder vanligvis historiske data som er avledet og hentet ut fra data i de vanlige databasene som brukes i applikasjoner der mange inndata- og oppdateringsoperasjoner foregår, og datavarehus kan også inneholde data fra andre kilder, for eksempel tekstfiler og andre dokumenter.
hva er "Data Mining"? :
Det er et datastyrt og manuelt søk etter kunnskap om dataene uten foreløpige hypoteser om hva denne kunnskapen kan være. Data mining er også definert som prosessen med å analysere en mengde data (vanligvis en stor mengde), for å finne et logisk forhold som oppsummerer dataene på en ny måte som er forståelig og nyttig for dataeieren . “Modeller” kalles relasjoner og sammendragsdata hentet fra data mining. Data mining handler vanligvis om data som er innhentet til et annet formål enn data mining (for eksempel en database med transaksjoner i en bank), noe som betyr at gruvedriftmetoden til data påvirker ikke måten dataene blir samlet inn på. Dette er et av områdene der data mining er forskjellig fra statistikk, og av denne grunn kalles data mining prosessen for en sekundær statistisk prosess. Definisjonen indikerer også at datamengden generelt er stor, men hvis datamengden er liten, er det best å bruke vanlige statistiske metoder for å analysere den.
Når du arbeider med et stort datamengde, oppstår det nye problemer, for eksempel hvordan man kan identifisere forskjellige punkter i dataene, hvordan man kan analysere dataene på rimelig tid og hvordan man kan avgjøre om et tilsynelatende forhold gjenspeiler et faktum i dataenes art. . Vanligvis trekkes data ut som er en del av datasettet, der målet vanligvis er å generalisere resultatene til alle dataene (for eksempel å analysere gjeldende data til forbrukere av et produkt for å kunne forutse fremtidige krav forbrukere). Et av målene med data mining er også å redusere eller komprimere store datamengder for å uttrykke enkle data uten generalisering.