Šajā lietojumprogrammā jūs atradīsit kursus + vingrinājumus + detalizētas korekcijas par Data Waherouse un Data Mining
Kas vispirms ir "datu noliktava"? :
Tas ir datu bāzes tips, kas satur milzīgu datu daudzumu, lai palīdzētu pieņemt lēmumus organizācijas ietvaros. Šāda veida datu bāzēm raksturīga tās iekšējās struktūras atbilstība tam, kas lietotājam vajadzīgs no indikatoriem un analīzes asīm tā dēvētajā zvaigžņu modelī, un tā lietojumiem: sistēmām. lēmumu pieņemšana un datu ieguve.
Datu noliktavās parasti ir vēsturiski dati, kas iegūti un iegūti no datiem parastajās datu bāzēs, kuras izmanto programmās, kurās notiek daudzas ievades un atjaunināšanas operācijas, un datu noliktavās var būt arī datus no citiem avotiem, piemēram, teksta failiem un citiem dokumentiem.
kas ir "datu ieguve"? :
Tas ir datorizēts un manuāls datu zināšanu meklēšana bez iepriekšējām hipotēzēm par to, kādas šīs zināšanas var būt. Datu ieguve tiek definēta arī kā datu daudzuma (parasti liela apjoma) analīzes process, lai atrastu loģisku saikni, kas datus apkopo jaunā veidā, kas ir saprotams un noderīgs datu īpašniekam. . Par modeļiem sauc sakarības un kopsavilkuma datus, kas iegūti datu ieguves rezultātā. Datu ieguve parasti attiecas uz datiem, kas iegūti citam mērķim, nevis datu ieguvei (piemēram, datu bāze par darījumiem bankā), kas nozīmē, ka ieguves metode ir dati neietekmē pašu datu vākšanas veidu. Šī ir viena no jomām, kurā datu ieguve atšķiras no statistikas, un šī iemesla dēļ datu ieguves procesu sauc par sekundāru statistikas procesu. Definīcija arī norāda, ka datu apjoms parasti ir liels, bet, ja datu daudzums ir mazs, to analīzei vislabāk ir izmantot regulāras statistikas metodes.
Apstrādājot lielu datu apjomu, rodas jaunas problēmas, piemēram, kā identificēt atsevišķus datu punktus, kā datus analizēt pieņemamā laikā un kā izlemt, vai acīmredzamā saistība atspoguļo faktu datu būtībā. . Parasti datus iegūst, kas ir daļa no datu kopas, un mērķis parasti ir vispārināt rezultātus visiem datiem (piemēram, analizēt pašreizējos produkta patērētāja datus, lai paredzētu turpmākas prasības). patērētāji). Viens no datu ieguves mērķiem ir arī samazināt vai saspiest lielu datu daudzumu, lai izteiktu vienkāršus datus bez vispārināšanas.
Atjaunināta
2024. gada 20. okt.