În această aplicație găsiți cursuri + exerciții + corectare în detalii despre Data Waherouse și Data Mining
Ce este mai întâi „Data Warehouse”? :
Este un tip de bază de date care conține o cantitate uriașă de date pentru a ajuta la luarea deciziilor în cadrul organizației. Acest tip de bază de date se caracterizează prin conformitatea structurii sale interne cu ceea ce utilizatorul are nevoie din indicatorii și axele de analiză în ceea ce se numește modelul stele-stele și aplicațiile sale: sisteme sprijin de decizie și extragere de date.
Depozitele de date conțin de obicei date istorice care au fost obținute și extrase din date din bazele de date obișnuite utilizate în aplicațiile pe care au loc numeroase operațiuni de introducere și actualizare, iar depozitele de date pot conține date din alte surse, cum ar fi fișiere text și alte documente.
ce este „Data Mining”? :
Este o căutare computerizată și manuală a cunoașterii datelor, fără ipoteze preliminare despre ce poate fi această cunoaștere. Minerirea datelor este definită, de asemenea, ca procesul de analiză a unei cantități de date (de obicei o cantitate mare), pentru a găsi o relație logică care să rezume datele într-un mod nou, care să fie înțeles și util proprietarului de date . „Modele” se numesc relații și date sumare obținute în urma extragerii datelor. Minerirea datelor se ocupă în general de datele obținute cu un alt scop decât cel al extragerii de date (de exemplu, o bază de date de tranzacții într-o bancă), ceea ce înseamnă că metoda de exploatare a datele nu afectează modul în care datele în sine sunt colectate. Acesta este unul dintre domeniile în care extragerea de date diferă de statistici și, din acest motiv, procesul de extragere a datelor se numește un proces statistic secundar. De asemenea, definiția indică faptul că cantitatea de date este în general mare, dar dacă cantitatea de date este mică, cel mai bine este să folosiți metode statistice obișnuite pentru a o analiza.
Atunci când aveți de-a face cu un volum mare de date, apar noi probleme, cum ar fi cum să identificați puncte distincte din date, cum să analizați datele într-un timp rezonabil și cum să decideți dacă o relație aparentă reflectă un fapt în natura datelor. . De obicei, datele sunt extrase care fac parte din setul de date, unde obiectivul este de obicei generalizarea rezultatelor la toate datele (de exemplu, analizarea datelor actuale ale consumatorilor unui produs pentru a anticipa cerințele viitoare consumatori). Unul dintre obiectivele extracției de date este, de asemenea, reducerea sau comprimarea unor cantități mari de date pentru a exprima date simple fără generalizare.
Ultima actualizare
20 oct. 2024