En aquesta aplicació trobareu cursos + exercicis + correcció en detalls sobre Data Waherouse i Data Mining
Què és primer "Data Warehouse"? :
És un tipus de base de dades que conté una quantitat enorme de dades per ajudar a prendre decisions dins de l’organització. Aquest tipus de base de dades es caracteritza per la conformitat de la seva estructura interna amb el que l’usuari necessita dels indicadors i eixos d’anàlisi en el que s’anomena model estrella-estrella i les seves aplicacions: sistemes suport a la decisió i mineria de dades.
Els magatzems de dades solen contenir dades històriques que han estat derivades i extretes de dades de les bases de dades habituals utilitzades en aplicacions en què es produeixen moltes operacions d’entrada i actualització, i els magatzems de dades també poden contenir dades d'altres fonts, com ara fitxers de text i altres documents.
què és "Data Mining"? :
És una cerca informatitzada i manual de coneixement de les dades sense hipòtesis previ sobre què pot ser aquest coneixement. La mineria de dades també es defineix com el procés d’analitzar una quantitat de dades (normalment una gran quantitat), per trobar una relació lògica que resumeixi les dades d’una manera nova que sigui comprensible i útil per al propietari de les dades. . Els "models" s'anomenen relacions i dades resumides obtingudes a partir de la mineria de dades. La mineria de dades tracta generalment dades que s’han obtingut amb una finalitat diferent a la de la mineria de dades (per exemple, una base de dades de transaccions en un banc), cosa que significa que el mètode de mineria de les dades no afecten la manera de recollir les dades en si. Aquesta és una de les àrees en què la mineria de dades es diferencia de les estadístiques, i per això el procés d’explotació de dades s’anomena procés estadístic secundari. La definició també indica que la quantitat de dades és generalment gran, però si la quantitat de dades és petita, el millor és utilitzar mètodes estadístics periòdics per analitzar-la.
Quan es tracta d’un gran volum de dades, sorgeixen nous problemes com ara identificar punts diferents de les dades, com analitzar les dades en un temps raonable i com decidir si una relació aparent reflecteix un fet en la naturalesa de les dades. . Normalment, s’extreuen dades que formen part del conjunt de dades, on l’objectiu és generalitzar els resultats a totes les dades (per exemple, analitzar les dades actuals dels consumidors d’un producte per tal d’anticipar futures demandes. consumidors). Un dels objectius de la mineria de dades és també reduir o comprimir grans quantitats de dades per expressar dades senzilles sense generalitzar.
Data d'actualització:
20 d’oct. 2024