Σε αυτήν την εφαρμογή θα βρείτε μαθήματα + ασκήσεις + διόρθωση σε λεπτομέρειες σχετικά με το Data Waherouse και το Data Mining
Τι είναι το "Data Warehouse" πρώτα; :
Είναι ένας τύπος βάσης δεδομένων που περιέχει έναν τεράστιο όγκο δεδομένων για τη λήψη αποφάσεων εντός του οργανισμού. Αυτός ο τύπος βάσης δεδομένων χαρακτηρίζεται από τη συμμόρφωση της εσωτερικής της δομής με αυτό που χρειάζεται ο χρήστης από τους δείκτες και τους άξονες ανάλυσης σε αυτό που ονομάζεται αστέρι-αστέρι μοντέλο και τις εφαρμογές του: συστήματα υποστήριξη αποφάσεων και εξόρυξη δεδομένων.
Οι αποθήκες δεδομένων συνήθως περιέχουν ιστορικά δεδομένα που έχουν προέλθει και εξαχθεί από δεδομένα στις συνήθεις βάσεις δεδομένων που χρησιμοποιούνται σε εφαρμογές στις οποίες πραγματοποιούνται πολλές εργασίες εισαγωγής και ενημέρωσης και οι αποθήκες δεδομένων μπορούν επίσης να περιέχουν δεδομένα από άλλες πηγές, όπως αρχεία κειμένου και άλλα έγγραφα.
τι είναι το "Εξόρυξη Δεδομένων"; :
Είναι μια μηχανογραφημένη και μη αυτόματη αναζήτηση γνώσης των δεδομένων χωρίς προκαταρκτικές υποθέσεις σχετικά με το τι μπορεί να είναι αυτή η γνώση. Η εξόρυξη δεδομένων ορίζεται επίσης ως η διαδικασία ανάλυσης μιας ποσότητας δεδομένων (συνήθως μεγάλης ποσότητας), για να βρεθεί μια λογική σχέση που συνοψίζει τα δεδομένα με έναν νέο τρόπο που είναι κατανοητό και χρήσιμο για τον κάτοχο των δεδομένων . Τα «μοντέλα» ονομάζονται σχέσεις και συνοπτικά δεδομένα που λαμβάνονται από την εξόρυξη δεδομένων. Η εξόρυξη δεδομένων ασχολείται γενικά με δεδομένα που έχουν ληφθεί για σκοπούς διαφορετικούς από αυτόν της εξόρυξης δεδομένων (για παράδειγμα, βάση δεδομένων συναλλαγών σε τράπεζα), πράγμα που σημαίνει ότι η μέθοδος εξόρυξης Τα δεδομένα δεν επηρεάζουν τον τρόπο συλλογής των ίδιων των δεδομένων. Αυτός είναι ένας από τους τομείς στους οποίους η εξόρυξη δεδομένων διαφέρει από τις στατιστικές και για το λόγο αυτό η διαδικασία εξόρυξης δεδομένων ονομάζεται δευτερεύουσα στατιστική διαδικασία. Ο ορισμός υποδεικνύει επίσης ότι η ποσότητα των δεδομένων είναι γενικά μεγάλη, αλλά εάν η ποσότητα των δεδομένων είναι μικρή, είναι προτιμότερο να χρησιμοποιείτε τακτικές στατιστικές μεθόδους για την ανάλυσή τους.
Όταν ασχολείστε με μεγάλο όγκο δεδομένων, προκύπτουν νέα προβλήματα όπως πώς να προσδιορίσετε διαφορετικά σημεία στα δεδομένα, πώς να αναλύσετε τα δεδομένα σε εύλογο χρονικό διάστημα και πώς να αποφασίσετε εάν μια προφανής σχέση αντικατοπτρίζει ένα γεγονός στη φύση των δεδομένων. . Συνήθως, εξάγονται δεδομένα που αποτελούν μέρος του συνόλου δεδομένων, όπου ο στόχος είναι συνήθως η γενίκευση των αποτελεσμάτων σε όλα τα δεδομένα (για παράδειγμα, ανάλυση των τρεχόντων δεδομένων των καταναλωτών ενός προϊόντος, προκειμένου να προβλέπονται μελλοντικές απαιτήσεις Καταναλωτές). Ένας από τους στόχους της εξόρυξης δεδομένων είναι επίσης η μείωση ή συμπίεση μεγάλων ποσοτήτων δεδομένων για την έκφραση απλών δεδομένων χωρίς γενίκευση.
Ενημερώθηκε στις
20 Οκτ 2024