In dieser Anwendung finden Sie Kurse + Übungen + Korrekturen in Details zu Data Waherouse und Data Mining
Was ist zuerst "Data Warehouse"? ::
Es handelt sich um eine Art Datenbank, die eine große Datenmenge enthält, um Entscheidungen innerhalb des Unternehmens zu treffen. Diese Art von Datenbank zeichnet sich durch die Übereinstimmung ihrer internen Struktur mit den Anforderungen des Benutzers an die Indikatoren und Analyseachsen des sogenannten Stern-Stern-Modells und seine Anwendungen aus: Systeme Entscheidungsunterstützung und Data Mining.
Data Warehouses enthalten normalerweise historische Daten, die aus Daten in den üblichen Datenbanken abgeleitet und extrahiert wurden, die in Anwendungen verwendet werden, in denen viele Eingabe- und Aktualisierungsvorgänge stattfinden, und Data Warehouses können auch Daten enthalten Daten aus anderen Quellen wie Textdateien und anderen Dokumenten.
Was ist "Data Mining"? ::
Es ist eine computergestützte und manuelle Suche nach Wissen über die Daten ohne vorherige Annahmen darüber, was dieses Wissen sein kann. Data Mining wird auch als der Prozess des Analysierens einer Datenmenge (normalerweise einer großen Menge) definiert, um eine logische Beziehung zu finden, die die Daten auf eine neue Weise zusammenfasst, die für den Dateneigentümer verständlich und nützlich ist . "Modelle" werden als Beziehungen und zusammenfassende Daten bezeichnet, die aus dem Data Mining stammen. Data Mining befasst sich im Allgemeinen mit Daten, die für einen anderen Zweck als den des Data Mining (z. B. eine Datenbank mit Transaktionen in einer Bank) abgerufen wurden. Dies bedeutet, dass die Mining-Methode von Daten haben keinen Einfluss auf die Art und Weise, wie die Daten selbst erfasst werden. Dies ist einer der Bereiche, in denen sich Data Mining von Statistiken unterscheidet. Aus diesem Grund wird der Data Mining-Prozess als sekundärer statistischer Prozess bezeichnet. Die Definition gibt auch an, dass die Datenmenge im Allgemeinen groß ist. Wenn die Datenmenge jedoch klein ist, ist es am besten, regelmäßige statistische Methoden zu verwenden, um sie zu analysieren.
Beim Umgang mit einem großen Datenvolumen treten neue Probleme auf, z. B. die Identifizierung bestimmter Punkte in den Daten, die Analyse der Daten in angemessener Zeit und die Entscheidung, ob eine offensichtliche Beziehung eine Tatsache in der Art der Daten widerspiegelt. . In der Regel werden Daten extrahiert, die Teil des Datensatzes sind. In der Regel besteht das Ziel darin, die Ergebnisse auf alle Daten zu verallgemeinern (z. B. die aktuellen Daten der Verbraucher eines Produkts zu analysieren, um zukünftige Anforderungen zu antizipieren Verbraucher). Eines der Ziele des Data Mining besteht auch darin, große Datenmengen zu reduzieren oder zu komprimieren, um einfache Daten ohne Verallgemeinerung auszudrücken.
Aktualisiert am
20.10.2024