En esta aplicación, encontrará cursos + ejercicios + corrección en detalles sobre Data Waherouse y Data Mining
¿Qué es primero el "Data Warehouse"? :
Es un tipo de base de datos que contiene una gran cantidad de datos para ayudar a tomar decisiones dentro de la organización. Este tipo de base de datos se caracteriza por la conformidad de su estructura interna con lo que el usuario necesita de los indicadores y ejes de análisis en lo que se llama el modelo estrella-estrella, y sus aplicaciones: sistemas soporte de decisiones y minería de datos.
Los almacenes de datos generalmente contienen datos históricos que se han derivado y extraído de los datos de las bases de datos habituales utilizadas en aplicaciones en las que tienen lugar muchas operaciones de entrada y actualización, y los almacenes de datos también pueden contener datos de otras fuentes, como archivos de texto y otros documentos.
¿Qué es "Minería de datos"? :
Es una búsqueda computarizada y manual para el conocimiento de los datos sin suposiciones previas sobre lo que puede ser este conocimiento. La minería de datos también se define como el proceso de analizar una cantidad de datos (generalmente una gran cantidad), para encontrar una relación lógica que resuma los datos de una manera nueva que sea comprensible y útil para el propietario de los datos. . Los "modelos" se denominan relaciones y datos de resumen obtenidos de la minería de datos. La minería de datos generalmente se ocupa de los datos que se han obtenido para un propósito diferente al de la minería de datos (por ejemplo, una base de datos de transacciones en un banco), lo que significa que el método de minería de datos los datos no afectan la forma en que se recopilan los datos en sí. Esta es una de las áreas en las que la minería de datos difiere de las estadísticas y, por esta razón, el proceso de minería de datos se denomina proceso estadístico secundario. La definición también indica que la cantidad de datos es generalmente grande, pero si la cantidad de datos es pequeña, es mejor usar métodos estadísticos regulares para analizarlos.
Cuando se trata con un gran volumen de datos, surgen nuevos problemas, como cómo identificar puntos distintos en los datos, cómo analizar los datos en un tiempo razonable y cómo decidir si una relación aparente refleja un hecho en la naturaleza de los datos. . Por lo general, se extraen los datos que forman parte del conjunto de datos, donde el objetivo suele ser generalizar los resultados a todos los datos (por ejemplo, analizar los datos actuales de los consumidores de un producto para anticipar futuras demandas consumidores). Uno de los objetivos de la minería de datos también es reducir o comprimir grandes cantidades de datos para expresar datos simples sin generalización.