Nesta aplicação, você encontra cursos, exercícios e correções em detalhes sobre Data Waherouse e Data Mining
O que é o "Data Warehouse" primeiro? :
É um tipo de banco de dados que contém uma enorme quantidade de dados para ajudar a tomar decisões dentro da organização. Esse tipo de banco de dados é caracterizado pela conformidade de sua estrutura interna com o que o usuário precisa dos indicadores e eixos de análise do que é chamado de modelo estrela-estrela e suas aplicações: sistemas suporte a decisões e mineração de dados.
Os data warehouses geralmente contêm dados históricos que foram derivados e extraídos dos dados nos bancos de dados comuns usados em aplicativos nos quais muitas operações de entrada e atualização ocorrem, e os warehouses de dados também podem conter dados de outras fontes, como arquivos de texto e outros documentos.
o que é "mineração de dados"? :
É uma busca manual e informatizada pelo conhecimento dos dados, sem hipóteses preliminares sobre o que esse conhecimento pode ser. A mineração de dados também é definida como o processo de análise de uma quantidade de dados (geralmente uma grande quantidade), para encontrar um relacionamento lógico que resume os dados de uma nova maneira que seja compreensível e útil para o proprietário dos dados. . Os "modelos" são chamados de relacionamentos e dados resumidos obtidos da mineração de dados. A mineração de dados geralmente lida com dados que foram obtidos para uma finalidade diferente da mineração de dados (por exemplo, um banco de dados de transações em um banco), o que significa que o método de mineração de dados não afeta a maneira como os dados são coletados. Essa é uma das áreas em que a mineração de dados difere das estatísticas e, por esse motivo, o processo de mineração de dados é chamado de processo estatístico secundário. A definição também indica que a quantidade de dados geralmente é grande, mas se a quantidade de dados for pequena, é melhor usar métodos estatísticos regulares para analisá-los.
Ao lidar com um grande volume de dados, surgem novos problemas, como identificar pontos distintos nos dados, analisar os dados em um tempo razoável e decidir se um relacionamento aparente reflete um fato na natureza dos dados. . Geralmente, são extraídos dados que fazem parte do conjunto de dados, em que o objetivo geralmente é generalizar os resultados para todos os dados (por exemplo, analisar os dados atuais dos consumidores de um produto para antecipar demandas futuras). consumidores). Um dos objetivos da mineração de dados também é reduzir ou compactar grandes quantidades de dados para expressar dados simples sem generalização.