В това приложение ще намерите курсове + упражнения + корекция в подробности за Data Waherouse и Data Mining
Какво е първо „Склад на данни“? :
Това е вид база данни, която съдържа огромно количество данни, за да помогне за вземане на решения в рамките на организацията. Този тип база данни се характеризира със съответствието на вътрешната му структура с това, от което потребителят се нуждае от индикаторите и осите на анализа в това, което се нарича модел-звезда и неговите приложения: системи поддръжка на решения и извличане на данни.
Складовете за данни обикновено съдържат исторически данни, които са получени и извлечени от данни в обичайните бази данни, използвани в приложения, в които се извършват много операции за въвеждане и актуализиране, а складовете с данни също могат да съдържат данни от други източници, като текстови файлове и други документи.
какво е "Извличане на данни"? :
Това е компютърно и ръчно търсене на знания за данните, без предварителни хипотези за това какво могат да бъдат тези знания. Извличането на данни също се дефинира като процес на анализ на количество данни (обикновено голямо количество), за да се намери логическа връзка, която обобщава данните по нов начин, който е разбираем и полезен за собственика на данните , „Модели“ се наричат взаимоотношения и обобщени данни, получени от извличане на данни. Извличането на данни обикновено се занимава с данни, получени с цел, различна от тази на извличането на данни (например база данни за транзакции в банка), което означава, че методът на извличане на данните не влияят на начина, по който самите данни се събират. Това е една от областите, в които извличането на данни се различава от статистиката и поради тази причина процесът на извличане на данни се нарича вторичен статистически процес. Дефиницията също така показва, че като цяло количеството на данните е голямо, но ако количеството данни е малко, най-добре е да използвате редовни статистически методи за анализирането им.
Когато се занимаваме с голям обем данни, възникват нови проблеми като например как да се идентифицират отделни точки в данните, как да се анализират данните в разумен срок и как да се реши дали очевидната връзка отразява факт от естеството на данните. , Обикновено се извличат данни, които са част от набора от данни, където целта обикновено е да се обобщят резултатите за всички данни (например, анализ на текущите данни на потребителите на даден продукт, за да се предвидят бъдещи нужди потребителите). Една от целите на извличането на данни е също така да се намали или компресира големи количества данни за изразяване на прости данни без обобщение.
Актуализирано на
20.10.2024 г.