Во оваа апликација најдете курсеви + вежби + корекција во детали за податоци за податоци и податоци за рударство
Што е прво „Магацин на податоци“? :
Тоа е еден вид база на податоци што содржи огромна количина на податоци што помагаат да се донесат одлуки во рамките на организацијата. Овој вид база на податоци се карактеризира со сообразност на нејзината внатрешна структура со она што му е потребно на корисникот од индикаторите и оските на анализата во она што се нарекува модел на starвезда и неговите апликации: системи поддршка на одлуки и рударство на податоци.
Магацините со податоци обично содржат историски податоци што се добиени и извлечени од податоците на вообичаените бази на податоци користени во апликациите на кои се одвиваат многу операции за внесување и ажурирање, а складиштата за податоци можат да содржат и податоци од други извори, како што се текстуални датотеки и други документи.
што е „податоци за рударство“? :
Тоа е компјутеризирана и рачна потрага по познавање на податоците без претходна хипотеза за тоа какво знаење може да биде. Рударството на податоци е исто така дефинирано како процес на анализа на количина на податоци (обично голема количина), за да се најде логичен однос што ги сумира податоците на нов начин што е разбирлив и корисен за сопственикот на податоците . „Модели“ се нарекуваат врски и збирни податоци добиени од податоци за рударство. Рударството на податоци генерално се занимава со податоци добиени за друга цел освен за рударство на податоци (на пример, база на податоци за трансакции во банка), што значи дека методот на рударство на податоците не влијаат на начинот на собирање на самите податоци. Ова е една од областите во кои рударството на податоци се разликува од статистиката, и од оваа причина процесот на рударство на податоци се нарекува секундарен процес на статистика. Дефиницијата исто така укажува на тоа дека количината на податоци генерално е голема, но ако количината на податоци е мала, најдобро е да се користат редовни статистички методи за да се анализираат.
Кога се работи со голем обем на податоци, се појавуваат нови проблеми како да се идентификуваат различни точки во податоците, како да се анализираат податоците во разумно време и како да се одлучи дали очигледен однос одразува факт во природата на податоците. . Обично, се извлечени податоци што се дел од сетот на податоци, каде што целта е обично да се генерализираат резултатите до сите податоци (на пример, анализа на тековните податоци на потрошувачите на производот со цел да се предвидат идните побарувања потрошувачи). Една од целите на рударството на податоци е исто така да се намалат или компресираат големи количини на податоци за да се изразат едноставни податоци без генерализација.