Sa application na ito nahanap mo ang mga kurso + ehersisyo + pagwawasto sa mga detalye sa Data Waherouse at Data Mining
Ano ang unang "Data Warehouse"? :
Ito ay isang uri ng database na naglalaman ng isang malaking halaga ng data upang makatulong na gumawa ng mga pagpapasya sa loob ng samahan. Ang uri ng database na ito ay nailalarawan sa pamamagitan ng kaayon ng panloob na istraktura sa kung ano ang kailangan ng gumagamit mula sa mga tagapagpahiwatig at axes ng pagsusuri sa tinatawag na modelo ng star-star, at ang mga aplikasyon nito: mga system suporta ng desisyon at pagmimina ng data.
Ang mga bodega ng data ay karaniwang naglalaman ng makasaysayang data na nakuha at nakuha mula sa data sa karaniwang mga database na ginamit sa mga aplikasyon kung saan naganap ang maraming mga operasyon sa pag-input at pag-update, at ang mga bodega ng data ay maaari ding maglaman data mula sa iba pang mga mapagkukunan tulad ng mga file ng teksto at iba pang mga dokumento.
ano ang "Data Mining"? :
Ito ay isang computer at manu-manong paghahanap para sa kaalaman ng data nang walang paunang mga hypotheses sa kung ano ang maaaring kaalaman. Ang pagmimina ng data ay tinukoy din bilang proseso ng pagsusuri ng isang dami ng data (karaniwang isang malaking halaga), upang makahanap ng isang lohikal na relasyon na nagbubuod ng data sa isang bagong paraan na mauunawaan at kapaki-pakinabang sa may-ari ng data . Ang mga "modelo" ay tinatawag na mga ugnayan at data ng buod na nakuha mula sa pagmimina ng data. Ang pagmimina ng data ay karaniwang tumutukoy sa data na nakuha para sa isang layunin maliban sa pagmimina ng data (halimbawa, isang database ng mga transaksyon sa isang bangko), na nangangahulugang ang pamamaraan ng pagmimina ng ang data ay hindi nakakaapekto sa paraan ng pagkolekta ng data mismo. Ito ay isa sa mga lugar kung saan naiiba ang mga pagmimina ng data mula sa mga istatistika, at sa kadahilanang ito ang proseso ng pagmimina ng data ay tinatawag na pangalawang istatistika. Ipinapahiwatig din ng kahulugan na ang dami ng data sa pangkalahatan ay malaki, ngunit kung ang dami ng data ay maliit, mas mahusay na gumamit ng regular na mga istatistikong pamamaraan upang masuri ito.
Kapag nakitungo sa isang malaking dami ng data, ang mga bagong problema ay lumitaw tulad ng kung paano matukoy ang mga natatanging puntos sa data, kung paano pag-aralan ang data sa isang makatuwirang oras at kung paano magpapasya kung ang isang maliwanag na relasyon ay sumasalamin sa isang katotohanan sa likas na katangian ng data. . Karaniwan, ang data ay nakuha na bahagi ng set ng data, kung saan ang layunin ay karaniwang gawing pangkalahatan ang mga resulta sa lahat ng mga data (halimbawa, pagsusuri sa kasalukuyang data ng mga mamimili ng isang produkto upang maasahan ang hinaharap na mga kahilingan. mga mamimili). Ang isa sa mga layunin ng pagmimina ng data ay din upang mabawasan o i-compress ang malaking halaga ng data upang maipahayag ang mga simpleng data nang walang pagbubuo.
Na-update noong
Okt 20, 2024