इस एप्लिकेशन में आपको डेटा वेयरहाउस और डेटा माइनिंग के विवरण में पाठ्यक्रम + अभ्यास + सुधार मिलता है
"डेटा वेयरहाउस" पहले क्या है? :
यह एक प्रकार का डेटाबेस है जिसमें संगठन के भीतर निर्णय लेने में मदद करने के लिए बड़ी मात्रा में डेटा होता है। इस प्रकार के डेटाबेस की विशेषता इसकी आंतरिक संरचना की अनुरूपता के साथ होती है, जिसमें उपयोगकर्ता को संकेतक और अक्ष के विश्लेषण की आवश्यकता होती है जिसे स्टार-स्टार मॉडल कहा जाता है, और इसके अनुप्रयोग: सिस्टम निर्णय समर्थन और डेटा खनन।
डेटा वेयरहाउस में आमतौर पर ऐतिहासिक डेटा होता है जो अनुप्रयोगों में उपयोग किए जाने वाले सामान्य डेटाबेस में डेटा से व्युत्पन्न और निकाला जाता है, जिस पर कई इनपुट और अपडेट ऑपरेशन होते हैं, और डेटा वेयरहाउस में भी हो सकता है अन्य स्रोतों से डेटा जैसे कि पाठ फ़ाइलें और अन्य दस्तावेज़।
"डेटा माइनिंग" क्या है? :
यह प्रारंभिक ज्ञान परिकल्पना के बिना डेटा के ज्ञान के लिए एक कम्प्यूटरीकृत और मैनुअल खोज है कि यह ज्ञान क्या हो सकता है। डेटा माइनिंग को डेटा की मात्रा (आमतौर पर एक बड़ी राशि) का विश्लेषण करने की प्रक्रिया के रूप में परिभाषित किया जाता है, एक तार्किक संबंध खोजने के लिए जो डेटा को एक नए तरीके से सारांशित करता है जो डेटा स्वामी के लिए समझ और उपयोगी है । "मॉडल" को डेटा माइनिंग से प्राप्त रिश्ते और सारांश डेटा कहा जाता है। डेटा माइनिंग आम तौर पर डेटा के साथ काम करता है जो डेटा माइनिंग के अलावा किसी उद्देश्य के लिए प्राप्त किया गया है (उदाहरण के लिए, बैंक में लेनदेन का डेटाबेस), जिसका अर्थ है कि खनन विधि डेटा उस तरीके को प्रभावित नहीं करता है जिस तरह से डेटा खुद एकत्र किया जाता है। यह उन क्षेत्रों में से एक है जिसमें डेटा माइनिंग आँकड़ों से भिन्न होता है, और इस कारण से डेटा माइनिंग प्रक्रिया को द्वितीयक सांख्यिकीय प्रक्रिया कहा जाता है। परिभाषा यह भी बताती है कि डेटा की मात्रा आम तौर पर बड़ी होती है, लेकिन यदि डेटा की मात्रा छोटी है, तो इसका विश्लेषण करने के लिए नियमित सांख्यिकीय तरीकों का उपयोग करना सबसे अच्छा है।
डेटा की एक बड़ी मात्रा के साथ काम करते समय, नई समस्याएं उत्पन्न होती हैं जैसे कि डेटा में अलग-अलग बिंदुओं की पहचान कैसे करें, उचित समय में डेटा का विश्लेषण कैसे करें और यह कैसे तय करें कि क्या एक स्पष्ट संबंध डेटा की प्रकृति में एक तथ्य को दर्शाता है। । आमतौर पर, डेटा निकाला जाता है जो डेटा सेट का हिस्सा होता है, जहां लक्ष्य आम तौर पर डेटा के सभी परिणामों को सामान्यीकृत करता है (उदाहरण के लिए, भविष्य की मांगों का पूर्वानुमान लगाने के लिए किसी उत्पाद के उपभोक्ताओं के वर्तमान डेटा का विश्लेषण करना। उपभोक्ताओं)। डेटा खनन के लक्ष्यों में से एक सामान्यकरण के बिना सरल डेटा को व्यक्त करने के लिए बड़ी मात्रा में डेटा को कम करना या संपीड़ित करना भी है।
पिछली बार अपडेट होने की तारीख
20 अक्टू॰ 2024