ఈ అనువర్తనంలో మీరు డేటా వాహ్రౌస్ మరియు డేటా మైనింగ్ వివరాలలో కోర్సులు + వ్యాయామాలు + దిద్దుబాటును కనుగొంటారు
మొదట "డేటా వేర్హౌస్" అంటే ఏమిటి? :
ఇది ఒక రకమైన డేటాబేస్, ఇది సంస్థలో నిర్ణయాలు తీసుకోవడంలో సహాయపడటానికి భారీ మొత్తంలో డేటాను కలిగి ఉంటుంది. ఈ రకమైన డేటాబేస్ దాని అంతర్గత నిర్మాణం యొక్క అనుగుణ్యతతో వర్గీకరించబడుతుంది, ఇది స్టార్-స్టార్ మోడల్ అని పిలువబడే విశ్లేషణ యొక్క సూచికలు మరియు గొడ్డలి నుండి వినియోగదారుకు అవసరమైనది మరియు దాని అనువర్తనాలు: వ్యవస్థలు నిర్ణయం మద్దతు మరియు డేటా మైనింగ్.
డేటా గిడ్డంగులు సాధారణంగా చారిత్రక డేటాను కలిగి ఉంటాయి, అవి చాలా ఇన్పుట్ మరియు నవీకరణ కార్యకలాపాలు జరిగే అనువర్తనాలలో ఉపయోగించే సాధారణ డేటాబేస్లలోని డేటా నుండి తీసుకోబడ్డాయి మరియు సేకరించబడతాయి మరియు డేటా గిడ్డంగులు కూడా కలిగి ఉంటాయి టెక్స్ట్ ఫైల్స్ మరియు ఇతర పత్రాల వంటి ఇతర వనరుల నుండి డేటా.
"డేటా మైనింగ్" అంటే ఏమిటి? :
ఈ జ్ఞానం ఏమిటో ప్రాథమిక పరికల్పనలు లేకుండా డేటా యొక్క జ్ఞానం కోసం ఇది కంప్యూటరీకరించిన మరియు మాన్యువల్ శోధన. డేటా మైనింగ్ డేటా యొక్క పరిమాణాన్ని (సాధారణంగా పెద్ద మొత్తంలో) విశ్లేషించే ప్రక్రియగా నిర్వచించబడింది, డేటా యజమానికి అర్థమయ్యే మరియు ఉపయోగకరంగా ఉండే కొత్త మార్గంలో డేటాను సంగ్రహించే తార్కిక సంబంధాన్ని కనుగొనడం. . "మోడల్స్" ను డేటా మైనింగ్ నుండి పొందిన సంబంధాలు మరియు సారాంశ డేటా అంటారు. డేటా మైనింగ్ సాధారణంగా డేటా మైనింగ్ కాకుండా వేరే ప్రయోజనం కోసం పొందిన డేటాతో వ్యవహరిస్తుంది (ఉదాహరణకు, బ్యాంకులో లావాదేవీల డేటాబేస్), అంటే మైనింగ్ పద్ధతి డేటా సేకరించిన విధానాన్ని డేటా ప్రభావితం చేయదు. డేటా మైనింగ్ గణాంకాలకు భిన్నంగా ఉన్న ప్రాంతాలలో ఇది ఒకటి, మరియు ఈ కారణంగా డేటా మైనింగ్ ప్రక్రియను ద్వితీయ గణాంక ప్రక్రియ అంటారు. డేటా మొత్తం సాధారణంగా పెద్దదని నిర్వచనం సూచిస్తుంది, కానీ డేటా మొత్తం చిన్నగా ఉంటే, దానిని విశ్లేషించడానికి సాధారణ గణాంక పద్ధతులను ఉపయోగించడం మంచిది.
డేటా యొక్క పెద్ద పరిమాణంతో వ్యవహరించేటప్పుడు, డేటాలోని విభిన్న పాయింట్లను ఎలా గుర్తించాలి, డేటాను సహేతుకమైన సమయంలో ఎలా విశ్లేషించాలి మరియు స్పష్టమైన సంబంధం డేటా యొక్క స్వభావంలో వాస్తవాన్ని ప్రతిబింబిస్తుందో లేదో ఎలా నిర్ణయించాలి వంటి కొత్త సమస్యలు తలెత్తుతాయి. . సాధారణంగా, డేటా సమితిలో భాగమైన డేటాను సంగ్రహిస్తారు, ఇక్కడ సాధారణంగా డేటా మొత్తానికి ఫలితాలను సాధారణీకరించడం లక్ష్యం (ఉదాహరణకు, భవిష్యత్ డిమాండ్లను to హించడానికి ఒక ఉత్పత్తి యొక్క వినియోగదారుల ప్రస్తుత డేటాను విశ్లేషించడం వినియోగదారులు). డేటా మైనింగ్ యొక్క లక్ష్యాలలో ఒకటి సాధారణీకరణ లేకుండా సాధారణ డేటాను వ్యక్తీకరించడానికి పెద్ద మొత్తంలో డేటాను తగ్గించడం లేదా కుదించడం.
అప్డేట్ అయినది
20 అక్టో, 2024