Այս դիմումում դուք գտնում եք դասընթացներ + վարժություններ + շտկում ՝ մանրամասներ Data Waherouse– ի և Data Mining– ի վերաբերյալ
Ի՞նչ է նախ «Տվյալների պահեստ» -ը: :
Դա տվյալների բազա է, որը պարունակում է հսկայական քանակությամբ տվյալներ ՝ կազմակերպության ներսում որոշումներ կայացնելու համար: Տվյալների բազայի այս տեսակը բնութագրվում է իր ներքին կառուցվածքի համապատասխանության հետ այն բանի, ինչին անհրաժեշտ է օգտագործողը վերլուծության ցուցիչներից և առանցքից, այն, ինչ կոչվում է աստղ-աստղային մոդել, և դրա կիրառությունները. Համակարգեր որոշումների աջակցում և տվյալների հանքարդյունաբերություն:
Տվյալների պահեստները սովորաբար պարունակում են պատմական տվյալներ, որոնք ստացվել և արդյունքից հանվել են այն ծրագրերում, որոնք օգտագործվում են սովորական տվյալների բազաներում, որոնք օգտագործվում են դիմումներում, որոնց վրա կատարվում են մուտքագրման և թարմացման բազմաթիվ գործողություններ, և տվյալների պահեստները կարող են պարունակել նաև այլ աղբյուրներից ստացված տվյալները ՝ տեքստային ֆայլեր և այլ փաստաթղթեր:
ի՞նչ է «Տվյալների հանքարդյունաբերություն»: :
Դա համակարգչային և ձեռքով որոնում է տվյալների իմացության համար ՝ առանց նախնական վարկածների, թե ինչպիսին կարող է լինել այդ գիտելիքը: Տվյալների հանքարդյունաբերությունը սահմանվում է նաև որպես տվյալների քանակության (սովորաբար մեծ քանակությամբ) վերլուծության գործընթաց ՝ գտնելու տրամաբանական փոխհարաբերություն, որը տվյալներն ամփոփում է նոր ձևով, որը հասկանալի և օգտակար է տվյալների սեփականատիրոջը: . «Մոդելները» կոչվում են փոխհարաբերություններ և տվյալների հանքարդյունաբերությունից ստացված ամփոփ տվյալներ: Տվյալների հանքարդյունաբերությունը հիմնականում վերաբերում է այն տվյալների, որոնք ձեռք են բերվել այլ նպատակներով, քան տվյալների հանքարդյունաբերությունը (օրինակ `բանկում գործարքների տվյալների բազան), ինչը նշանակում է, որ հանքարդյունահանման եղանակը տվյալները չեն ազդում տվյալ տվյալների ինքնուրույն հավաքման ձևի վրա: Սա այն ոլորտներից է, որտեղ տվյալների հանքարդյունաբերությունը տարբերվում է վիճակագրությունից, և այդ պատճառով տվյալների հանքարդյունաբերության գործընթացը կոչվում է երկրորդական վիճակագրական գործընթաց: Սահմանման մեջ նշվում է նաև, որ տվյալների քանակը ընդհանուր առմամբ մեծ է, բայց եթե տվյալների քանակը փոքր է, ապա դրա վերլուծության համար ավելի լավ է օգտագործել կանոնավոր վիճակագրական մեթոդներ:
Տվյալների մեծ ծավալի հետ գործ ունենալիս նոր խնդիրներ են առաջանում, ինչպիսիք են ՝ տվյալների մեջ հստակ կետերը պարզելը, ինչպես ողջամիտ ժամկետում տվյալները վերլուծելը և ինչպես որոշելը, թե արդյոք ակնհայտ հարաբերությունը արտացոլում է փաստը տվյալների բնույթով: . Սովորաբար, արդյունահանվում են տվյալներ, որոնք հանդիսանում են տվյալների հավաքածուի մի մաս, որտեղ նպատակը սովորաբար արդյունքների ընդհանրացումն է բոլոր տվյալների վրա (օրինակ ՝ ապրանքի պահանջների կանխատեսման նպատակով ապրանքի սպառողների ընթացիկ տվյալների վերլուծություն: սպառողները): Տվյալների հանքարդյունաբերության նպատակներից մեկը նաև մեծ քանակությամբ տվյալների կրճատումն է կամ սեղմելը `պարզ տվյալների առանց ընդհանրացման:
Վերջին թարմացումը՝
20 հոկ, 2024 թ.