„Art of Stat: Machine Learning“ programėlėje yra prižiūrimo ir neprižiūrimo mokymosi metodai, ji leidžia suskirstyti duomenis į mokymo ir testavimo rinkinius, vizualizuoti visus metodus, įskaitant prognozes ir šilumos žemėlapius, ir įvertinti algoritmo tikslumą rodant painiavos matricą ir kita.
Iki šiol įtraukti ML algoritmai apima:
- Daugybinę tiesinę regresiją (įskaitant kategorinius prognozuotojus ir sąveikų sąveikas)
- Daugybinę logistinę regresiją (įskaitant kategorinius prognozuotojus ir sąveikų sąveikas)
- Diskriminantinę analizę (tiesinę ir kvadratinę)
- Naivųjį Bajesą
- K vidurkių klasterizaciją
Funkcionalumas:
- Pateikia įvairius duomenų rinkinius (Palmer Penguins, vyno kokybė, širdies ligos, vilkdalgių žiedai, kredito kortelių įsipareigojimų neįvykdymas ir kt.) arba leidžia vartotojui įkelti savo CSV failą
- Duomenų padalijimas į mokymo ir testavimo rinkinius
- Funkcijų standartizavimas
- Nuolatinių ir (arba) kategorinių savybių pasirinkimas (jei reikia)
- Visų metodų (išsklaidymo diagramų, šilumos žemėlapių), numatomų žymų arba aposteriorinių tikimybių vizualizavimas
- Tikslumo įvertinimas, įvairiais būdais rodant painiavos matricą ir tikslumo statistiką (įskaitant tikslumą ir atkūrimą)
- Naujų stebėjimų prognozių sudarymas
Ruošiami moduliai:
- Sprendimų medžiai ir atsitiktiniai miškai
- Artimiausio kaimyno analizė