Az Art of Stat: Machine Learning alkalmazás felügyelt és felügyelet nélküli tanulási módszereket tartalmaz, lehetővé teszi az adatok felosztását tanuló- és teszthalmazokra, vizualizálja az összes módszert, beleértve az előrejelzéseket és a hőtérképeket, és lehetővé teszi az algoritmus pontosságának felmérését a zavaró mátrix és egyebek megjelenítésével.
Az eddigi gépi tanulási algoritmusok a következők:
- Többszörös lineáris regresszió (beleértve a kategorikus prediktorokat és az interakciós interakciókat)
- Többszörös logisztikus regresszió (beleértve a kategorikus prediktorokat és az interakciós interakciókat)
- Diszkrimináns analízis (lineáris és kvadratikus)
- Naiv Bayes-analízis
- K-közép klaszterezés
Funkcionalitás:
- Különböző adatkészleteket biztosít (Palmer Penguins, Borminőség, Szívbetegség, Íriszvirágok, Hitelkártya-fizetési késedelmek, ...), vagy lehetővé teszi a felhasználó számára saját CSV-fájl feltöltését
- Adatok felosztása tanuló- és tesztkészletekre
- Jellemzők szabványosítása
- Folyamatos és/vagy kategorikus jellemzők kiválasztása (ahol szükséges)
- Az összes módszer vizualizálása (szóródási diagramok, hőtérképek), előrejelzett címkék vagy utólagos valószínűségek
- Pontosság értékelése a Konfúziós mátrix és a pontossági statisztikák (beleértve a pontosságot és a visszahívást) többféle módon történő megjelenítésével
- Előrejelzések készítése új megfigyelésekre
Előkészítés alatt álló modulok:
- Döntési fák és véletlenszerű erdők
- Legközelebbi szomszéd