Додаток «Мистецтво статистики: Машинне навчання» містить методи навчання з учителем та без учителя, дозволяє розділяти дані на навчальні та тестові набори, візуалізує всі методи, включаючи прогнози та теплові карти, а також дозволяє оцінювати точність вашого алгоритму, показуючи матрицю плутанини тощо.
Включені алгоритми машинного навчання на даний момент включають:
- Множинна лінійна регресія (включаючи категоріальні предиктори та взаємодії)
- Множинна логістична регресія (включаючи категоріальні предиктори та взаємодії)
- Дискримінантний аналіз (лінійний та квадратичний)
- Наївний байєсівський аналіз
- Кластеризація K-середніх
Функціональність:
- Надає різні набори даних (пінгвіни Палмера, якість вина, хвороби серця, квіти ірисів, дефолти за кредитними картками тощо) або дозволяє користувачеві завантажувати власний CSV-файл
- Розділяє дані на навчальні та тестові набори
- Стандартизує ознаки
- Вибирає безперервні та/або категоріальні ознаки (де це доречно)
- Візуалізує всі методи (діаграми розсіювання, теплові карти), передбачувані мітки або апостеріорні ймовірності
- Оцінює точність, відображаючи матрицю плутанини та статистику точності (включаючи точність та повноту) кількома способами
- Робить прогнози для нових спостережень
Модулі в підготовці:
- Дерева рішень та випадкові ліси
- Найближчий сусід