Дерево принятия решений — различия между версиями
Admin (обсуждение | вклад) (→Дерево полезности) |
Admin (обсуждение | вклад) (→Дерево полезности) |
||
Строка 11: | Строка 11: | ||
* '''Анализ дерева классификации''', когда предсказываемый результат является классом, к которому принадлежат данные; | * '''Анализ дерева классификации''', когда предсказываемый результат является классом, к которому принадлежат данные; | ||
* '''Регрессионный анализ дерева''', когда предсказанный результат можно рассматривать как вещественное число (например, цена на дом, или продолжительность пребывания пациента в больнице). | * '''Регрессионный анализ дерева''', когда предсказанный результат можно рассматривать как вещественное число (например, цена на дом, или продолжительность пребывания пациента в больнице). | ||
− | |||
− | |||
− | |||
− | |||
− | |||
[[Категория: Концепции]] | [[Категория: Концепции]] |
Версия 17:53, 23 ноября 2016
Дерево принятия решений (Desicion Tree), Дерево классификации или Регрессионное дерево - средство поддержки принятия решений, использующееся в статистике и анализе данных для прогнозных моделей. Структура дерева представляет собой «листья» и «ветки». На ребрах («ветках») дерева решения записаны атрибуты, от которых зависит целевая функция, в «листьях» записаны значения целевой функции, а в остальных узлах — атрибуты, по которым различаются случаи. Чтобы классифицировать новый случай, надо спуститься по дереву до листа и выдать соответствующее значение. Подобные деревья решений широко используются в интеллектуальном анализе данных. Цель состоит в том, чтобы создать модель, которая предсказывает значение целевой переменной на основе нескольких переменных на входе.
Основные определения
Дерево решений состоит из трёх типов узлов:
- Узлы решения — обычно представлены квадратами
- Вероятностные узлы — представляются в виде круга
- Замыкающие узлы — представляются в виде треугольника
Типология деревьев
Деревья решений, используемые в Data Mining, бывают двух основных типов:
- Анализ дерева классификации, когда предсказываемый результат является классом, к которому принадлежат данные;
- Регрессионный анализ дерева, когда предсказанный результат можно рассматривать как вещественное число (например, цена на дом, или продолжительность пребывания пациента в больнице).