Дерево принятия решений

Дерево принятия решений (Desicion Tree), Дерево классификации или Регрессионное дерево - средство поддержки принятия решений, использующееся в статистике и анализе данных для прогнозных моделей. Структура дерева представляет собой «листья» и «ветки». На ребрах («ветках») дерева решения записаны атрибуты, от которых зависит целевая функция, в «листьях» записаны значения целевой функции, а в остальных узлах — атрибуты, по которым различаются случаи. Чтобы классифицировать новый случай, надо спуститься по дереву до листа и выдать соответствующее значение. Подобные деревья решений широко используются в интеллектуальном анализе данных. Цель состоит в том, чтобы создать модель, которая предсказывает значение целевой переменной на основе нескольких переменных на входе.

Основные определения

Дерево решений состоит из трёх типов узлов:

  • Узлы решения — обычно представлены квадратами
  • Вероятностные узлы — представляются в виде круга
  • Замыкающие узлы — представляются в виде треугольника

Типология деревьев

Деревья решений, используемые в Data Mining, бывают двух основных типов:

  • Анализ дерева классификации, когда предсказываемый результат является классом, к которому принадлежат данные;
  • Регрессионный анализ дерева, когда предсказанный результат можно рассматривать как вещественное число (например, цена на дом, или продолжительность пребывания пациента в больнице).

См. также