Статистика
Статистика — отрасль знаний, в которой излагаются общие вопросы сбора, измерения и анализа массовых статистических (количественных или качественных) данных; изучение количественной стороны массовых общественных явлений в числовой форме.
Описательная статистика
Основные статистические показатели можно разделить на две группы:
- Меры среднего уровня дают усредненную характеристику совокупности объектов по определенному признаку
- Среднее значение
- Стандартная ошибка
- Стандартное отклонение
- Эксцесс
- Асимметрия
- Интервал
- Минимум
- Максимум
- Счёт
- Медиана
- Мода
- Квантиль
- Математическое ожидание
- Доверительный интервал
- Меры рассеяния показывают, насколько хорошо данные значения представляют данную совокупность
- Дисперсия случайной величины
- Среднеквадратическое отклонение
- Размах вариации
- Интерквантильный размах
- Среднее абсолютное отклонение
Статистические методы
- Регрессионный анализ (Regression analysis)
- Outline of regression analysis - Techniques for modeling and analyzing several variables, when the focus is on the relationship between a dependent variable and one or more independent variables
- Analysis of variance (ANOVA)
- General linear model
- Generalized linear model
- Оценка плотности (Density estimation)
- Kernel density estimation
- Multivariate kernel density estimation
- Временные ряды (Time series)
- Time series Analysis
- Box–Jenkins
- Frequency domain
- Time domain
- Мультивариантный анализ (Multivariate analysis)
- Метод главных компонент (Principal component analysis, PCA) - один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации.
- Факторный анализ (Factor analysis) — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки.
- Кластерный анализ (Сluster analysis) — многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы
- Робастность (Robust statistics) — метод, направленный на выявление выбросов, снижение их влияния или исключение их из выборки.
Теория вероятностей
- Probability
- Conditional probability
- Law of large numbers
- Центральная предельная теорема (Central limit theorem) - класс теорем, утверждающих, что сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые масштабы (ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада), имеет распределение, близкое к нормальному.