Наука о данных
Наука о данных (англ. data science, иногда «даталогия» — datalogy) — раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме.
Наука о данных объединяет:
- методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма,
- статистические методы,
- методы интеллектуального анализа данных,
- приложения искусственного интеллекта для работы с данными,
- методы проектирования и разработки баз данных.
Рассматривается как академическая дисциплина, а с начала 2010-х годов, во многом благодаря популяризации концепции «больших данных», — и как практическая межотраслевая сфера деятельности, притом специализация «учёного по данным» (англ. data scientist) с начала 2010-х годов считается одной из самых привлекательных, высокооплачиваемых и перспективных профессий.
Дисциплины
- Основы
- Статистика
- Программирование
- Машинное обучение
- Интеллектуальный анализ текста
- Визуализация
- Большие данные
- Data Ingestion
- Data Munging
- Программное обеспечение