Наука о данных

Наука о данных (англ. data science, иногда «даталогия» — datalogy) — раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме.

Наука о данных объединяет:

  • методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма,
  • статистические методы,
  • методы интеллектуального анализа данных,
  • приложения искусственного интеллекта для работы с данными,
  • методы проектирования и разработки баз данных.

Рассматривается как академическая дисциплина, а с начала 2010-х годов, во многом благодаря популяризации концепции «больших данных», — и как практическая межотраслевая сфера деятельности, притом специализация «учёного по данным» (англ. data scientist) с начала 2010-х годов считается одной из самых привлекательных, высокооплачиваемых и перспективных профессий.

Дисциплины

Data Science.jpg

  1. Основы
  2. Статистика
  3. Программирование
  4. Машинное обучение
  5. Интеллектуальный анализ текста
  6. Визуализация
  7. Большие данные
  8. Data Ingestion
  9. Data Munging
  10. Программное обеспечение

Литература