Наука о данных — различия между версиями

(Концепции)
(Дисциплины)
Строка 21: Строка 21:
 
# '''[[Машинное обучение]]'''
 
# '''[[Машинное обучение]]'''
 
# '''[[Интеллектуальный анализ текста]]'''
 
# '''[[Интеллектуальный анализ текста]]'''
# '''Визуализация'''
+
# '''[[Визуализация]]'''
 
# '''[[Большие данные]]'''
 
# '''[[Большие данные]]'''
 
# '''[[Data Ingestion]]'''
 
# '''[[Data Ingestion]]'''

Версия 09:49, 20 мая 2016

Наука о данных (англ. data science, иногда «даталогия» — datalogy) — раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме.

Наука о данных объединяет:

  • методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма,
  • статистические методы,
  • методы интеллектуального анализа данных,
  • приложения искусственного интеллекта для работы с данными,
  • методы проектирования и разработки баз данных.

Рассматривается как академическая дисциплина, а с начала 2010-х годов, во многом благодаря популяризации концепции «больших данных», — и как практическая межотраслевая сфера деятельности, притом специализация «учёного по данным» (англ. data scientist) с начала 2010-х годов считается одной из самых привлекательных, высокооплачиваемых и перспективных профессий.

Дисциплины

Data Science.jpg

  1. Основы
  2. Статистика
  3. Программирование
  4. Машинное обучение
  5. Интеллектуальный анализ текста
  6. Визуализация
  7. Большие данные
  8. Data Ingestion
  9. Data Munging
  10. Программное обеспечение