Наука о данных — различия между версиями
Admin (обсуждение | вклад) (→Дисциплины) |
Admin (обсуждение | вклад) м (→Дисциплины) |
||
Строка 16: | Строка 16: | ||
#* [[OLAP]] | #* [[OLAP]] | ||
#* [[ETL]] | #* [[ETL]] | ||
− | # '''Статистика''' | + | # '''[[Статистика]]''' |
# '''Программирование''' | # '''Программирование''' | ||
#* [[R]] | #* [[R]] |
Версия 11:12, 23 мая 2016
Наука о данных (англ. data science, иногда «даталогия» — datalogy) — раздел информатики, изучающий проблемы анализа, обработки и представления данных в цифровой форме.
Наука о данных объединяет:
- методы по обработке данных в условиях больших объёмов и высокого уровня параллелизма,
- статистические методы,
- методы интеллектуального анализа данных,
- приложения искусственного интеллекта для работы с данными,
- методы проектирования и разработки баз данных.
Рассматривается как академическая дисциплина, а с начала 2010-х годов, во многом благодаря популяризации концепции «больших данных», — и как практическая межотраслевая сфера деятельности, притом специализация «учёного по данным» (англ. data scientist) с начала 2010-х годов считается одной из самых привлекательных, высокооплачиваемых и перспективных профессий.
Дисциплины
- Основы
- Статистика
- Программирование
- Машинное обучение
- Интеллектуальный анализ текста
- Визуализация
- Большие данные
- Data Ingestion
- Data Munging
- Программное обеспечение