ETL — различия между версиями
Admin (обсуждение | вклад) (Новая страница: «'''ETL''' (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один и…») |
Admin (обсуждение | вклад) м |
||
Строка 10: | Строка 10: | ||
Перемещение данных от источника к получателю называют '''потоком данных'''. Требования к организации потока данных описываются аналитиком. ETL следует рассматривать не только как процесс переноса данных из одного приложения в другое, но и как инструмент подготовки данных к анализу. | Перемещение данных от источника к получателю называют '''потоком данных'''. Требования к организации потока данных описываются аналитиком. ETL следует рассматривать не только как процесс переноса данных из одного приложения в другое, но и как инструмент подготовки данных к анализу. | ||
+ | |||
+ | == См. также == | ||
+ | * [[Data Ingestion]] | ||
[[Категория:Практики]] | [[Категория:Практики]] |
Текущая версия на 15:41, 14 ноября 2016
ETL (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении хранилищами данных, который включает в себя:
- извлечение данных из внешних источников;
- их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели;
- загрузка их в хранилище данных.
С точки зрения процесса ETL, архитектуру хранилища данных можно представить в виде трёх компонентов:
- источник данных: содержит структурированные данные в виде таблиц, совокупности таблиц или просто файла (данные в котором разделены символами-разделителями);
- промежуточная область: содержит вспомогательные таблицы, создаваемые временно, и, исключительно для организации процесса выгрузки.
- получатель данных: хранилище данных или база данных, в которую должны быть помещены извлечённые данные.
Перемещение данных от источника к получателю называют потоком данных. Требования к организации потока данных описываются аналитиком. ETL следует рассматривать не только как процесс переноса данных из одного приложения в другое, но и как инструмент подготовки данных к анализу.