データ・分析

ETL

イーティーエル

Extract Transform Load データパイプライン
Definition

複数システムからデータを抽出し、整形して、保存先へ読み込む処理。

ETLは、データを抽出(Extract)し、変換(Transform)し、保存先へ投入(Load)する処理の流れを指す。SaaSのデータ基盤では基本概念のひとつ。

広告、CRM、プロダクトログ、決済データなどを一つの分析基盤に集めるためによく使われる。手作業のCSV運用を減らし、継続的な分析をしやすくする。

ETLツールを比較するときは、接続先、変換の柔軟性、失敗時の復旧、スケジュール管理を確認したい。

データ・分析領域では、用語の意味に加えて「どのデータを、誰が、どの粒度で、どの頻度で見るのか」を決めることが大切。SaaS選定では、接続できるデータソース、更新頻度、権限管理、指標定義の共有、エクスポート可否を確認したい。

よくある課題は、ダッシュボードや分析基盤を作っても、元データの定義が揃っていないために意思決定に使えないこと。導入前に、指標の定義、欠損値の扱い、部署間での責任分担を整理しておくと効果が出やすい。