ETLとは?Extract(抽出) Transform(変換) Load(格納)


ETLの概要

ETLとはExtract(抽出) Transform(変換) Load(格納) の略であり、データベースのデータを適切なフォーマットに変換することによりDWHに書きだす課程のことをいいます。

ETL処理をしないとフォーマットや情報元となるデータベースなどがばらばらになっており、DWHに書きだすことができません。

ETLの利点

Hadoopに対応

Hadoop環境において、データを加工するのは相当な知識や技術が必要です。しかしETLツールを使うことにより、Hadoop環境でもデータの加工がしやすくなります。

OracleやMySQLに接続

ETLツールによりますが、多くのETLツールがOracleやMySQLなどの代表的なデータベースに対応しています。

色々なファイルからデータを読み取れる

テキストファイルやExcelからもデータを読み取ることができます。

マッチング

さまざまなデータベースから抽出したデータを結合することができます。

データ出力

テキストファイルやExcelなど、さまざまな種類のファイルに抽出したデータ出力可能です。

メール送信

データを添付したメールを送信することができます。

関連記事
AWS Glueとは?ELT(抽出・変換・書き込み)
AWS Data Exchangeとは?データをサブスクリプション方式で使用