Amazon RDS/AWS Redshift/AWS S3

https://aws.amazon.com/jp/rds/
Amazon RDS、AWS、Redshift、S3について
Amazon AWS(Amazon Web Services)
Amazon AWSはAmazon.comの子会社であるAmazon Web Serviceが提供するクラウドプラットフォームで、Amazonが提供しているサーバ、データベース、ストレージなど数百以上の機能サービスをクラウド上で利用することができます。
サーバなどのインフラ設備だけでなく、OSやミドルウェアまで提供されているため、スムーズにソフトウェア開発を行うことができます。多数の機能を自由に組み合わせて利用できる柔軟性や拡張性が特徴で、使い慣れたプログラミング言語やソフトウェアを利用してAWS上で動作するアプリケーションを構築することができます。
Amazon RDS(Amazon Relational Database Service)
AWSが提供するRDBMS(分散リレーショナルデータベース)の1つです。クラウド上でセットアップから運用まで簡単にデータベース構築を行うことができ複数のDBエンジンから好きなものを選んで利用できます。初期費用は無料の従量課金制となっています。利用できるDBエンジンにはOracle、MySQL、MariaDB、SQL Server、PostgreSQL、Amazon Auroraなどがあります。
Amazon Redshift
AWSが提供するクラウド型ペタバイトスケールの高速データウェアハウスサービスです。フルマネージドで数百ギガバイトからペタバイト以上まで拡張可能で、Amazonの分析基盤として活用されています。
Amazon S3(Amazon Simple Storage Service)
AWSが提供するサービスのひとつでデータ容量を気にすることなく保存可能なオブジェクトストレージサービスで、アプリケーションやウェブサイトのデータバックアップ、アーカイブなどに利用されています。S3にはオブジェクトにメタデータタグを追加するアノテーション機能、ビッグデータ分析・実行機能、データモニタリングする機能など様々な機能が搭載されています。
企業で使われるAmazon RDS、AWS、Redshift、S3の基本的な構成
AWSのクラウドサービスを利用することで世界中の企業、政府機関、スタートアップなどがコスト削減やイノベーションを実現しています。AWSにはフルマネージドのETLツールAWS Glueも提供されています。動作環境はAWS Glue側から提供され、導入のためのサーバなどを用意する必要もありません。
ETLツールとして利用するための組み合わせ例は様々ありますが、シンプルなものとしてはAmazon S3や他のデータベースやクローラーからの大量のデータをAWS Glueで抽出・収集し、変換・加工したうえでDWHとしてAmazon Redshiftに送出するという構成になります。
AWSクラウドサービスとETL活用で期待できること
AWSのクラウドサービスでETLを活用するメリットには、企業内に点在するデータを統合的に管理できる、複雑だったデータ連携作業が簡略化できる、環境構築や開発にかかっていたコストを削減できる、データ連携作業におけるミスがなくなる、分析のためのデータ精度を確保できることなどがあります。またデータを同じAWS上のDWHにロードできることで、効率的で的確なデータ分析が可能になります。
AWSクラウドサービスの利用で業務が改善した事例
1日6,900万人の顧客データを高速に分析
米国のハンバーガーチェーンマクドナルドでは1日あたり6,900万人の顧客データから迅速にビジネスインサイトを得るためにAmazon RedshiftなどAWSで提供されているサービスを利用して分析環境を構築。当初のパフォーマンス目標を66%以上超え、毎秒8,600件のトランザクション処理を実現。膨大なデータを高速分析することで増大する顧客ニーズに的確に対応できるようになりました。
分析速度の向上で分析精度が
アップ
全国3,000店舗、年間4億人が訪れる総合ファミリーレストランすかいらーくではマーケティング部門で必要となるレシート明細レベルの分析の時間を短縮し分析精度を高めるためにAmazon RedshiftなどAWS上のクラウドサービスを利用してデータ分析環境を構築。オンプレミスなら1年以上かかる環境を約3ヶ月で構築しました。
どのようなETLツールを導入すべきか
AWS上のRDS、Redshift、S3は様々なETLツールとの連携も可能なので、予算や機能を見極めて自社にあった分析システムを構築するようにしましょう。はじめてETLツールを導入する場合には、性能が自社にマッチしているだけでなく、サポート体制もしっかり確認して選ぶようにしましょう。こちらではAmazon RDS、Redshift、S3などのサービスに対応したETLツールを紹介しています。
フルマネージドの
国産ETLツール3選
当サイト掲載のELTツールの内、国産かつフルマネージドであり、ETLを主な機能としている3つのツールをピックアップ。それぞれの特徴を紹介しています。また、各システムの導入に向いた企業規模なども記載しています。
直感的な操作、
徹底したサポート体制で、
誰でも使用できる
Reckoner
引用元:Reckoner公式HP(https://reckoner.io/)
料金 | 8万円(税込)/月~ |
---|---|
形式 | クラウド(SaaS) |
- プログラムの知識一切不要で、直感的な操作でデータ連携
- 100種以上のデータベースやSaaSアプリケーションと接続可能
- スケジューリング機能やワークフロー監視機能で、データ転送処理などを自動化・高速化させられる
プロのデータエンジニアが
実務に必要なレベルの
転送機能
trocco
引用元:trocco公式HP(https://trocco.io/lp/index.html)
料金 | 11万円(税込)/月~ |
---|---|
形式 | クラウド(PaaS) |
- データエンジニアリング領域をカバーし、分析基盤構築・運用をサポート
- プロのデータエンジニアが実務に必要なレベルの転送機能を搭載
- Ruby・Python・Java・JavaScriptなどの言語で処理を記述可能
国内外に
複数拠点を持つ大手企業の
導入実績が多数
Waha! Transformer
引用元:Waha! Transformer公式HP(https://waha-transformer.com/)
料金 | 495万円(税込)/年~ |
---|---|
形式 | クラウド(PaaS) |
- 国内においてトップシェアを誇るETLツールで、その導入数は8,000社以上
- 10億件におよぶ大量のデータ処理実績があり、国内外にも拠点をもつ大企業にもマッチする
- 日本語・中国語・英語でのデータ加工処理が可能
【選定条件】
2022年6月10日時点で、「ETLツール」とGoogle検索して表示された25ツールの中から、国産かつ公式HPにフルマネージドの記載があるものの中から、メイン機能がETLである3つのツールを選出。