Snowflake

https://www.snowflake.com/
Snowflakeについて
SnowflakeはSaaS型(インターネット経由で提供されるクラウドサービス)のデータウェアハウス(DWH)で、アメリカ、モンタナ州で2012年に創業されたSnowflake Inc.によって提供されています。コンピューティングとストレージを分離した独自アーキテクチャで複数の大規模ワークロードを並列処理できることが大きな特徴となっています。
クラウドサービスのAWS(Amazon Web Services)、GCP(Google Cloud Platform)、Microsoft Azure上で利用できますが、マルチクラウド的に複数のクラウドサービスを横断して利用することや、自社サーバのオンプレミス環境での利用はできません。
高速データ処理、高度なセキュリティ、データ量に応じた料金体系、フルマネージドサービス(インフラのサービス提供者による管理)などのメリットがあることから利用する企業が増えています。
Snowflakeが企業で使われるシーンとメリット
ばらばらなデータを1つのDBで管理可能
従来のデータウェアハウスはデータがサイロ化され散らばってしまっているという問題がありました。同じ会社でも部署が違えば使用アプリなども違うので保存データの形式が異なるため分析などに利用する時にはデータ変換の必要がありました。Snowflakeを導入することで複数システムに分散したデータを同じ形式にして1つのデータベースで管理できるようになります。
データ量に応じた料金体系で無駄がない
企業で扱うデータ量や種類は際限なく増大していきます。従来のデータウェアハウスでは容量が足りず新規導入や拡張することで莫大なコストがかかることになります。Snowflakeは構造化データだけでなく非構造化データも扱うことができ、データを効率的に圧縮して格納します。データ量に応じた料金体系が採用されているので使う量に応じた費用だけで済み無駄がありません。
フルマネージドなので管理業務が不要
インフラをサービス側が管理してくれるフルマネージドなので、自社でハードやソフトウェアを保有する必要がなく、面倒なインフラ管理、アップデートやバックアップ作業も不要です。Snowflakeの利用で膨大な時間がかかる管理業務が不要となるため分析や集計などの業務に専念することができます。
SnowflakeとETLツールの連携で期待できること
ETLツールの利用でファイル、データベースやストレージ、SnowflakeなどのSaaS型データウェアハウス、広告、SNSなど様々なデータソースからのデータを目的に合わせて抽出・変換し、DWHへ書きだすことが可能となります。企業では様々なデータを簡単に活用することができるようになります。
バラバラな社内データを
統合できる
一般的な企業ではCRM、顧客管理システムなど複数のシステムやデータベースを利用しているので各部署にバラバラなデータが点在する状態になっています。ETLツールでデータ統合することで、自社の現状把握やデータ分析をスムーズに行えるようになります。
分析のためのデータ品質がアップする
異なるデータソースのデータは同じ意味でも形式が異なるためBI ツールなどで分析をする前に目視で形式を修正する必要があります。ETLツールを利用することでスピーディーなデータ変換可能になるだけでなく、精度の高いデータで分析できるようになります。
GUIとマウスで簡単にシステム構築可能
通常、様々なデータを連携させて分析するにはプログラムの開発が必要となりますが、ETLツールならプログラムは不要です。GUIとマウス操作で簡単にシステムを構築できます。
ETLツールとSnowflakeの連携で業務が改善した事例
ITLとツールとSnowflakeで分析環境を構築しボトルネックを解消
メディア・ゲーム・インターネット広告事業を展開するサイバーエージェントでは自社で分析システムを構築、運用していましたが、新サービスリリースやフォーマット変更対応に工数がかかる、様々な連携先からのデータ収集が困難、システム管理が属人化するといった問題を抱えていました。ITLツールとSnowflakeで分析環境を構築することで、様々なボトルネックを解消することができました。
どのようなETLツールを導入すべきか
企業がETLツールを初めて導入する場合、自社にあった性能であるということはもちろんですが、しっかりとしたサポート体制があることも重要です。導入する際には、これらに着目して選ぶようにしましょう。こちらではSnowflakeに対応したETLツールを紹介しています。
フルマネージドの
国産ETLツール3選
当サイト掲載のELTツールの内、国産かつフルマネージドであり、ETLを主な機能としている3つのツールをピックアップ。それぞれの特徴を紹介しています。また、各システムの導入に向いた企業規模なども記載しています。
直感的な操作、
徹底したサポート体制で、
誰でも使用できる
Reckoner
引用元:Reckoner公式HP(https://reckoner.io/)
料金 | 8万円(税込)/月~ |
---|---|
形式 | クラウド(SaaS) |
- プログラムの知識一切不要で、直感的な操作でデータ連携
- 100種以上のデータベースやSaaSアプリケーションと接続可能
- スケジューリング機能やワークフロー監視機能で、データ転送処理などを自動化・高速化させられる
プロのデータエンジニアが
実務に必要なレベルの
転送機能
trocco
引用元:trocco公式HP(https://trocco.io/lp/index.html)
料金 | 11万円(税込)/月~ |
---|---|
形式 | クラウド(PaaS) |
- データエンジニアリング領域をカバーし、分析基盤構築・運用をサポート
- プロのデータエンジニアが実務に必要なレベルの転送機能を搭載
- Ruby・Python・Java・JavaScriptなどの言語で処理を記述可能
国内外に
複数拠点を持つ大手企業の
導入実績が多数
Waha! Transformer
引用元:Waha! Transformer公式HP(https://waha-transformer.com/)
料金 | 495万円(税込)/年~ |
---|---|
形式 | クラウド(PaaS) |
- 国内においてトップシェアを誇るETLツールで、その導入数は8,000社以上
- 10億件におよぶ大量のデータ処理実績があり、国内外にも拠点をもつ大企業にもマッチする
- 日本語・中国語・英語でのデータ加工処理が可能
【選定条件】
2022年6月10日時点で、「ETLツール」とGoogle検索して表示された25ツールの中から、国産かつ公式HPにフルマネージドの記載があるものの中から、メイン機能がETLである3つのツールを選出。