RapidMiner

https://www.rapidminer.jp/
機械学習を活用したETLツール
RapidMiner
このページでは、KSKアナリティクスが提供するETLツール、「RapidMiner(ラピッドマイナー)」の特徴や導入事例などをご紹介します。
世界で利用される機械学習リーディングプラットフォーム
RapidMinerは、世界40カ国で利用されている機械学習プラットフォームです(2022年8月調査時点)。ドラッグ&ドロップ操作でデータの加工から評価・運用まで実行することができ、プログラムの知識がなくても高度なデータ分析が行えるようになります。
また、機械学習を活用したモデリング機能により、ツールを使えば使うほどデータ加工の効率を高めることが可能です。
無料で始められるETLツール
RapidMinerには無償版と有償版があり、無料でETL業務の効率化を始めることができます。無償版では扱えるデータファイル(SCV、Excel)やメモリ数(データ10,000行まで無料)に制限はありますが、基本的なデータ加工作業が可能です。はじめてのETLツールとしても採用しやすいのではないでしょうか。
データ数が10,000行を超える場合には、有償版の導入を検討しましょう。有償版に関してはトライアルが用意されており、ダウンロードから30日間は全機能を無料で利用することが可能です。なおRapidMinerは、日本語マニュアルや日本語でのサポートにも対応しているのですが、利用できるのは有償版のみとなっています。
充実のトレーニングプログラム
RapidMinerでは、使い方はもちろんのこと、機械学習の基礎を学んだり実践的なトレーニングができるWebプログラムが用意されています。プログラムは希望の日から1ヶ月間利用することができ、Webにアクセスできる環境さえあればいつでもどこでも学習することが可能です。
学習プログラムは基本的に動画視聴によって進められますが、わからないことがあれば講師に直接質問することもできます。
有償ライセンスでサポートが受けられる
有償ライセンスを購入すれば、サポートを受けられます。
有償ライセンス購入後には、RapidMinerの日本語マニュアルサイトの閲覧、テクニカルQ&Aサイト、ユーザーサポートが利用できます。ユーザーサポートはライセンスキーが発行された際に、問い合わせ専用サイトのURLが案内されます。
使用に関して分からないことがあれば、問い合わせ専用サイトを利用しましょう。内容を確認次第、サポート担当者より回答があります。RapidMinerは充実したサポートで、運用をバックアップします。
RapidMinerでできること
直感的に操作できる
RapidMinerは、直感的に操作できるツールです。完全自動化された環境が提供されるので、初心者にも操作しやすいのが特徴です。エキスパートには、統合されたJupyterLab環境を提供。中間には、視覚的なドラッグ&ドロップデザイナーを提供します。すべての方がアクセスしやすく、操作性に優れています。
データの読み込みと可視化
RapidMinerには、40種類以上のファイルタイプの読み込みが可能です。
- NoSQLデータベースMongoDBとCassandra
- Dropboxなどのクラウドストレージ
- 時系列データ、音声ファイル、画像など
このように、さまざまな種類のデータを読み込み、読み込んだデータを可視化します。可視化機能を使えば、データの傾向や分布の分析などに役立つでしょう。データ前処理は自動化され、組織で再利用できる状態にします。
モデル作成
組織のすべての人が、機械学習モデルを作成できる環境を提供します。モデル作成は「自動モデル作成」「ビジュアルワークフロー」「コードベース」と、スキルに合わせて選べます。どの方法で作業しても、プロセスは透明化されます。
予めテンプレートも用意されており、予測モデル作成が可能です。
モデル管理
モデルを運用し、長期的に監視することで、モデルのパフォーマンスを維持。長期的にビジネス価値を高めます。収益の増加やコストの削減、収益への影響の予測などを実証し、継続的に監視します。ビジネス価値が高まるのは、モデルが稼働してからです。モデル運用によって、価値の高い予測ができます。
AIアプリの構築
コードを書かずにAI主導のインサイトを届けることで、モデルによる変革を推進します。AIアプリの構築は、エンジニアがいなくても業務のアピールができます。結果を理解しやすいものにすることで、相手との信頼関係もサポートしてくれるでしょう。モデルを実践的に理解できるため、組織に与える影響も示せます。周囲とモデルのデータやプロセスをシェアすることで、本当の信頼関係を築くことができるでしょう。
予測や分析結果は、スマホやタブレットでも公開できます。コンテンツは、すべてアプリに含めることが可能です。
コラボレーションカバナンス
プロジェクトやデータは、権限のある人だけが閲覧できます。新しいプロジェクトを開始するたびに、新しい環境を構築。関連する作業はすべて構造化できるため、簡単に参照し、問題解決のために共有できます。
説明可能性と透明性
RapidMinerは、ノーコードの媒体です。すべての段階で、仕事を見せられるプラットフォームです。「モデルがどのように予測しているか」を周囲に理解してもらうには、必要なツールです。
RapidMinerで作成した予測モデルでは、予測値を算出した理由が明らかです。部分的な依存関係も調べられるので、他の属性との相互作用も確認できます。
オーコードアプリを作成することで、モデルの動作を可視化できます。直感的に説明できるので、さまざまな条件がモデルの予測に与える影響を理解するのに容易です。
企業がはじめてETLツールを導入する際は、
自社にマッチした性能であることはもちろん、サポート体制にも着目して選ぶべきです。
こちらのページでは、さまざまなETLツールを比較し、用途別におすすめのETLツールをご紹介しています。
自社に合うETLツールがなかなか見つからなくて悩んでいるなら、ぜひチェックしてみてください。
RapidMinerの対応範囲
ファイル形式
- Microsoft Excel
- csv
- ARFF/XRFF(Weka)
- DBF(dBASE)
- SAV(SPSS),
- SAS
- DTA(Stata)
DB/ストレージ
- Microsoft SQL Server
- Cassandra
- MySQL
- PostgreSQL
- Google Cloud Storage
- MongoDB
PaaS/SaaS
- Dropbox
- Salesforce
- Amazon S3
RapidMinerの操作画面
引用元:https://rapidminer.com/blog/using-rapidminer-kaggle-competitions-part-1/
RapidMinerのサービス紹介動画
RapidMinerの料金プラン
- Studio Free(データ行数~10,000行):無料
- Studio Professional(データ行数~100,000行):要問合せ
- Studio Enterprise(無制限):要問合せ
ETLRecreate
編集チームより
RapidMinerは
こんな企業におすすめ
RapidMinerは、機械学習を利用してデータ加工や分析を行うことができるツールです。10,000文字までなら無料で利用できることから、スモールスタートできるETLツールを探している企業におすすめのETLツールだと言えるでしょう。機械学習は使えば使うほどデータ加工の精度を上げられるため、じっくりと時間をかけて検討してみるのもよいかもしれません。
RapidMinerの導入事例
事例1:手戻りをなくしコストを削減
生産における手戻りの多さが課題となっていた製鋼業のA社では、欠陥を早期発見するシステムとしてRapidMinerを導入しました。
RapidMinerでは、センサーデータを集約して活用し、予測モデルで鋳造と圧延工程をモニタリング。また、同時に時系列の特徴を抽出することで、生産上の問題を特定して手戻りを減少、ひいてはコスト削減を実現しました。
事例2:データサイエンスを社内に普及
組織のDXに取り組むものの、部門間で利用しているツールがバラバラ、かつ専門知識を有するスタッフが少ないことが課題のB社では、データサイエンスを社内に普及させるべくRapidMinerを導入しました。
RapidMinerによって、社内エンジニアの能力を引き出せるようになり、解決できる問題の数を増やせるように。そして、データの可視化機能を活用しモデルを社内に共有することで、部門を超えた問題解決にも着手できるようになりました。
事例3:毎日の手動タスクを
自動化
取り扱うデータが膨大になるにつれ、手作業でのデータ収集を感じていたC社では、毎日の手動タスクを自動化すべくRapidMinerを導入しました。
RapidMinerでは、数回のクリックでデータセットを抽出し比較するモデルを構築。結果、16時間かけていた業務を45秒にまで短縮、かつ手動よりも正確かつタイムリーなレポート作成を行えるようになりました。
ツール開発・運用会社「KSKアナリティクス」について
RapidMinerを提供するKSKアナリティクスは、大阪に本社を置くデータ分析・活用企業です。「誰もがデータ解析を活用できる社会へ」をミッションに、データ分析がビジネスはもちろん、日常生活でも当たり前に活用されるような社会づくりを目指して事業を展開しています。
KSKアナリティクスの基本情報
本社所在地 | 大阪府大阪市西区江戸堀1-18-35 肥後橋IPビル6F |
---|---|
問い合わせ電話番号 | 06-6131-6656 |
業務内容 | 機械学習、統計によるデータ分析活用支援、分析ソフトウェアの開発および販売、データ基盤構築・導入支援・サポート、企業向け分析教育プログラムの提供 |
企業がはじめてETLツールを導入する際は、自社にマッチした性能であることはもちろん、サポート体制にも着目して選ぶべきです。TOPページでは、さまざまなETLツールを比較し、用途別におすすめのETLツールをご紹介しています。自社に合うETLツールがなかなか見つからなくて悩んでいるなら、ぜひチェックしてみてください。
フルマネージドの
国産ETLツール3選
当サイト掲載のELTツールの内、国産かつフルマネージドであり、ETLを主な機能としている3つのツールをピックアップ。それぞれの特徴を紹介しています。また、各システムの導入に向いた企業規模なども記載しています。
直感的な操作、
徹底したサポート体制で、
誰でも使用できる
Reckoner
引用元:Reckoner公式HP(https://reckoner.io/)
料金 | 8万円(税込)/月~ |
---|---|
形式 | クラウド(SaaS) |
- プログラムの知識一切不要で、直感的な操作でデータ連携
- 100種以上のデータベースやSaaSアプリケーションと接続可能
- スケジューリング機能やワークフロー監視機能で、データ転送処理などを自動化・高速化させられる
プロのデータエンジニアが
実務に必要なレベルの
転送機能
trocco
引用元:trocco公式HP(https://trocco.io/lp/index.html)
料金 | 11万円(税込)/月~ |
---|---|
形式 | クラウド(PaaS) |
- データエンジニアリング領域をカバーし、分析基盤構築・運用をサポート
- プロのデータエンジニアが実務に必要なレベルの転送機能を搭載
- Ruby・Python・Java・JavaScriptなどの言語で処理を記述可能
国内外に
複数拠点を持つ大手企業の
導入実績が多数
Waha! Transformer
引用元:Waha! Transformer公式HP(https://waha-transformer.com/)
料金 | 495万円(税込)/年~ |
---|---|
形式 | クラウド(PaaS) |
- 国内においてトップシェアを誇るETLツールで、その導入数は8,000社以上
- 10億件におよぶ大量のデータ処理実績があり、国内外にも拠点をもつ大企業にもマッチする
- 日本語・中国語・英語でのデータ加工処理が可能
【選定条件】
2022年6月10日時点で、「ETLツール」とGoogle検索して表示された25ツールの中から、国産かつ公式HPにフルマネージドの記載があるものの中から、メイン機能がETLである3つのツールを選出。