SnowflakeとOracle Autonomous Data Warehouseは、企業内に存在するすべてのデータのSSOT(single source of truth)を提供するクラウドデータウェアハウスです。このウェアハウスのいずれかを使って、BI(ビジネスインテリジェンス)ツールでデータ処理を実行し、意思決定のためのインサイトを自動化できますが、どちらを技術スタックに加えるべきでしょうか。この記事では、SnowflakeとOracleの違い、選択したウェアハウスにデータを転送する方法について説明します。

Snowflakeとは

Snowflakeは、クラウド向けに構築されたデータウェアハウスです。複数のソースからのデータを一元管理し、チームの力となるビジネス・インサイトの実行ができます。

Oracleとは

Oracleには、Oracle Exadata Cloud Serviceで利用できるクラウドデータウェアハウスとオンプレミスウェアハウスがあります。今回の比較では、クラウドサービスを見ていきます。

Snowflakeと同様、オラクルは分析データ活動のための一元的な場所を提供し、企業がビッグ・データからトレンドやパターンを特定しやすくします。

価格設定

SnowflakeとOracleのクラウドデータウェアハウスは、消費したデータ量に対してのみ支払う従量課金モデルを採用しています。このモデルは、大量のデータがある場合には高くつきますが、Snowflakeはクエリを実行していないときはクラスタが停止し、クエリが再び実行されると再開されることから、長期的にはSnowflakeの方が費用を抑えられるかもしれません。

使いやすさ

Snowflakeは、すべてのアップグレード、修正、およびセキュリティ機能を自動的に適用するため、作業負荷が軽減されます。一方、Oracleは通常、何らかのデータベース管理者を必要とするため、企業内のデータウェアハウス費の増加の可能性があり、ビジネスニーズに合わせてデータウェアハウスを拡張する場合にも、同様の問題が発生します。Snowflakeデータウェアハウスは、パーティション、インデックス作成、およびその他のデータ管理タスクを自動的に管理しますが、Oracleでは通常、スケーラビリティ関連の変更を実行するのにデータベース管理者が必要です。SnowflakeとOracleを比較する際には、こういった違いを考慮すると良いでしょう。

特徴

SnowflakeとOracleの機能についてはどうでしょう。Oracleは、そのウェアハウス内で機械学習アルゴリズムの構築と実行が可能であり、分析目的には信じられないほど有効ですが、Snowflakeにはこの機能がないため、ユーザーはアルゴリズムの実行のために、スタンドアローンの機械学習プラットフォームへの投資が必要です。また、Oracleはカーソルをサポートしており、データのプログラミングが簡単にできます。

一方、Snowflakeには自動クエリパフォーマンス最適化機能が統合されており、多くの設定を弄ることなく簡単にデータをクエリできます。

データの安全性

SnowflakeとOracleは、データの暗号化、IPブロックリスト、多要素認証、アクセス制御、PCI DSS(クレジットカード業界の情報セキュリティ基準)などのデータセキュリティ標準への準拠などの機能により、データセキュリティに真剣に取り組んでいます。

データガバナンス

ユーザーは、SnowflakeやOracleへのデータ転送の際に、データガバナンスの原則を認識しなければいけません。GDPR(一般データ保護規則)やHIPAA(デジタル化された医療情報に関するプライバシー保護・セキュリティ確保について定めた米国の法律)などの法律があるということは、データソースとウェアハウス間で機密情報を不正に移動させた場合、企業は高額な罰則を受ける可能性があるということです。どちらのプラットフォームも、データ品質ルールとデータスチュワードのワークフローを管理する機能を備えており、データガバナンスは適切に処理されます。

使用前に考慮すべきこと

SnowflakeとOracleは分析に有効なデータウェアハウスですが、どちらも習得が難しく、多くの企業が大変な思いをしているようです。
というのも、企業はこのウェアハウスでデータを運用する際に、SQL(Structured Query Language)などのコーディングの知識が必要となり、ソースと選択したウェアハウス間のデータ転送をスムーズに行うには、データエンジニアが必要となるからです。

SnowflakeまたはOracleにデータを移動するには、通常、 ETL (抽出、変換、格納)と呼ばれるプロセスが必要です。つまり、ユーザーは、RDB(リレーショナルデータベース)、トランザクションデータベース、CRMシステム、ERPシステム、またはその他のデータプラットフォームなどのソースからのデータ抽出が必要ということです。
データ抽出後、ユーザーはデータを分析に適した形式に変換してから、SnowflakeまたはOracleへの格納が必要です。別のデータ統合オプションは、ELT(抽出、格納、転送)で、ユーザーはデータを抽出し、SnowflakeまたはOracleに格納してから、そのデータを適切な形式に変換します。

ETLやELTなどのデータ統合は非常に複雑であるため、特定のスキルが必要ですが、Integrate.ioのAPI管理サービスは、この課題を解決します。Integrate.ioは、データソースとSnowflakeまたはOracleを、ライブ、ドキュメント化、標準化されたREST APIで接続し、データウェアハウスに代わる手段を提供します。

Integrate.ioでできること

SnowflakeとOracleのどちらのプロバイダーも、企業内のリアルタイムデータの運用と分析をサポートする素晴らしいデータウェアハウスを提供しています。Snowflakeは、クエリを実行していないときはクラスタを一時停止することができるため、使いやすく、コストも低く抑えられるかもしれません。一方、Oracleはカーソルをサポートし、機械学習機能が内蔵されており、ワークロードから高度なインサイトをプログラムして生成するのをサポートします。

また、SnowflakeとOracleを、Amazon(AWS) Redshift、Microsoft Azure、Google BigQueryなどの他のデータウェアハウスと比較するのも良いでしょう。どのオプションを選択するにしても、あなたのビジネスがどのようにデータをウェアハウスに転送したいのか・しなければならないのかを考えてみましょう。

Integrate.ioのオープンソースソリューションでは、SnowflakeまたはOracle REST APIを30秒で作成することができます。必要なのはデータウェアハウスの認証情報だけで、OpenAPIドキュメントの生成や、キーによるAPIの保護など、あとはIntegrate.ioが引き受けます。

14日間無料トライアル、デモ、ご相談は、こちらのリンクより初回ヒヤリングをご予約頂けますと幸いです。後ほど、弊社担当者よりご連絡させて頂きます。