Stitch も Integrate.io も、最も一般的なデータベースやデータウェアハウス、SaaSサービス、およびアプリケーション間のデータ統合を目的としてデザインされた、クラウドベースの ETL(抽出、変換、格納)および ELT プラットフォームです。両者共、ポイント&クリックのインターフェース、ノーコード/ローコードの ETL ツール、そして多種多様なネイティブコネクタがあり、どちらも ETL 分野における品質と信頼性において高い評価を得ています。

両プラットフォームの類似点を考慮した上で、どのように選択すればいいでしょうか?そこで本記事で両者を比較して、このソリューションが互いに対してどのように評価されるかをしっかり見てみましょう。

概要:Stitch と Integrate.io

Stitch の概要 

ETL ソリューションに関して言えば、Stitch はより軽量の「EL」側に重点を置いており、最小限のプリロードデータ変換機能で、軽量のデータ抽出と格納を処理します。また、Stitchは データ転送量が非常に少ない無料層、データ量ベースの料金体系、初心者に優しい UI(ユーザーインターフェース)により、大量のデータを扱っておらず、熟練した IT 部門やデータエンジニアリング部門を利用できない小規模企業に最適です。

大企業や成長中のスタートアップ企業は、Stitch を利用する際にいくつかの課題に直面する可能性があります。Stitch のボリュームベースの価格体系は、月ごとに予測できないことがあるため、中規模から大規模の企業や、大量の ETL プロセスが必要な企業にとっては、予算の問題が生じる可能性があります。とはいえ、Stitch はデベロッパーに優しい統合プラットフォームであり、データ要件が低く、インパイプラインでのデータ変換がいらない中小企業向けには優れたソリューションがあります。

Integrate.io の概要

市場には、ノーコードローコードの ETL プラットフォームがいくつかありますが、そのような初心者に優しいプラットフォームの多くには、エンタープライズグレードの ETL ソリューションのパワーと大量データ機能がなく、逆にエンタープライズグレードのプラットフォームは、ほとんどが使い方が難しく、IT スタッフはさらなる負担を強いられます。

Integrate.io は、ETL のこの2つの側面の完璧なバランスを実現しています。洗練されたエンタープライズグレードの統合プラットフォームにある最先端の ETL(抽出、変換、格納)機能とともに、直感的なポイント&クリックのインターフェースを初心者に提供することで、かつては経験豊富なデータエンジニアだけの領域であった複雑なデータパイプラインを誰でもサッと構築できるようになります。

 

また、Integrate.io では、Salesforce のデータを抽出し、それを変換して Salesforce に戻すこともでき、これは CRM(顧客関係管理)や BI(ビジネスインテリジェンス)のために Salesforce のデータに大きく依存している企業にとってユニークな利点となります。

料金は、Integrate.io はコネクタごとに定額制を採用しているため、毎月の請求額は一定であり、エンタープライズは、追加料金を心配することなく、データ量を無制限に実行できます。

Stitch と Integrate.io の概要がわかったところで、両プラットフォームのユニークな点を掘り下げてみましょう。

UI(ユーザーインターフェース)

Stitch の UI

Stitch の視覚的なポイント&クリックのインターフェースは、初心者にとって使いやすいプラットフォームであるはずですが、Stitch はデベロッパーを念頭に置いて作られたとも言われており、ETL 初心者のニーズとデベロッパーのニーズのバランスを取るために、使いやすさが犠牲になっており、それで初心者は行き詰ってしまうかもしれません。

thumbnail image

(画像出典:Stitch Data)

以下は、Stitch UI についてのユーザーの声です:

Stitch へのデータ送信は簡単でしたが、データウェアハウスへの接続はそれほど簡単ではありませんでした。接続先を選んで指示に従うだけでいいのですが、その設定ステップについてきちんと説明されていないように感じました。

Stitch の UI を使うと、どのテーブルを複製するか、どのように複製するかを簡単に設定できます。

Integrate.io の UI

Integrate.io には、直感的なドラッグ&ドロップ式のインターフェースがあり、初心者から熟練コーダーまで簡単に ETL を行えるようにデザインされています。ETL の知識がなくても、Integrate.io を使ってデータフィールドの確定、API パラメーターの作成、ヘッダーの命名、コンソリデーション用の主キーの設定、データフローの頻度の確定を行うことができ、SQL、Python、Java のコーディングスキルがあるデータエンジニアは、Integrate.io を使って、好きな言語で ETL プロセスをコーディングすることもできます。また、サポートについては、Integrate.io のサポートチームが、初心者が必要な統合とデータパイプラインのセットアップを行えるようにサポートします。

thumbnail image

以下は、Integrate.io の UI についてのユーザーの声です:

Integrate.io の使いやすいインターフェースのおかげで、技術に詳しくないチームメンバーでも、ETL ジョブやスケジュールの作成および編集ができるようになりました。Integrate.io を使うことで、パートナーのデータの強化や変換ができ、様々なデータストリームをどのように構造化してどのように利用するかに柔軟性が加わります。Integrate.io だとこれが簡単にできるんです。

Integrate.io は、アナリストやエンジニアが複数のデータ ソースに基づいていてもカスタム変換ジョブを数分で展開できるような、初心者向けと熟練者向けの完璧な中間に位置しています。 UI は直感的ですが、いつでも SQL を使ってソースをフィルターしたり、スケジュールされたパッケージに新しいセットを作成したりできますし、組み込み関数も豊富に用意されています。

Integrate.io により、これまでカスタム ソフトウェアを使ったデータ統合パイプラインの作成に縛られていた開発リソースを解放できました。 Integrate.io でこの問題が解決されて、大幅に少ないリソースであっという間に同じ結果を達成できるため、今まで使っていたものはもう必要なくなりました。

1. UX がすごくいい。2. 他のエンタープライズ ETL ツールとは違い、あらゆる機能と操作性がシンプル化されている。3. インフラのマネージドサービスは、Integrate.io の USP(独自のセールスポイント)である。

統合

Stitch のコネクタと統合

Stitch には、さまざまなプラットフォームやデータソースとの自動統合を確立するための、さまざまな事前構築済みコネクタがあります。また、REST API のコネクタも含まれているため、REST API を公開しているほぼすべてのソース/デスティネーションに接続できます。

Stitch は、以下などの最も一般的なデータウェアハウスのオプションと統合します:

  • Amazon Redshift
  • Snowflake
  • Microsoft Azure
  • Google BigQuery

以下は、Stitch にある統合サービスのサンプルです:

thumbnail image

(画像出典:Screenshot

あと、Stitch では、統合ツールである Talend スイートを通じて「 Singer」というオープンソースプラットフォームにアクセスすることができ、そこでカスタムの REST API の統合を構築し、他のコミュニティメンバーと共有することができます。そしてこのオープンソースの統合共有プラットフォームで、Stitch の統合機能が拡張されます。

以下は、Stitch との統合についてのユーザーの声です:

多くの統合サービスがあり、ほとんどの ”上位の” サービスは十分にサポートされています。

見たいコネクタがまだいくつかありますが、これは必ずしも Stitch のせいではないかもしれません。また、フィールドの追加や削除だけでなく、統合の追加や削除など、誰が変更を行っているのかをもっとよく監査してほしいです。

Integrate.io のコネクタと統合

Integrate.io には、さまざまなデータソースやプラットフォームとの自動統合を設定するための、同様の様々なネイティブコネクタがあります。また、Stitch のように、Integrate.io には REST API のコネクタが含まれているため、REST API を公開しているソースやデスティネーションとの間でどんなデータでも プル/プッシュ することができます。

データウェアハウスとの統合に関しては、Integrate.io は、以下のような最も広く使用されているデータウェアハウスとの間でデータフローを確立します:

  • Amazon Redshift
  • Snowflake
  • Microsoft Azure
  • Google BigQuery

以下は、Integrate.io が提供する統合サービスの一部です:

thumbnail image

(画像出典:Integrate.io)

Stitch と Integrate.io の大きな違いに、Integrate.io のネイティブの Salesforce 間でのコネクタがあります。 この統合により、Salesforce からデータを抽出してそれを変換し、Salesforce に再度格納することができますが、これは Stitch では実行できません。実際、この双方向の Salesforce 統合は、通常 MuleSoft や IBM App Connect などの最大かつ最も高価な ETL/統合/ESB(エンタープライズサービスバス)プラットフォームでのみ利用できます。 そしてこのような巨大なプラットフォームは、使いにくくて正常に動かすには広範なトレーニングが必要であり、おそらく組織に必要な、或いは組織の支払い分よりも多くのサービスや機能が含まれています。

そこで Integrate.io を使えば、Salesforce の双方向統合を難なく経済的に実現でき、ETL 初心者でも、以下の簡単なステップで Salesforce間の双方向統合を実現できます:

  • Integrate.io のコード不要のポイント&クリックのインターフェースを使って、Salesforce とデータウェアハウス間の接続を設定する。
  • Salesforce からデータを取り出してそれを変換し、変更後に Salesforce に格納し直す。

また、Integrate.io の Salesforce 統合では、サードパーティの情報を Heroku Postgres に格納し、Heroku Connect を使って Salesforce にパイプしたり、単純に直接 Salesforce に送信することもできます。あとは、Salesforce からデータを引き出してそれをパイプライン内で変換したり、他のデータと結合してからデータウェアハウスにその情報を格納することができます。

ネイティブコネクタに加えて、Integrate.io は、過去にクライアントに向けてカスタマイズした既製の統合の大規模なライブラリを残しているので、一般的でない API に接続する必要がある場合に、その接続しようとしている API に対して、過去に行われた接続を Integrate.io のチームがそのライブラリから検索します。尚、希望するエンドポイント用の過去の統合が存在しない場合は、Integrate.io の統合担当が、Integrate.io のネイティブ REST API コネクタを使って、そのエンドポイント用のカスタム接続を作成する方法を案内してくれます。

以下は、Integrate.io の REST API のコネクタに関するレビュアーのコメントです:

ネイティブのコネクタがない場合は、REST API のコネクタでまかなえますし、サポートチームがいつでも必要に応じてお手伝いしてくれます。また、サポートチームと包括的なドキュメントが、作業を代わりにやってくれるのではなく、こちらが希望通りに事を運ぶ方法を習得するのをサポートすることに重点を置いているのもいいですね。これで、習得したことを別の用途にも活用できるようになりました。

SQL、REST API、Salesforce SOQL を扱った経験はほとんどありませんでしたが、Salesforce の SQL データベースへの接続、レポート、ストレージ、分析が数週間できました。これで浮いた時間と得られたインサイトは、貴重なものとなりました。

パイプライン内のデータ変換

Stitch のパイプライン内 / プリロード のデータ変換

Stitch のプラットフォームは、「パイプライン内のデータ変換 」にはあまり重点が置かれておらず、その代わりに、ETL の「E(抽出)と L(格納)」の部分に重点が置かれていることから、プリロード変換はあまりありません。プリロード変換をネスト構造の解除やデータベース スタイルの変換などの基本的なタスクに限定することで、変換の負担の大部分をユーザーの手に委ねています。

以下に、Stitch にパイプライン内での変換オプションがないことについてのレビュアーのコメントがあります:

厳密に言えば「T(変換)」ではありませんが、Stitch は、ほとんどの軽/中規模のデータ ウェアハウスのニーズには十分対応できます。

ETL の「T」がありませんが、場合によっては、若干の「T(変換)」が必要です。

Integrate.io のパイプライン内 / プリロード のデータ変換

Integrate.io には、フィルタ(Filter)、結合(Join)、選択(Select)、制限(Limit)、クローン(Clone) などの幅広いプリロード変換があり、コードを一行も書くことなく設定することができます。また、Integrate.io のポイント&クリックのインターフェースにより、ETL の経験がない初心者でも、データウェアハウスやその他のデスティネーションに格納する前にデータを変換するパイプラインをデザインすることができます。

さらに、Integrate.io の使いやすいワークフローシーケンスツールにより、一連の変換タスクを自動で実行するパッケージをセットアップできます。例えば、データフローパッケージや SQL クエリのトリガーとなる条件列を、プラットフォームの直感的で視覚的なドロップダウン式インターフェースで設定することができます。

Integrate.io での変換ワークフローのセットアップは、以下のようにとても簡単です:

  1. メインメニューの [Packages(パッケージ)]を選択する。
  2. [New Packages(新規パッケージ)]を選択する。
  3. ドロップダウンから [Workflow(ワークフロー )]を選択する。
  4. 続く一連のタスクを選択する。
  5. さまざまなアクションをトリガーする条件を選択する。

以下は、Integrate.io のパイプライン内変換についてのユーザーのコメントです:

内蔵されているデータを変換する方法もたくさんあります。例えば、私のデータベースにはユーザーエージェントの文字列がありますが、Integrate.io だとそれをブラウザのバージョンやデバイスの種類、その他の個別のカラムに簡単に変換することができます。あと、ジョブのスケジューリングは、あまり技術的でないユーザーにとっても、crontabs に慣れているユーザーにとっても、とても直感的です。

アンドリュー R.

セキュリティおよび暗号化

Stitch のセキュリティおよび暗号化

Stitch では、データの安全な保管のために、以下のセキュリティおよび暗号化システムを使用しています:

  • データベースや SaaS 統合などの外部システムにアクセスするための認証情報を全て暗号化。
  • 転送中と静止時の両方でデータを暗号化。
  • HTTP API から抽出されたデータに対してSSL/TLS 暗号化を使用し、さまざまなデータベースの SSL暗号化に対応。
  • データベースからデータを抽出する際のネイティブのデータベース暗号化の使用、または SSHトンネルの使用。
  • エンタープライズ版のみ、VPN とリバースSSH トンネル接続に対応。

Integarte.io のセキュリティおよび暗号化

Integrate.io は、データの安全を保つために、以下のセキュリティと暗号化機能を使用しています:

  • Integrate.io の全マイクロサービスと Web サイトの SSL/TLS 暗号化に対応。
  • Integrate.io プラットフォーム上で、静止時および転送時のすべての顧客データを暗号化。
  • セキュリティ証明書と暗号化アルゴリズムの継続的な検証。
  • ファイアウォールベースのアクセス制御による、内部および外部ネットワークからのデータへのアクセスの全面拒否。アクセスの許可には、さまざまなポート/プロトコルへの特定のアクセスの割り当てが必要。
  • データの暗号化と復号化に、フィールドレベルの暗号化ツールの使用。
  • Integrate.io のスタッフとして承認されたメンバーのみが、Integrate.io の オペレーティングシステムにアクセス可能。

コンプライアンス

Stitch のコンプライアンス

Stitch は、国境を越えた EUデータ転送のための最新の DPA(データ処理補遺条項)などの GDPR(EU一般データ保護規則)のコンプライアンスの基準を満たしています。また、米国EU間および米国スイス間のプライバシーシールドプログラムの認証も取得しています。ただし、Stitch のユーザーが自動的に SOC 2(Service Organization Control Type 2)や HIPAA(医療保険の相互運用性と説明責任に関する法律)コンプライアンスの恩恵を受けられるわけではなく、それらのコンプライアンスに対応するには、Stitch のエンタープライズエディションへの追加料金が必要がです。

Integrate.io のコンプライアンス

Integrate.io は SOC 2 および HIPAA コンプライアンスの基準を満たしています。また、最新の GDPR 基準にも準拠しており、国境を越えた EUデータ転送のための最新の DPA も含まれています。そして、Integrate.ioは Amazon AWSデータセンターでホスト/管理されているため、同社のプラットフォームは以下の認定を取得しています: ISO 27001、FISMA Moderate、PCI Level 1、SOX(Sarbanes-Oxley)。

カスタマーサポート

Stitch のカスタマーサポート

Stitch には、エンタープライズエディションにプレミアム料金を支払わない限り、電話、音声、ビデオチャットのサポートはなく、下位層では、テキストベースのチャットによるサポートのみが可能です。なので、経験の浅い ETL 初心者だと、Stitch の高価格層に加入しないと、サポートのためにその筋の専門家を別個で雇わないといけなくなる可能性があります。

ただ、以下のオンラインレビューによると、Stitch エンタープライズのカスタマーサポートの質は高いようです:

質問したときに、チームはビックリするほど親切にサポートしてくれました。

Integrate.io のカスタマーサポート

Integrate.io には、「技術経験の有無にかかわらず、誰もが Integrate.io のプラットフォームを使って、あらゆるデータソースとの間で複雑かつ強力なデータ統合をセットアップできるようにすべきである」という理念があり、Integrate.io のカスタマーサポートチームは、このビジョン実現のために重要な役割を担っています。

Integrate.io のどのクラスのプランにも、統合スペシャリストによる無制限の電話、ビデオ通話、メール、テキストチャットのサポートが含まれており、電話でもビデオチャットでも、担当の Integrate.io の統合専門が、必要な統合、データパイプライン、変換のセットアッププロセスを案内してくれます。

ちなみにオンラインレビューでは、Integrate.io のサポートは「ほぼリアルタイム」で、「これまで経験した中でも最高レベル」と以下のように評価されています:

Integrate.io の一番いいところは、チームからのほぼリアルタイムのサポートであり、そこが他とは違うところです。製品自体も良いものですし、高いレベルで使いやすいです。Integrate.ioのスタッフは、クラウドの提案には珍しく、他とは一線を画しています。顔の見えない機械を相手にするのとはいい違いです。

カスタマーサポートは、これまで経験した中で一番です。Integrate.io を使っていて問題が発生するたびに、とても迅速に対応してくれました。さらに、開発チームも非常に迅速で、私が使っている API のページネーションを2日足らずで実装してくれました。

Integrate.io という ETL および ELT のプラットフォームで、データチームは大いに助けられました。全体的に最も優れている点は、私の会社がクライアントとしてどれだけ大切にされているかという点であり、これは多くの ETL 企業には見られないことです。他にも多くの会社を探しましたが、Integrate.io を選んで良かったです。

料金構造

Stitch の料金体系

Stitch の 料金は、抽出および格納するデータ量に応じて課金され、これによって、Stitch では低額でプラットフォームの利用を開始できます。また、月に500万行のデータまでは無料です。ただ、データ転送の規模が大きくなり始めると月額料金は高騰し、あまりに多くのデータを取り込むと、ビジネスとしては手が出なくなることさえあります。Stitch の料金は、毎月の使用量に応じて金額に変動があるため、予測が難しいことがあります。

ちなみに、Stitch には2週間の無料トライアルがあります。

以下は、Stitch の価格についてのユーザーの声です:

特に Facebook 広告などのアトリビューション期間が大きい場合、ニーズに応じてレプリケーションのコストが高くなる可能性があるため、それに応じてレプリケーションの頻度を調整してください。 行数の要件を過大評価し、より低いコミットメントでテストするようにしてください。

Stitchはインポートしたデータ量に応じて課金されるので、ある時点になると、おそらく社内で統合を構築する人を雇った方が安上がりでしょう。ETL が本当に重要で、外注したくない大企業には不向きです。

Integrate.io の料金設定

Integrate.io は、可能な限りシンプルな料金設定にしており、データの格納の量やサイズによって課金するのではなく、コネクタごとに定額で課金します。Integrate.io だと、企業は、コネクタの追加が必要でない限り、固定された予測可能な料金を維持でき、コネクタを追加する場合でも、接続にかかる追加コストを正確に把握できるため、それに応じて予算を立てることができます。

あと、Integrate.io には2週間の無料トライアルがあり、ユーザーはクレジットカードなしでこのトライアルにサインアップすることができるので、トライアルの間は何らかの契約に縛られるようなことはありません。

以下は、Integrate.io の価格についてのユーザーの声です:

Integrate.io のサービスのコストは、その正確さ、一貫性、時間の節約に十分見合っています。Salesforce などの CRM システムのデータを SQL データベースやその中間に接続したいと考えている人にはオススメです。

大量のリアルタイム統合を実行していないのであれば、コスパはいいです。

Stitch と Integrate.io についてのまとめ

ここまでお読みいただき、Integrate.io と Stitch の様々な特徴や特性、そして両者のプラットフォームが互いにどのような位置づけにあるかについて、明確なイメージをお持ちいただけたと思います。

経験豊富なデータ エンジニア チームのニーズを満たすと同時に、ETL 初心者でも特別なトレーニングなしでデータ パイプラインの構築や、データ接続の確立ができる ETL プラットフォームを探している場合は、Integrate.io の統合スペシャリストによるデモをご予約いただき、Integrate.io をご体験頂くことをお勧めします。

Integrate.io の低いコーディング要件、優れたサポート、高度なデータ変換機能は、デベロッパー、データエンジニア、ビジネスアナリスト、マーケティング担当者が同じツールを使って ETL 処理を行えるということです。パワフルでセキュアな ETL パイプラインの構築がいかに簡単か、きっと驚かれることでしょう。