"データウェアハウスの父 "と呼ばれるコンピュータ科学者のビル・インモン氏によるゲスト投稿です。彼は9言語で65冊の著書を出しており、現在はtextual ETLと呼ばれる技術を構築しています。

その昔、データウェアハウスなど存在しませんでした。企業は、データが統合されていないレガシーシステムに依存しており、互いに通信できないため、データがサイロ化した状態になっていました。なのでこのようなシステムのデータセットを比較するのは、ほとんど不可能でした。ここでは、このトピックについて抑えておくべきことを5つお話します:

  1. データウェアハウスが誕生した当初は、支持をほとんど受けることなく、それを使う人たちだけが、この技術を支持していた。
  2. 企業は、このようなツールがインテリジェンスを生成するのに必要なデータよりも、分析ツールに集中する傾向がある。
  3. データウェアハウスにとって、データは変わらず最も重要な要素である。
  4. 今日、ビジネス上の利点があるにもかかわらず、テキスト分析はあまり信用されていない。
  5. Integrate.ioは、テキストデータを分析用の一元的なレポジトリに移動できるデータウェアハウス統合ソリューションである。

ある日、データウェアハウスのアイデアが浮かんだのに、IT部門からはほとんど支持されず、ベンダーからも、学識経験者からも支持されませんでした。主にマーケティング、セールス、ファイナンスのチームの、データウェアハウスを使う人たちからしか支持されなかったのです。データウェアハウスは、このようなユーザーコミュニティからの熱望から始まり、現代のあらゆる企業にとって標準的なパートとなりました。

本記事では、データウェアハウスの歴史と企業がサイロ化したデータソースから一元化したターゲットシステムへデータ移行をするのにIntegrate.ioがどのようにお手伝いできるかについて詳しくお話します。

目次

  • データウェアハウスは「受け入れ難い提案」だった
  • データウェアハウスの最も重要な構成要素はデータである
  • テキスト分析が支持されない理由
  • Integrate.ioで世界基準のDXを!

データウェアハウスは「受け入れ難い提案」だった

SnowflakeやAmazon Redshiftが登場するずっと以前、データウェアハウスの概念を確立するのは本当に大変なことでした。ウェアハウスの設計には複雑なエンジニアリング作業が必要で、当時は異質な概念であったETL(抽出、変換、格納)もありましたし、データモデルもありました。方法論が必要で、世界がかつて見たことないような大量のデータを扱う必要がありましたし、眠っているデータの認識や管理の必要がありました。

さらにややこしいことに、データマートを構築してデータウェアハウスと呼ぶ人たちまで現れました。多くの人が、データウェアハウスを作っていると思ってデータマートを作っていたのです。

それが終わり、本格的なデータウェアハウスを作るようになると、Cognos、MicroStrategy、Business Objectsなどの分析ベンダーが現れました。しかし、ここで問題が発生します。ウォール街では、データウェアハウスのインフラ企業よりも分析企業の方がはるかに高く評価されていたのです......。

データウェアハウスの最も重要な構成要素はデータである

サンフランシスコのミレニアム・タワーが傾いた時のことが重なります。私が聞いた話では、ある日、このタワーにある100万ドルのアパートのオーナーの一人が、床に大理石を落としたそうです。その大理石は、ビルの壁に向かって転がり始め、ビルが傾いてしまったのです。 それはビルの住人にとって危険なだけでなく、最終的にビルが倒れてしまったら取り壊さなければいけなくなる隣のビルにとっても危険です。もちろん、災害に巻き込まれる哀れな歩行者や露天商は言うまでもないですが。

そのお金をすべて不動産に支払った人々は、「地上に見えるもの」に基づいてお金を使いました。 アパートは本当にクールで魅力的に見えましたが、建物を支える地盤がある地下については、誰一人見ようともしませんでした。

データウェアハウスでもそうです。誰もがデータウェアハウスで作動するクールな分析ツールに目を向けますが、分析ツールがビジネスのインサイトを得るために依存しているデータには見向きもしません。つまり、分析ツールで誤った結果が出始めるまで、誰も気にも留めないのです。

そして、本当に不可解なのは、データウェアハウス環境の構築には、分析環境の構築よりもはるかに多くの労力とリスク、そして濫用が必要だったということです。データウェアハウスが構築されれば、可視化、レポート、キューブなどを簡単に作成することができましたけどね。

Integrate.ioは、ETL、ELT、リバースETL、超高速CDCに対応したデータウェアハウス統合ソリューションです。あなたのビジネス目標に最適なデータ統合方法をお選びください。

テキスト分析が支持されない理由

上記の現象は、今日のテキストデータで起きています。テキストを分析可能なインフラに置くことであるテキストETLは、20年前のデータウェアハウスの確立と同様に、今まさに起きていることなのです。しかし、以前と同じようにあまり信用されず、そして皮肉なことに、前と同じようにITチームからの理解も支持も得られません。ベンチャーキャピタルコミュニティーからのサポートもなく、学問の世界からもない。エンドユーザーだけがテキスト分析を支持しているのです。歴史は繰り返されているのです。

データウェアハウスが驚異的なビジネス価値を出せば、テキスト分析にはさらに大きなビジネスチャンスがあります。データウェアハウスの価値とテキストで具体化された価値を比較するのは、BB弾と手榴弾の威力と爆発力を比較するようなものです。

そして20年後、世界はテキストが企業におけるほとんどのデータとほとんどの決定の基礎を形成していることに気づき、人々は振り返って、あの騒ぎは何だったのだと思うことでしょう。

Integrate.ioで世界基準のDXを!

Integrate.ioは、新しいクラウドベースのエンタープライズデータ統合プラットフォームで、ETL、ELT、超高速CDC、リバースETLを直感的なインターフェースで利用可能です。コード不要の環境で、データ管理チームが新しいデータパイプラインを簡単に作成できるようになり、さらに、ビジネスにとって重要なアプリケーションやSaaSからインサイトをより速やかに得て、それらをビッグデータアーキテクチャに簡単に組み入れることができます。このプラットフォームは、すぐに使える多数の予め構築された接続に加え、インテリジェントなAPIの作成と管理により、データパイプラインを実質無限にすることが可能です。SQLデータベース、Amazon AWS S3バケット、Microsoftアプリケーションデータ、およびビジネスSaaSのすべてのインサイトを、市場で最も革新的なETLツールの1つを使って一つにまとめませんか?

デモやご相談の際は、こちらのリンクへご登録頂けますと幸いです。後ほど弊社担当者よりメールさせて頂きます。