集計・分析ツールの進化

 

Excel

データの規模が小さい内は、原始データを直接Excel などの表計算ツールで集計し、グラフ表示することもできました。  

SQL

やがてデータの規模が大きくなるにつれて、データベースを利用した、もっと効率のよい集計処理が行われるようになり、その時にデータベースを操作する手段が、「SQL」という、一種のプログラム言語だったのです。

ではこれらのツールを使って、どのような集計が行われたのでしょうか。 「業績を上げるための分析」ですから、販売データをいろんな角度(切り口)から見る必要があるでしょう。

  • どの部署がいくら売っているのか
  • 誰がいくら売っているのか
  • 何がいくら売れているのか
  • どの顧客にいくら売れているのか

等々   このように、販売分析にはデータをいろいろな角度から集計する必要があります。 

従ってデータベースのユーザーはその都度SQLを操作しなければなりませんでした。

この工程の効率を大きく改善してくれたのがBIツールの出現です。  

BIツール (BI:Business Intelligenceビジネスインテリジェンス)

BIとは、データを組織的・系統的に蓄積・加工して、そこからビジネスの意思決定に役立つ情報を抽出して利用しようとすること、またはその仕組みをいいます。

BIツールには、ユーザーがSQLを使わずとも簡単にデータベースから集計できる手段が用意されました。

そして、データを見る角度を切り替えながら分析できる環境も提供してくれました。

その仕組みが「キューブ(サイコロ)」と呼ばれるものです。b2b101

右の図は3次元キューブの例です。 このキューブは、「いつ、どの顧客に、どの商品がいくら売れたか」というデータの固まりで、BIツールがデータベースからデータを抽出・集計して作り出したものです。(この例の時間軸は月別と仮定)  

このキューブのA面から見ると、そこには「ある月の顧客別商品別実績表」があり、B面には「ある商品の顧客別月別実績表」が見えることになります。

このように、見る面を指定することによってデータを見る角度を変えることを「ダイシング」といいます。(ダイスはサイコロのこと。サイコロを転がすと見える面が変わるという意味)

今度はA面を見ながら、時間軸のある値でキューブをA面と平行に切ってみましょう。 すると断面には、別の月の顧客別商品別実績表が現れるはずです。

このように、キューブをある軸の値で切り取って(スライス)断面を見ることを「スライシング」といいます。

BIツールにはこのほかにも、より詳細に条件を絞り込みながらデータを集計していく、「ドリルダウン」という機能も搭載されています。

なお、実際のキューブはもっと多くの「次元」を扱うことができ、各軸の値もユーザーが自由に指定できるようになっています。  

見える化

BIツールの普及とともに、その集計結果を集計表だけではなくグラフやチャートに表現する「見える化」という言葉が生まれ、一世を風靡しましたが、現在ではもう当たり前のこととして、特に強調されることはなくなりました。  

ビッグデータ

IT技術の進歩は、大量の販売データの高速処理を実現しただけではなく、販売データ以外の様々な形式のデータ(非定形データ)も含めて分析できる環境を提供してくれました。

たとえば顧客の「購買履歴」である販売データ(定型データ)と、「その顧客がWeb上のどのページ・項目を閲覧したか」という閲覧記録も一緒に分析すれば、その顧客の好みや関心がよりはっきり見えてくるでしょう。

このように多様な形式のデータが混在する、大規模なデータの集合体を「ビッグデータ」といい、通常デーウエアハウスに蓄積されていきます。

またビッグデータの利用が急速に進んでいる背景には、インターネットの普及と、各種「センサーやカメラ」の進歩があります。

インターネット上ではユーザーの閲覧履歴を簡単にビッグデータに取り込むことができますし、センサーやカメラによって音声や映像など多様なデータを、リアルタイムに取り込むことができるようになったからです。

そして現在、これらのデータを効率よく集計・分析するための研究が盛んに行われているのです。