「レコード集計」ノード

 データ集計において最も基本的なノードともいえる「レコード集計」ノードについてご説明します。

 サンプルデータ"商品A購買有無サンプルデータ.csv"を使用します。

こちらは通販サイトにおける、特定商品の購買や閲覧の有無、これまでの購買単価の平均値などを、会員ごとに示したデータとなっています。

 

(仮想のデータです)

ノードパレットの「レコード設定」タブから、「レコード集計」ノードを下記のように設置します。

下記のように設定すると 

 

テーブルノードで下記のように表示されます。

 この例では、「商品A購買有無」というフラグ変数を「キーフィールド」にしています。

(フラグ変数というのは、1が該当、0が非該当を表す、2値の変数です)

そのため、商品Aの購買がある人とない人に別れて集計されます。

 

「キーフィールド」というのは、テーブル内のレコードを一意に識別するためのフィールド(変数)のことです。

上の例では、「商品A購買有無」が1のレコードと0のレコードに分けて集計を行っており

「商品A購買有無」という「キーフィールド」でレコードが一意に定まっています。

 

Record_Count」は、商品Aについての購買有無それぞれのレコード数を示します。

 

「集計フィールド」は集計対象のフィールドのことです。上の例では「集計フィールド」に、ユーザー一人一人の「購買の平均単価」を示す変数を指定しているので

その変数について、商品Aの購買があるグループ(1)、ないグループ(0)で平均を取ったものが「購買の平均単価_Mean」として表示されます。

 

この表から、商品Aを買っている人は、買っていない人よりも少ないが(314 < 1149)、平均単価は高い(842.771 > 764.748円)ことが分かります。