多次元空間は意外と広い

公開日: 2016年5月16日月曜日 データ解析

データ解析するときに、特徴量 (記述子、説明変数、入力変数) の数は多いこともあります。

例えば100個とか。

この100次元は意外と広いです。

仮に、100の特徴量すべてが 0 か 1 しか取らない変数であるとしましょう。

100変数をすべて考慮したときの 0 ・ 1 の全組み合わせの数は、2の100乗です。

これはだいたい10の30乗です。果てしなく広いです。

もちろん各変数が 0 や 1 以外をとるときはさらに広くなります。

そのときにデータが1000個あるとか・・・ってどうなの?

 

  • ?±??G???g???[?d????u?b?N?}?[?N???A