多次元空間は意外と広い
公開日: 2016年5月16日月曜日 データ解析
データ解析するときに、特徴量 (記述子、説明変数、入力変数) の数は多いこともあります。
例えば100個とか。
この100次元は意外と広いです。
仮に、100の特徴量すべてが 0 か 1 しか取らない変数であるとしましょう。
100変数をすべて考慮したときの 0 ・ 1 の全組み合わせの数は、2の100乗です。
これはだいたい10の30乗です。果てしなく広いです。
もちろん各変数が 0 や 1 以外をとるときはさらに広くなります。
そのときにデータが1000個あるとか・・・ってどうなの?