SQL Server 2005 CTP April の Analysis Services が実装している
データマイニング アルゴリズムからデシジョンツリーのノード選定基準を調べたところ
どうやら C5.0/C4.5/ID3 系のアルゴリズムが CART と混じってるのかな~という感じがする

デシジョンツリーのパラメータに SCORE_METHOD というのがあって
Entropy, Bayesian with K2 Prior, Bayesian Dirichlet Equivalent Prior
という3種類が選べます

でもアルゴリズムを解説したヘルプには
"Classification and Regression Algorithm"
とかいう単語があって一瞬CARTかなと思ったりもするけど...

などと思ったので Microsoft Research の サイト でアルゴリズムについて調べてみたところ
SQL Server 7.0 のころの資料だと思われる学会発表資料に
ID3/C4.5 と CART についてちょっと触れられているところがありました

CART に ID3/C4.5/C5.0 をミックスした感じだろうか
でもってさらに Bayesian まで絡めたもりだくさんなアルゴリズムかも

Be the first to rate this post

  • Currently 0/5 Stars.
  • 1
  • 2
  • 3
  • 4
  • 5
Comments are closed