SQL Server 2005 CTP April の Analysis Services が実装している
データマイニング アルゴリズムからデシジョンツリーのノード選定基準を調べたところ
どうやら C5.0/C4.5/ID3 系のアルゴリズムが CART と混じってるのかな~という感じがする
デシジョンツリーのパラメータに SCORE_METHOD というのがあって
Entropy, Bayesian with K2 Prior, Bayesian Dirichlet Equivalent Prior
という3種類が選べます
でもアルゴリズムを解説したヘルプには
"Classification and Regression Algorithm"
とかいう単語があって一瞬CARTかなと思ったりもするけど...
などと思ったので Microsoft Research の サイト でアルゴリズムについて調べてみたところ
SQL Server 7.0 のころの資料だと思われる学会発表資料に
ID3/C4.5 と CART についてちょっと触れられているところがありました
CART に ID3/C4.5/C5.0 をミックスした感じだろうか
でもってさらに Bayesian まで絡めたもりだくさんなアルゴリズムかも