Chi-Merge算法可以对大多数数值特征进行处理,是区别于特征规约的另一种特征简约手段。
1. Chi-Merge算法的优点
Chi-Merge算法可以广泛用于各类数值类型的特征离散化问题上。计算原理是基于相邻区间卡方值最小作为合并标准,这样的合并原则计算十分简单,且具有一定的普适性。
2. Chi-Merge算法的缺点
以卡方值最小化为合并原则意味着对特征的分布有假设前提,在实践中通常不知道特征的具体分布,所以这样的假设是有主观性的。