上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
0.1.3 算法库
在人工智能和计算科学极大发展的今天,算法的种类丰富多样,不同的算法有各自的优势和应用领域。无论是传统金融工程中的各类计量经济学模型、统计分析模型,还是近几年兴起的深度学习框架如各类神经网络、增强型学习机,这些都可以归结为算法库范畴。我们建立算法库,就是要对当下学术界流行的各类算法做一个梳理和总结,为下一步工具库的开发做好准备。客观地讲,算法的种类非常多,所用到的理论也很丰富,不同的算法互相结合,使得近几年新的算法很难有一个特定的分类定位,因为这样的算法融合了多种算法思想。所以我们在讨论算法分类时尽可能全面地包含众多的算法但不排除相互之间有交集。我们可以根据目标和数据集之间的关系把算法分为:①监督式学习——训练集需要标注;②半监督式学习——训练集需要部分标注;③非监督式学习——训练集无须标注;④强化学习——训练集无标注但有奖惩激励的反馈。如果根据算法的思想流派,又可以把算法划分为:①符号主义——使用符号、规则和逻辑来表征知识并进行逻辑推理,典型的算法是规则推论和决策树;②贝叶斯派——获取发生的可能性来进行概率推理,典型的算法是朴素贝叶斯和马尔可夫;③联结主义——使用概率矩阵和加权神经元来动态地识别和归纳模式,典型的算法是神经网络;④进化主义——生成变化,然后为特定目标获取其中最优的一种,典型的算法是遗传算法;⑤Analogizer——根据约束条件来优化函数(尽可能走到更高,但同时不要离开道路),典型的算法是支持向量机。如果根据用途来划分,单就针对量化研究而言,又可以分为:①关联——用于发现数据与问题的相关性;②成分分析——用于数据去噪或主成分分析;③聚类——用于模式的界定;④分类——用于模式识别;⑤回归——用于建模;⑥优化——用于模型的调优。