实战机器学习
上QQ阅读APP看书,第一时间看更新

1.3.4 中科院EasyML

1.平台概况

中科院Easy Machine Learning(EasyML)平台是一个通用的、基于数据流的系统,用来简化应用机器学习算法解决实际问题的过程。该平台包括两大组件:分布式大数据分析函数与算法库BDA Lib和可视化任务构建与管理平台BDA Studio。EasyML的主界面如图1.6所示。

2.平台特点

(1)提供可拖拽式的图形化操作界面,帮助用户快速构建和执行分析任务。

(2)大规模可扩展:内部算法基于Spark内存分布式计算框架,具有强大的大数据处理能力。

(3)具有丰富的机器学习算法,涵盖分类聚类、文本分析、个性化推荐等方向。

(4)支持Map-Reduce、Spark和单机程序并行混合执行,单机/分布式算法。

(5)支持数据、程序模块和分析任务的发布和共享,降低使用者的时间成本。

图1.6 中科院机器学习平台EasyML界面