这是本文档旧的修订版！

EPPDEV-MLIB分布式模型部署平台背景说明

问题的提出

在机器学习项目实施过程中,软件工程和模型工程的衔接上,存在巨大的技术和思维鸿沟：

正式因为上述的技术和思维鸿沟,导致了模型工程师建模完成后,系统化落地比较困难。

模型工程师完成数据建模以后,后续模型计算的工作环节如下图所示:

主要流程包括以下四个环节:

上述四个环节中,越往后对于软件工程师来讲难度越大,为此很多时候模型部署落地的工作就落到了模型工程师手里,导致模型部署的实现方案各不相同。目前业内常用的落地方案包括:

SQL 模式:目前最简单的方式,仅支持最简单的逻辑回归、决策树等简单模型,但是对于复杂的特征工程和复杂的模型算法支持极其困难
Java 模式:通过 Java 代码完成特征工程和模型算法,可以支持绝大多数的模型算法和特征工程,缺点是代码开发工作量非常大,后续复杂的模型更新都需要进行额外的开发
Python 模式:一般直接由模型工程师直接负责核心代码的编制,由软件工程师进行封装,完成模型的部署,缺点在于软件工程化程度不够,未来的运维、监控比较困难,且很多时候模型落地代码质量比较差
R 模式:通过 R 服务监听的方式完成模型部署,一般由模型工程师完成模型的部署,需要模型工程师具备良好的软件工程思维