这里会显示出您选择的修订版和当前版本之间的差别。
两侧同时换到之前的修订记录 前一修订版 后一修订版 | 前一修订版 | ||
start [2019/12/29 15:07] jinlong [平台部署] |
start [2020/07/12 12:07] (当前版本) |
||
---|---|---|---|
行 7: | 行 7: | ||
型部署平台,实现了常用机器学习模型的固化、加载和实时运算,以便于后续模型的落地。 | 型部署平台,实现了常用机器学习模型的固化、加载和实时运算,以便于后续模型的落地。 | ||
- | EPPDEV-MLIB平台建设的详细背景及优劣时说明参见:[[background|背景说明]] | + | * 平台建设的详细背景及优劣时说明参见:[[background|背景说明]] |
行 20: | 行 20: | ||
===== 系统管理 ===== | ===== 系统管理 ===== | ||
+ | EPPDEV-MLIB平台的注册中心提供WEB前端界面,实现基础的用户管理、模型发布和各个组件的调用量展示功能: | ||
+ | |||
+ | * 用户管理,主要实现访问注册中心进行模型发布的用户的管理,详见:[[manage:user|用户管理功能使用说明]] | ||
+ | * 模型发布,主要实现模型的创建及其在执行引擎中的发布功能,详见:[[manage:model|模型部署与更新]] | ||
+ | * 状态监控:主要实现各个组件运行状态和分模型、执行引擎的调用量的展示功能,详见:[[manage:monitor|运行状态监控]] | ||
===== 接口调用 ===== | ===== 接口调用 ===== | ||
行 30: | 行 35: | ||
===== 建模说明 ===== | ===== 建模说明 ===== | ||
- | ===== TODO-LIST ===== | + | |
+ | 为支持基于EPPDEV-MLIB的模型部署,整个数据预处理、特征选择、模型训练,建议全部封装到 PMMLPipeline 中, | ||
+ | 从而实现所有处理过程均可保存到pmml文件中。 | ||
+ | |||
+ | 数据预处理一般全部通过 DataFrameMapper完成封装,以支持处理过程的保存,和程序代码 | ||
+ | 的可读性 | ||
+ | |||
+ | * 基础代码参见: [[model:basic|建模基础示例代码]] | ||
+ | * 常用的数据预处理代码示例: | ||
+ | * 空值填充参见:[[model:preprocess:impute|使用SimleImputer进行空值填充]] | ||
+ | * 连续数据分段方式参见:[[model:preprocess:cut|使用CutTransformer进行分段]] | ||
+ | * 离散数据分组参见:[[model:preprocess:group|使用ReplaceTransformer进行连续数据分段]] | ||
+ | * 多值变量处理参见:[[model:preprocess:multivalue|多值变量数据的处理]] | ||
+ | * 常见问题解决参见:[[model:errors|常见问题处理]] | ||
+ | |||
+ | ===== TODOLIST ===== | ||
* Python模型发布SDK示例 | * Python模型发布SDK示例 | ||
- | * 定期清理缓存数据,避免内存持续增长 | ||