用户工具

站点工具


start

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录 前一修订版
后一修订版
前一修订版
start [2020/01/08 14:27]
jinlong [TODO]
start [2020/07/12 12:07] (当前版本)
行 35: 行 35:
  
 ===== 建模说明 ===== ===== 建模说明 =====
-===== TODO =====+ 
 +为支持基于EPPDEV-MLIB的模型部署,整个数据预处理、特征选择、模型训练,​建议全部封装到 PMMLPipeline 中, 
 +从而实现所有处理过程均可保存到pmml文件中。 
 + 
 +数据预处理一般全部通过 DataFrameMapper完成封装,以支持处理过程的保存,​和程序代码 
 +的可读性 
 + 
 +  * 基础代码参见: [[model:​basic|建模基础示例代码]] 
 +  * 常用的数据预处理代码示例: 
 +    * 空值填充参见:[[model:​preprocess:​impute|使用SimleImputer进行空值填充]] 
 +    * 连续数据分段方式参见:[[model:​preprocess:​cut|使用CutTransformer进行分段]] 
 +    * 离散数据分组参见:[[model:​preprocess:​group|使用ReplaceTransformer进行连续数据分段]] 
 +    * 多值变量处理参见:[[model:​preprocess:​multivalue|多值变量数据的处理]] 
 +  * 常见问题解决参见:[[model:​errors|常见问题处理]] 
 + 
 +===== TODOLIST ​=====
  
   * Python模型发布SDK示例   * Python模型发布SDK示例
  
  
start.1578464840.txt.gz · 最后更改: 2020/07/12 12:07 (外部编辑)