用户工具

站点工具


start

差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

两侧同时换到之前的修订记录 前一修订版
后一修订版
前一修订版
start [2020/01/08 17:38]
jinlong [TODO]
start [2020/07/12 12:07] (当前版本)
行 35: 行 35:
  
 ===== 建模说明 ===== ===== 建模说明 =====
 +
 +为支持基于EPPDEV-MLIB的模型部署,整个数据预处理、特征选择、模型训练,​建议全部封装到 PMMLPipeline 中,
 +从而实现所有处理过程均可保存到pmml文件中。
 +
 +数据预处理一般全部通过 DataFrameMapper完成封装,以支持处理过程的保存,​和程序代码
 +的可读性
 +
 +  * 基础代码参见: [[model:​basic|建模基础示例代码]]
 +  * 常用的数据预处理代码示例:
 +    * 空值填充参见:[[model:​preprocess:​impute|使用SimleImputer进行空值填充]]
 +    * 连续数据分段方式参见:[[model:​preprocess:​cut|使用CutTransformer进行分段]]
 +    * 离散数据分组参见:[[model:​preprocess:​group|使用ReplaceTransformer进行连续数据分段]]
 +    * 多值变量处理参见:[[model:​preprocess:​multivalue|多值变量数据的处理]]
 +  * 常见问题解决参见:[[model:​errors|常见问题处理]]
 +
 ===== TODOLIST ===== ===== TODOLIST =====
  
start.1578476283.txt.gz · 最后更改: 2020/07/12 12:07 (外部编辑)