跳至内容
EPPDEV-MLIB
用户工具
登录
站点工具
搜索
工具
显示页面
修订记录
反向链接
最近更改
媒体管理器
网站地图
登录
>
最近更改
媒体管理器
网站地图
您的足迹:
model:preprocess:impute
本页面只读。您可以查看源文件,但不能更改它。如果您觉得这是系统错误,请联系管理员。
====== 使用SimleImputer进行空值填充 ====== 缺失值填充主要采用SimpleImputer来完成,示例代码如下: <code python> # ############################################################# # File: 02-preprocess-08-SimpleImpute # Author: 郝金隆 # Date: 2019-12-04 # SimpleImpute: 基础的插值补充 # 主要内容: # 1. import语句 # 2. 加载示例数据 # 3. 基础用法 # 4. 与DataFrameMapper配合使用 # ############################################################# # 1. import语句 from sklearn.preprocessing import LabelBinarizer, OrdinalEncoder from sklearn.impute import SimpleImputer from sklearn_pandas import DataFrameMapper import numpy as np import pandas as pd # 2. 加载示例数据 df = pd.DataFrame({'pet': ['fish', 'dog', 'dog', 'fish', 'cat', 'dog', 'cat', 'fish', 'goose', 'null', '-1'], 'age': [1, 2, 4, np.NaN, 3, np.NaN, 3, 2, np.NaN, 2, 1] }) # 3. 与DataFrameMapper结合使用 mapper = DataFrameMapper([ (['pet'], [SimpleImputer(missing_values='null', fill_value='others', strategy='constant'), SimpleImputer(missing_values='-1', fill_value='others', strategy='constant') ]), # 连续替换 (['age'], [SimpleImputer(missing_values=np.NaN, strategy='mean')]), # 均值替换 (['age'], [SimpleImputer(missing_values=np.NaN, strategy='median')]) # 中位数替换 (['age'], [SimpleImputer(missing_values=np.NaN, strategy='most_frequent')]) # 最多数 ], df_out=True) mapper.fit_transform(df) </code>
model/preprocess/impute.txt
· 最后更改: 2020/07/12 12:07 (外部编辑)
页面工具
显示页面
修订记录
反向链接
回到顶部