博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Pandas异常值处理
阅读量:4360 次
发布时间:2019-06-07

本文共 838 字,大约阅读时间需要 2 分钟。

import pandas as pd#生成异常数据df=pd.DataFrame({'col1':[1,120,3,5,2,12,13],                'col2':[12,17,31,53,22,32,43]})print(df)   col1  col20     1    121   120    172     3    313     5    534     2    225    12    326    13    43df_zscore=df.copy() #复制一个用来存储Z-score得分的数据框cols=df.columnsfor col in cols:    df_col=df[col]    z_score=(df_col - df_col.mean()) / df_col.std() #计算每列的Z-score得分    df_zscore[col] = z_score.abs() > 2.2 #判断Z-score得分是否大于2.2,如果是则为True,否则为False#打印,为True即异常值print(df_zscore)    col1   col20  False  False1   True  False2  False  False3  False  False4  False  False5  False  False6  False  False#获取无异常值的数据df_drop_outlier=df[df_zscore['col1']==False]#打印print(df_drop_outlier)   col1  col20     1    122     3    313     5    534     2    225    12    326    13    43

转载于:https://www.cnblogs.com/hankleo/p/11462290.html

你可能感兴趣的文章
node中使用log4js4.x版本记录
查看>>
mybatis动态SQL
查看>>
mybatis环境搭建(eclipse,idea)
查看>>
MyBatis整体架构
查看>>
mybatis高级查询
查看>>
css绘制基本案例
查看>>
svg教程
查看>>
eclipse快捷键
查看>>
ssm搭建,maven,javaConfig
查看>>
idea快捷键
查看>>
UltraISO制作manjaro系统盘,使用优盘
查看>>
Git常用命令
查看>>
VsCode常用插件
查看>>
uni-app项目配置记录
查看>>
Git恢复删除的分支
查看>>
HNOI2002 公交车路线
查看>>
NOI 2012 随机数生成器
查看>>
[无聊]Frank的暑假oi(摸鱼)计划
查看>>
面试的内容
查看>>
8.28%你赛T3(数论,思维)提高组(tg)
查看>>