姬長信(Redy)

python – 检测并排除Pandas数据帧中的异常值


我有一个包含少量列的pandas数据帧.

现在我知道某些行是基于某个列值的异常值.

例如列 – ‘Vol’的所有值都大约为12xx,一个值为4000(异常值).

现在我想排除那些有’Vol’列的行.
因此,基本上我需要在数据框上放置一个过滤器,以便我们选择所有行,其中某列的值在与平均值相差3个标准差的范围内.

实现这一目标的优雅方式是什么?