1)数据清理数据清理例程就是通过填写缺失值、光滑噪声数据、识别或者删除离群点,并且解决不一致性来进行“清理数据”。2)数据集成数据集成过程将来自多个数据源的数据集成到一起。3)数据规约数据规约是为了得到数据集的简化表示。数据规约包括维规约和数值规约。4)数据变换通过变换使用规范化、数据离散化和概念分层等方法,使得数据的挖掘可以在多个抽象层面上进行。数据变换操作是提升数据挖掘效果的附加预处理过程。