# DataMining **Repository Path**: jinquxing_admin/data-mining ## Basic Information - **Project Name**: DataMining - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2024-11-27 - **Last Updated**: 2024-11-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # DataMining 介绍数据挖掘流程以及一些数据挖掘案例 ### 数据挖掘流程: #### (一)数据读取: - 读取数据,并进行展示 - 统计数据各项指标 - 明确数据规模与要完成任务 #### (二)特征理解分析 - 单特征分析,逐个变量分析其对结果的影响 - 多变量统计分析,综合考虑多种情况影响 - 统计绘图得出结论 #### (三)数据清洗与预处理 - 对缺失值进行填充 - 特征标准化/归一化 - 筛选有价值的特征 - 分析特征之间的相关性
`注意`:数据挖掘80%的时间用于数据清洗。 #### (四)建立模型 - 特征数据与标签准备 - 数据集切分 - 多种建模算法对比 - 集成策略等方案改进