特征工程(VII)--模型集成
Ensembles
有时候模型集成可以取得不错的效果。常用的模型集成包括:
Votting:简单投票或加权平均
Stacking:简单来说就是学习各个基本模型的预测值来预测最终的结果
我们初步选 ...
特征工程(VI)--机器学习
Jupyter Notebook 代码连接:machine_learning_demo
Step 1: Imports and Configuration
import pandas as pdim ...
特征工程(V)--时间序列特征
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。
特 ...
特征工程(IV)--特征选择
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。
特 ...
特征工程(III)--特征构造
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。
特 ...
Python(Machine Learning)--XGBoost
Quick Start
XGBoost本质上还是一个GBDT,但是力争把速度和效率发挥到极致,所以叫 Extreme Gradient Boosting。XGBoost高效地实现了GBDT算法,并进 ...
特征工程(I)--探索性数据分析
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。
特 ...
特征工程(II)--数据预处理
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。
特 ...
Python(Machine Learning)--超参数优化
超参数优化
超参数是用于控制学习过程的不同参数值,对机器学习模型的性能有显著影响。例如,随机森林算法中的估计器数量、最大深度和分裂标准等。超参数优化是找到超参数值的正确组合,以便在合理的时间内实现数 ...
Python(Machine Learning)--LightGBM
Quick Start
LightGBM(Light Gradient Boosting Machine)是一种高效的 Gradient Boosting 算法, 主要用于解决GBDT在海量数据中遇 ...