特征工程(III)--特征构造
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键...
Python(Machine Learning)--XGBoost
Quick Start XGBoost本质上还是一个GBDT,但是力争把速度和效率发挥到极致,所以叫 Extreme Gradient Boosting。XGBoost高效地实现了GBDT算法,...
特征工程(I)--探索性数据分析
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键...
特征工程(II)--数据预处理
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键...
Python(Machine Learning)--超参数优化
超参数优化 超参数是用于控制学习过程的不同参数值,对机器学习模型的性能有显著影响。例如,随机森林算法中的估计器数量、最大深度和分裂标准等。超参数优化是找到超参数值的正确组合,以便在合理的时间内实...
Python(Machine Learning)--LightGBM
Quick Start LightGBM(Light Gradient Boosting Machine)是一种高效的 Gradient Boosting 算法, 主要用于解决GBDT在海量数据...
大数据手册(Flink)--Flink安装配置
本文默认在 zsh 终端安装配置,若使用bash终端,环境变量的配置文件相应变化。 若安装包下载缓慢,可复制链接到迅雷下载,亲测极速~ 安装 flink Flink的运行需要Java环境的支...
大数据手册(Kafka)--Kafka安装配置
本文默认在 zsh 终端安装配置,若使用bash终端,环境变量的配置文件相应变化。 若安装包下载缓慢,可复制链接到迅雷下载,亲测极速~ 准备工作 假设已经安装好了相关大数据组件,环境变量如下
大数据手册(Hadoop)--Hadoop安装配置
本文默认在 zsh 终端安装配置,若使用bash终端,环境变量的配置文件相应变化。 若安装包下载缓慢,可复制链接到迅雷下载,亲测极速~ 安装Java环境 下载并解压安装包 sudo tar ...
大数据手册(Hive)--Hive安装配置
本文默认在 zsh 终端安装配置,若使用bash终端,环境变量的配置文件相应变化。 若安装包下载缓慢,可复制链接到迅雷下载,亲测极速~ 准备工作 在安装Hive之前首先安装好了hadoop,...







