机器学习(V)--无监督学习(七)核密度估计
核密度估计
核密度估计(kernel density estimate,kde):是一种用于估计概率密度函数的非参数方法,可看作直方图的拟合曲线。
我们知道,对概率密度函数(Probability ...
机器学习(II)--数据预处理
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的关键。
...
机器学习(I)--基础知识
前言
机器学习 (machine learning, ML)的主要目的是设计和分析一些学习算法,让计算机可以从数据(经验)中自动分析并获得规律,之后利用学习到的规律对未知数据进行预测,从而帮助人们完 ...
机器学习(I)--参数估计
参数估计
事实上,概率模型的训练过程就是参数估计(parameter estimation)过程。对于参数估计,统计学界的两个学派分别提供了不同的解决方案:
频率主义学派(Frequentist) ...
看不懂的数字
之前看了一期李永乐老师的视频,介绍了一些奇怪的数字系统,觉得蛮有意思的,就决定记下来了。
10分钟学会写别人看不懂的数字!你又能跟小伙伴炫耀了! - 李永乐
Arabic numerals
Arab ...
机器学习(IV)--监督学习(二)线性分类
每个样本都有标签的机器学习称为监督学习。根据标签数值类型的不同,监督学习又可以分为回归问题和分类问题。分类和回归是监督学习的核心问题。
回归(regression)问题中的标签是连续值。
分类(cl ...
机器学习(IV)--监督学习(一)线性回归
每个样本都有标签的机器学习称为监督学习。根据标签数值类型的不同,监督学习又可以分为回归问题和分类问题。分类和回归是监督学习的核心问题。
回归(regression)问题中的标签是连续值。
分类(cl ...
机器学习(IV)--监督学习(三)决策树
决策树
树的生成
决策树(Decision Tree)是一种用于分类和回归的有监督学习方法。其目标是创建一个模型,通过学习从数据特性中归纳出一组分类规则来预测目标变量的值。下图是一颗决策树
决策 ...
机器学习(IV)--监督学习(四)支持向量机
支持向量机
支持向量机(support vector machine, SVM)是一种用于分类、回归和异常检测的有监督学习方法。按照数据集的特点,可分为3类:
当数据集线性可分时,通过硬间隔最大化 ...
机器学习(IV)--监督学习(六)贝叶斯分类
贝叶斯分类
后验概率最大化
从概率学讲,特征变量可看作特征空间 X⊆Rp\mathcal X\sube \R^pX⊆Rp 上的随机向量 X=(X1,X2,⋯ ,Xp)T\mathbf X=(X_1 ...