机器学习(I)--参数估计
参数估计
事实上,概率模型的训练过程就是参数估计(parameter estimation)过程。对于参数估计,统计学界的两个学派分别提供了不同的解决方案:
频率主义学派(Frequentist) ...
看不懂的数字
之前看了一期李永乐老师的视频,介绍了一些奇怪的数字系统,觉得蛮有意思的,就决定记下来了。
10分钟学会写别人看不懂的数字!你又能跟小伙伴炫耀了! - 李永乐
Arabic numerals
Arab ...
机器学习(III)--模型选择与评估
模型选择
经验风险最小化
机器学习基本概括为通过数据、模型、代价函数、优化来建立一个算法。模型的假设空间包含所有可能的映射函数,例如线性函数集合。接下来要考虑按照什么样的准则来学习或者优化模型,我 ...
机器学习(IV)--监督学习(一)线性回归
每个样本都有标签的机器学习称为监督学习。根据标签数值类型的不同,监督学习又可以分为回归问题和分类问题。分类和回归是监督学习的核心问题。
回归(regression)问题中的标签是连续值。
分类(cl ...
机器学习(IV)--监督学习(三)决策树
决策树
树的生成
决策树(Decision Tree)是一种用于分类和回归的有监督学习方法。其目标是创建一个模型,通过学习从数据特性中归纳出一组分类规则来预测目标变量的值。下图是一颗决策树
决策 ...
机器学习(IV)--监督学习(六)贝叶斯分类
贝叶斯分类
后验概率最大化
从概率学讲,特征变量可看作特征空间 X⊆Rp\mathcal X\sube \R^pX⊆Rp 上的随机向量 X=(X1,X2,⋯ ,Xp)T\mathbf X=(X_1 ...
机器学习(IV)--监督学习(四)支持向量机
支持向量机
支持向量机(support vector machine, SVM)是一种用于分类、回归和异常检测的有监督学习方法。按照数据集的特点,可分为3类:
当数据集线性可分时,通过硬间隔最大化 ...
机器学习(IV)--监督学习(二)线性分类
每个样本都有标签的机器学习称为监督学习。根据标签数值类型的不同,监督学习又可以分为回归问题和分类问题。分类和回归是监督学习的核心问题。
回归(regression)问题中的标签是连续值。
分类(cl ...
机器学习(IV)--监督学习(七)集成学习
集成学习
集成学习
集成学习(ensemble learning)通过构建基学习器(base learner)集合 {h1,h2,⋯ ,hM}\{h_1,h_2,\cdots,h_M\}{h1, ...
Progress Bars with Python
在Python中实现进度条