modelr
modelr软件包提供的功能可以帮助您在建模时创建精美的流水线。
分区和采样
resample(data, idx)
抽取idx向量指定的观测值
resample_partition(data, p)
按p向量给定的值分区
rs <- resample(mtcars, 1:10) |
交叉验证抽样
bootstrap(data, n, id = ".id")
生成n个bootstrap副本
crossv_kfold(data, k = 5, id = ".id")
将数据拆分为k独占分区,并将每个分区用于测试训练拆分
crossv_mc(data, n, test = 0.2, id = ".id")
生成n组数据,交叉验证模型,test为测试集比例
# bootstrap |
模型质量指标
rmse(model, data)
均方根误差
mae(model, data)
平均绝对误差
rsquare(model, data)
R^2预测的方差除以响应的方差
qae(model, data, probs)
误差的分位数
与模型交互
一组函数使您可以无缝地将预测和残差添加为现有数据框的附加列:
add_predictions(data, model)
向数据框添加预测
add_residuals(data, model)
向数据框添加残差
df <- tibble::data_frame( |
为了可视化目的,通常使用数据中均匀间隔的网格点
data_grid(data, ..., .model = NULL)
展开数据框,包含所有值的组合,对可视化模型有用
seq_range(x, n, by, trim = NULL, expand = NULL, pretty = FALSE)
在矢量范围内生成一个序列
# 对连续性变量, seq_range函数很有用 |
评论