environment variables-在R函数中创建可重用对象的推荐方法

Allan Cameron 2020-12-02 02:45:02

你当然应该避免将对象写入全局环境。如果你发现必须在多个不同功能的顶部重复执行相同的计算量大的任务，则意味着你执行该计算量大的任务为时已晚。

例如，你可以创建一个S3类，其中包含必要的分量以生成“便宜”图和系数的“便宜”提取。它甚至具有通用调度的优点：

add_ten <- function(model) model$model + 10

lm_tens <- function(formula, data)
{
  model <- if(missing(data)) lm(formula) else lm(formula, data = data)
  
  structure(list(data = data.frame(add_ten(model)), model = model),
            class = "tens")
}

plot.tens <- function(tens) {
  x = all.vars(formula(tens$data))[2]
  y = all.vars(formula(tens$data))[1]
  ggplot2::ggplot(tens$data, ggplot2::aes(x = x, y = y)) + 
    ggplot2::geom_point() + 
    ggplot2::geom_smooth()
}

coef.tens = function(tens) {
  coef(lm(formula(tens$model), data = tens$data))
}

所以现在我们只需要做：

set.seed(21)
y = rnorm(100)
x = .5*y + rnorm(100, 0, sqrt(.75))

mod <- lm_tens(y ~ x)
coef(mod)
#> (Intercept)           x 
#>   4.3269914   0.5775404
plot(mod)
#> `geom_smooth()` using method = 'loess' and formula 'y ~ x'

请注意，我们add_ten在这里只需要调用一次即可。

dfife 2020-12-01 19:27:17

我见过函数可以做这样的事情（例如，mouses包和norm包），并且总是发现两阶段过程有些令人沮丧。但是，我认为一个不错的选择类似于您提出的建议：不需要lm_tens函数，但是如果他们已经调用了它，就可以使用它（否则，请重复add_ten）。

Allan Cameron 2020-12-01 19:34:42

@dfife，这取决于您对该对象有什么可能的用途。我今天从eulerr包装中看到了一个例子。本euler类包含，使得它便于将其打包成一个班上有几个不同的轻质领域，但工作的最多的是后进行; 该plot.euler函数非常昂贵，因此绘制绘图所需的结构仅在plot调用时生成。另一方面，大多数回归函数从一开始就在计算上花了很多钱，因此您可以将模型传递出去，因为知道以后进行任何工作将很便宜。

dfife 2020-12-01 19:39:13

让我给出更多细节（以防万一我忽略了一些明显的解决方案）。我的包裹接受lavaan包裹拟合的模型。（lavaan不是我的包裹）。我的某些功能需要计算标准误差（通过计算复杂度的多重插补估算）。我无法将这些标准错误附加到已经估算的lavaan模型上，因此我一直在为每个函数计算它们。但是，对于不同的功能，相同的标准误差计算可能会多次发生。因此，有关将它们放置在全球环境中的问题：）

Allan Cameron 2020-12-01 20:25:56

@dfife那么为什么不创建一个包装lavaan对象并将其作为成员保存但又包含标准错误的类呢？假设您的类称为“ dfife_class”，并且包含一个成员“模型”（其为lavaan对象）和一个成员“ SE”（其具有计算得出的标准误差）。在每个函数的开头，检查是否已传递了lavaan对象或“ dfife_class”对象。如果是lavaan对象，则计算SE并将lavaan变成“ dfife_class”对象。然后编写您的函数来处理“ dfife_class”对象

dfife 2020-12-01 21:18:26

我明白你在说什么。是的，这是一个好主意，它将节省额外的步骤（假设用户适合lm_tens而不是lm）。谢谢！

environment variables-在R函数中创建可重用对象的推荐方法

(environment variables - Recommended way of creating reusable objects within an R function)

热门帖子

热门github