r 基于公式的NPV计算：卡住创建序列

Jon Spring 2019-07-04 01:33

这是18岁的npv：

library(dplyr)
rate = 0.05
df %>%
  arrange(decile_INCOME, AGE) %>%
  group_by(decile_INCOME) %>%
  mutate(disc_rate = 1 / (1+rate) ^ (AGE - min(AGE)),
         disc_mean = mean * disc_rate) %>%
  # try View()  at this stage to review how the discount is applied
  summarize(npv = sum(disc_mean))

# A tibble: 10 x 2
   decile_INCOME       npv
           <int>     <dbl>
 1             1   196051.
 2             2   381107.
 3             3   539085.
 4             4   717242.
 5             5   925751.
 6             6  1185537.
 7             7  1582346.
 8             8  2796287.
 9             9  6955914.
10            10 51016943.

要打折至25岁，请滤除较早的年龄，然后执行以下操作：

df %>%
  filter(AGE >= 25) %>%
  arrange(decile_INCOME, AGE) %>%
  group_by(decile_INCOME) %>%
  mutate(disc_rate = 1 / (1+rate) ^ (AGE - min(AGE)),
         disc_mean = mean * disc_rate) %>%
  summarize(npv = sum(disc_mean))

# A tibble: 10 x 2
   decile_INCOME       npv
           <int>     <dbl>
 1             1   226399.
 2             2   465403.
 3             3   670195.
 4             4   897065.
 5             5  1165181.
 6             6  1504068.
 7             7  2023148.
 8             8  3694092.
 9             9  9479113.
10            10 71109533.

或者，要获取所有年龄段的所有npv，我们可以为每个可能的参考年龄段制作每行的副本，根据参考年龄段计算折扣，然后根据十分位数和参考年龄段进行汇总：

df %>%
  uncount(max(AGE), .id = "REF_AGE") %>%
  arrange(REF_AGE, decile_INCOME, AGE) %>%
  mutate(disc_rate = 1 / (1+rate) ^ (AGE - REF_AGE),
         disc_mean = mean * disc_rate) %>%
  group_by(decile_INCOME, REF_AGE) %>%
  summarize(npv = sum(disc_mean))

以图表形式：

  [chain above...] %>%
  ggplot(aes(REF_AGE, npv, color = decile_INCOME, group = decile_INCOME)) + 
  geom_line() +
  scale_y_log10()

user8959427 2019-07-04 02:10:27

谢谢！我觉得这就是！无论如何，我可以在最终数据中保留“ AGE”，我看到您构造了“ REF_AGE”，但是“ 1”对应于“ 18”，“ 2” =“ 20”等吗？在数据中，年龄从18开始，到95结束，在最终输出中，年龄从0开始，到95结束，另外170个观测值从何而来？（该dim的df是780，最后dim是950的图形看起来应该:)

Jon Spring 2019-07-04 02:29:44

REF_AGE是折扣的参考年龄。为了简化设置，它包括所有追溯到1岁的年份，因此包括额外的行。filter(REF_AGE >= 18)之后使用，仅包括成年人。

user8959427 2019-07-04 02:35:00

谢谢:)所以我可以将“ REF_AGE”重命名为“ AGE”，并且会一样吗？

Jon Spring 2019-07-04 02:49:30

是的，最后。我在计算主体中给它起了不同的名称，因为对于每一行，折扣率基于该行统计信息中的AGE与要折回的年龄REF_AGE之间的差。

user8959427 2019-07-04 21:52:58

一个问题; 如果您有`group_by（decile_INCOME，REF_AGE）％>％`，而不是`group_by（decile_INCOME，AGE）％>％`-即按分组AGE而不是分组REF_AGE。我们想总结每个“十分位”和“年龄”的NPV-我在原始问题中添加了输出样本。

r - 基于公式的NPV计算：卡住创建序列

相关问题

热门github