数值型变量可以计算各种不同的统计量, 如平均值、标准差和各个分位数。 summary()
可以给出最小值、最大值、中位数、四分之一分位数、四分之三分位数和平均值。如
summary(tax.tab[["营业额"]])
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0 650 2130 247327 9421 6048000
中位数是从小到大排序后排在中间的值。 四分之一和四分之三分位数类似。
统计函数以一个数值型向量为自变量, 包括sum
(求和), mean
(平均值), var
(样本方差), sd
(样本标准差), min
(最小值), max
(最大值), range
(最小值和最大值)等。如
mean(tax.tab[["营业额"]])
## [1] 247327.4
sd(tax.tab[["营业额"]])
## [1] 1036453
如果数据中有缺失值, 可以删去缺失值后计算统计量, 这时在mean
, sd
等函数中加入na.rm=TRUE
选项。