LINEST 函数

本文介绍 Microsoft Excel 中 LINEST 函数 (函数:函数是预先编写的公式,可以对一个或多个值执行运算,并返回一个或多个值。函数可以简化和缩短工作表中的公式,尤其在用公式执行很长或复杂的计算时。)的公式语法和用法。在“另请参阅”部分中可找到一些链接,这些链接指向有关绘制图表和执行回归分析的详细信息。

说明

LINEST 函数可通过使用最小二乘法计算与现有数据最佳拟合的直线,来计算某直线的统计值,然后返回描述此直线的数组。也可以将 LINEST 与其他函数结合使用来计算未知参数中其他类型的线性模型的统计值,包括多项式、对数、指数和幂级数。因为此函数返回数值数组,所以必须以数组公式的形式输入。请按照本文中的示例使用此函数。

直线的公式为:

y = mx + b

- 或 -

y = m1x1 + m2x2 + ... + b

如果有多个区域的 x 值,其中因变量 y 值是自变量 x 值的函数。m 值是与每个 x 值相对应的系数,b 为常量。注意,y、x 和 m 可以是向量。LINEST 函数返回的数组为 {mn,mn-1,...,m1,b}。LINEST 函数还可返回附加回归统计值。

语法

LINEST(known_y's, [known_x's], [const], [stats])

LINEST 函数语法具有以下参数 (参数:为操作、事件、方法、属性、函数或过程提供信息的值。)

语法

说明

示例

示例 1 - 斜率和 Y 轴截距

如果将示例复制到一个空白工作表中,可能会更容易理解该示例。

显示如何复制示例?

 
1
2
3
4
5
6
7
A BC
已知 y 已知 x
1 0
9 4
5 2
7 3
公式 公式结果
=LINEST(A2:A5,B2:B5,,FALSE) A7=2, B7=1

要点  示例中的公式必须以数组公式的形式输入。将本示例复制到空白工作表后,选择以公式单元格开始的区域 A7:B7。按 F2,然后按 Ctrl+Shift+Enter。如果公式不是以数组公式输入,则返回单个结果值 2。

当以数组输入时,将返回斜率 2 和 y 轴截距 1。

示例 2 - 简单线性回归

如果将示例复制到一个空白工作表中,可能会更容易理解该示例。

显示如何复制示例?

 
1
2
3
4
5
6
7
8

9
A BC
月份 销售额
1 3100
2 4500
3 4400
4 5400
5 7500
6 8100
公式 说明结果
=SUM(LINEST(B2:B7, A2:A7)*{9,1}) 估算九月份的销售额11000

通常,SUM({m,b}*{x,1}) 等于 mx + b,即给定 x 值的 y 的估计值。还可以使用 TREND 函数。

示例 3 - 多重线性回归

假设有开发商正在考虑购买商业区里的一组小型办公楼。

开发商可以根据下列变量,采用多重线性回归的方法来估算给定地区内的办公楼的价值。

变量 代表
y 办公楼的评估值
x1 底层面积(平方英尺)
x2 办公室的个数
x3 入口个数
x4 办公楼的使用年数

本示例假设在自变量(x1、x2、x3 和 x4)和因变量 (y) 之间存在线性关系。其中 y 是办公楼的价值。

开发商从 1,500 个可选的办公楼里随机选择了 11 个办公楼作为样本,得到下列数据。“半个入口”指的是运输专用入口。

如果将示例复制到一个空白工作表中,可能会更容易理解该示例。

显示如何复制示例?

 

1
2
3
4
5
6
7
8
9
10
11
12
13

14
A B C D E
底层面积 (x1) 办公室的个数 (x2) 入口个数 (x3) 办公楼的使用年数 (x4) 办公楼的评估值 (y)
2310 2 2 20 142,000
2333 2 2 12 144,000
2356 3 1.5 33 151,000
2379 3 2 43 150,000
2402 2 3 53 139,000
2425 4 2 23 169,000
2448 2 1.5 99 126,000
2471 2 2 34 142,900
2494 3 3 23 163,000
2517 4 4 55 169,000
2540 2 3 22 149,000
公式
=LINEST(E2:E12,A2:D12,TRUE,TRUE)

要点  示例中的公式必须以数组公式的形式输入。在将公式复制到一张空白工作表后,选择以公式单元格开始的区域 A14:E18。按 F2,然后按 Ctrl+Shift+Enter。如果公式不是以数组公式输入,则返回单个结果值 -234.2371645。

当作为数组输入时,将返回下面的回归统计值, 用该值可识别所需的统计值。

回归统计值的键

将第 14 行的值代入多重回归公式 y = m1*x1 + m2*x2 + m3*x3 + m4*x4 + b 可得到:

y = 27.64*x1 + 12,530*x2 + 2,553*x3 - 234.24*x4 + 52,318

现在,开发商用下面公式可得到办公楼的评估价值,其中面积为 2,500 平方英尺、3 个办公室、2 个入口,已使用 25 年:

y = 27.64*2500 + 12530*3 + 2553*2 - 234.24*25 + 52318 = $158,261

或者,可将下表复制到为本示例创建的工作表的单元格 A21。

底层面积 (x1) 办公室的个数 (x2) 入口个数 (x3) 办公楼的使用年数 (x4) 办公楼的评估值 (y)
2500 3 2 25 =D14*A22 + C14*B22 + B14*C22 + A14*D22 + E14

也可以用 TREND 函数计算此值。

示例 4 - 使用 F 和 r2 统计值

在上例中,判定系数 r2 为 0.99675(函数 LINEST 的输出单元格 A17 中的值),表明自变量与销售价格之间存在很强的相关性。可以通过 F 统计值来确定具有如此高的 r2 值的结果偶然发生的可能性。

假设事实上在变量间不存在相关性,但选用 11 个办公楼作为小样本进行统计分析却导致很强的相关性。术语“Alpha”表示得出这样的相关性结论错误的概率。

LINEST 函数输出中的 F 和 df 值可被用于评估偶然出现较高 F 值的可能性。F 可与发布的 F 分布表中的值进行比较,或者 Excel 中的 FDIST 函数可被用于计算偶然出现较高 F 值的概率。适当的 F 分布具有 v1 和 v2 自由度。如果 n 是数据点的个数且 const = TRUE 或被省略,那么 v1 = n – df – 1 且 v2 = df。(如果 const = FALSE,那么 v1 = n – df 且 v2 = df。) 语法为 FDIST(F,v1,v2) 的 FDIST 函数将返回偶然出现较高 F 值的概率。在本例中,df = 6(单元格 B18)且 F = 459.753674(单元格 A18)。

假设 Alpha 值为 0.05,v1 = 11 – 6 – 1 = 4 且 v2 = 6,那么 F 的临界值为 4.53。由于 F = 459.753674 远大于 4.53,所以偶然出现高 F 值的可能性非常低。(因为,在 Alpha = 0.05 的情况下,当 F 超过临界值 4.53 时,known_y’sknown_x’s 之间没有关系这一假设不成立。)使用 Excel 中的 FDIST 函数可获得偶然出现高 F 值的概率。例如,FDIST(459.753674, 4, 6) = 1.37E-7,是一个极小的概率。于是可以断定,无论通过在表中查找 F 的临界值,还是使用 FDIST 函数,回归公式都可用于预测该区域中的办公楼的评估价值。请注意,使用在上一段中计算出的 v1 和 v2 的正确值是非常关键的。

示例 5 - 计算 t 统计值

另一个假设测试可以判定每个斜率系数是否可以用来估算示例 3 中的办公楼的评估价值。下面是 T 观察值:

t = m4 ÷ se4 = -234.24 ÷ 13.268 = -17.7

如果 t 的绝对值足够大,那么可以断定斜率系数可用来估算示例 3 中的办公楼的评估价值。下表显示了 4 个 t 观察值的绝对值。

如果查阅统计手册里的表,将会发现:双尾、自由度为 6、Alpha = 0.05 的 t 临界值为 2.447。该临界值还可使用 Excel 中的 TINV 函数计算, TINV(0.05,6) = 2.447。既然 t 的绝对值为 17.7,大于 2.447,则办公楼的使用年数对于估算办公楼的评估价值来说是一个重要变量。用同样方法,可以测试其他每个自变量的统计显著性水平。以下是每个自变量的 t 观察值。

变量 t 观察值
底层面积 5.1
办公室的个数 31.3
入口个数 4.8
使用年数 17.7

这些值的绝对值都大于 2.447;因此,回归公式的所有变量都可用来估算此区域内的办公楼的评估价值。

draw a best-fit straight line linest worksheet function statistics for a straight line straight line regression what function use the least squares method to calculate a straight line xl

请参阅