Skip to content

[eigen_II] Translation Updating #156

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Merged
merged 2 commits into from
Mar 8, 2025
Merged
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
83 changes: 45 additions & 38 deletions lectures/eigen_II.md
Original file line number Diff line number Diff line change
Expand Up @@ -23,7 +23,7 @@ kernelspec:
!pip install quantecon
```

在本讲座中,我们将从谱理论的基本概念开始
在本讲座中,我们将从[谱论](https://baike.baidu.com/item/%E8%B0%B1%E8%AE%BA/91543)的基本概念开始

然后,我们将探讨佩龙-弗罗贝尼乌斯定理,并将其与马尔可夫链和网络的应用联系起来。

Expand All @@ -38,7 +38,7 @@ import quantecon as qe

## 非负矩阵

在经济学中,我们经常处理的矩阵是非负的。非负矩阵具有几个特殊且有用的性质。在本节中,我们将讨论其中的一些性质——特别是非负性与特征值之间的联系。
在经济学中,我们经常遇到非负矩阵。非负矩阵具有几个特殊且有用的性质。在本节中,我们将讨论其中的一些性质——特别是非负性与特征值之间的联系。

一个 $n \times m$ 的矩阵 $A$ 被称为**非负**,如果 $A$ 的每个元素都是非负的,即对于每个 $i,j$,都有 $a_{ij} \geq 0$。我们将此表示为 $A \geq 0$。

Expand All @@ -49,22 +49,26 @@ import quantecon as qe

令 $a^{k}_{ij}$ 为 $A^k$ 的第 $(i,j)$ 个元素。

一个 $n \times n$ 的非负矩阵 $A$ 被称为不可约的,如果 $A + A^2 + A^3 + \cdots \gg 0$,其中 $\gg 0$ 表示 $A$ 的每个元素都严格为正。
一个 $n \times n$ 的非负矩阵 $A$ 如果满足以下条件,则被称为**不可约**的:
存在一个正整数 $k$,使得矩阵 $A + A^2 + \dots + A^k$ 的所有元素都大于零。
我们用 $\gg 0$ 来表示矩阵的所有元素都严格为正。

换句话说,对于每个 $1 \leq i, j \leq n$,存在一个 $k \geq 0$ 使得 $a^{k}_{ij} > 0$。

```{prf:example}
:label: eigen2_ex_irr

以下是一些进一步说明的例子
我们用以下例子进一步说明

$$
A = \begin{bmatrix} 0.5 & 0.1 \\
0.2 & 0.2
A =
\begin{bmatrix}
0.5 & 0.1 \\
0.2 & 0.2
\end{bmatrix}
$$

$A$ 是不可约的,因为对于所有的 $(i,j)$,$a_{ij}>0$。
因为对于所有的 $(i,j)$,$a_{ij}>0$, 所以 $A$ 是不可约的

$$
B = \begin{bmatrix} 0 & 1 \\
Expand All @@ -76,24 +80,24 @@ B^2 = \begin{bmatrix} 1 & 0 \\
\end{bmatrix}
$$

$B$ 是不可约的,因为 $B + B^2$ 是一个全为 1 的矩阵。
因为 $B + B^2$ 是一个全为 1 的矩阵,$B$ 是不可约的

$$
C = \begin{bmatrix} 1 & 0 \\
0 & 1
\end{bmatrix}
$$

$C$ 不是不可约的,因为对于所有 $k \geq 0$,$C^k = C$,因此
对于所有 $k \geq 0$,$c^{k}_{12},c^{k}_{21} = 0$。
因为对于所有 $k \geq 0$,$C^k = C$,因此
对于所有 $k \geq 0$,$c^{k}_{12},c^{k}_{21} = 0$, 所以 $C$ 不是不可约的

```

### 左特征向量

回想一下,我们之前在 {ref}`特征值和特征向量 <la_eigenvalues>` 中讨论过特征向量。

特别地,如果 $v$ 是非零向量,且满足
,如果 $v$ 是非零向量,且满足

$$
Av = \lambda v
Expand All @@ -105,13 +109,13 @@ $$

为避免混淆,我们之前称为"特征向量"的将被称为"右特征向量"。

左特征向量在接下来的内容中将扮演重要角色,包括在马尔可夫假设下动态模型的随机稳态
左特征向量在下文中将扮演重要角色,特别是在马尔可夫假设下的动态模型中,它们与随机稳态分布密切相关

如果 $w$ 是 $A^\top$ 的右特征向量,那么 $w$ 被称为 $A$ 的左特征向量。

换句话说,如果 $w$ 是矩阵 $A$ 的左特征向量,那么 $A^\top w = \lambda w$,其中 $\lambda$ 是与左特征向量 $v$ 相关的特征值。

这暗示了如何计算左特征向量
这句话解释了如何计算左特征向量

```{code-cell} ipython3
A = np.array([[3, 2],
Expand Down Expand Up @@ -141,7 +145,7 @@ print(f"右特征向量为: \n {e[:,0]} and {-e[:,1]}\n")
print(f"左特征向量为: \n {ε[:,0]} and {-ε[:,1]}\n")
```

特征值是相同的,而特征向量本身是不同的
特征值是相同的,而特征向量却是不同的
(还要注意,我们取的是 {ref}`主特征值 <perron-frobe>` 的特征向量的非负值,这是因为 `eig` 函数会自动对特征向量进行归一化。)

然后我们可以对 $A^\top w = \lambda w$ 进行转置,得到 $w^\top A= \lambda w^\top$。
Expand All @@ -153,9 +157,9 @@ print(f"左特征向量为: \n {ε[:,0]} and {-ε[:,1]}\n")

对于一个非负方阵$A$,当$k \to \infty$时,$A^k$的行为由绝对值最大的特征值控制,通常称为**主特征值**。

对于任何这样的矩阵$A$,佩龙-弗罗贝尼乌斯定理描述了主特征值及其对应特征向量的某些特性
对于任何这样的矩阵$A$,佩龙-弗罗贝尼乌斯定理(Perron-Frobenius theorem)描述了主特征值及其对应特征向量的某些特性

```{prf:Theorem} 佩龙-弗罗贝尼乌斯定理
```{prf:Theorem} 佩龙-弗罗贝尼乌斯定理(Perron-Frobenius theorem)
:label: perron-frobenius

如果矩阵$A \geq 0$,那么:
Expand All @@ -170,14 +174,16 @@ print(f"左特征向量为: \n {ε[:,0]} and {-ε[:,1]}\n")
(关于原始矩阵的佩龙-弗罗贝尼乌斯定理的更多内容将在{ref}`下文 <prim_matrices>`中介绍。)
```

(这是该定理的一个相对简单的版本——更多详细信息请参见[这里](https://en.wikipedia.org/wiki/Perron%E2%80%93Frobenius_theorem))。
我们将在下面看到该定理的应用。
(这是该定理的一个简化版——更详细的版本请参见[这里](https://en.wikipedia.org/wiki/Perron%E2%80%93Frobenius_theorem))。

我们将在下文中运用该定理。

让我们使用我们之前见过的一个简单[例子](mc_eg1)来建立对这个定理的直觉
首先我们讨论一个之前见过的简单[例子](mc_eg1)来建立对这个定理的理解

现在让我们考虑每种情况的例子。

#### 示例:不可约矩阵

考虑以下不可约矩阵$A$:

```{code-cell} ipython3
Expand All @@ -192,7 +198,7 @@ A = np.array([[0, 1, 0],
eig(A)
```

现在我们可以看到佩龙-弗罗贝尼乌斯定理对不可约矩阵$A$的声明成立:
现在我们可以看到,佩龙-弗罗贝尼乌斯定理的结论对于不可约矩阵$A$成立。

1. 主特征值是实数且非负的。
2. 所有其他特征值的绝对值小于或等于主特征值。
Expand All @@ -203,7 +209,7 @@ eig(A)
(prim_matrices)=
### 原始矩阵

我们知道,在现实世界的情况下,很难让一个矩阵处处为正(尽管它们具有良好的性质)。
我们知道,在现实世界的情况下,矩阵很难处处为正(尽管它们具有很好的性质)。

然而,原始矩阵仍然可以在更宽松的定义下给我们提供有用的性质。

Expand All @@ -222,7 +228,7 @@ A = \begin{bmatrix} 0.5 & 0.1 \\
\end{bmatrix}
$$

这里的$A$也是一个原始矩阵,因为对于$k \in \mathbb{N}$,$A^k$处处非负
这里的$A$也是一个原始矩阵,因为对于$k \in \mathbb{N}$,$A^k$处处为正

$$
B = \begin{bmatrix} 0 & 1 \\
Expand All @@ -246,14 +252,15 @@ $B$是不可约的,但不是原始矩阵,因为在主对角线或次对角

如果$A$是原始矩阵,那么:

6. 对于$A$的所有不同于$r(A)$的特征值$\lambda$,不等式$|\lambda| \leq r(A)$是**严格的**,并且
6. 对于$A$的所有不同于$r(A)$的特征值$\lambda$,不等式$|\lambda| \leq r(A)$是该不等式**严格成立**,并且

7. 当$v$和$w$被归一化使得$w$和$v$的内积等于1时,我们有:

当$m \rightarrow \infty$时,$r(A)^{-m} A^m$收敛于$v w^{\top}$。矩阵$v w^{\top}$被称为$A$的**佩龙投影**。
```

#### 示例1:原始矩阵

考虑以下原始矩阵$B$:

```{code-cell} ipython3
Expand All @@ -270,7 +277,7 @@ np.linalg.matrix_power(B, 2)
eig(B)
```

现在让我们给出一些例子,看看佩龙-弗罗贝尼乌斯定理的声明是否对原始矩阵$B$成立:
现在让我们给出一些例子,看看佩龙-弗罗贝尼乌斯定理的结论是否对原始矩阵$B$成立:

1. 主特征值是实数且非负的。
2. 所有其他特征值的绝对值严格小于主特征值。
Expand All @@ -289,7 +296,7 @@ def compute_perron_projection(M):

r = np.max(eigval)

# 找出主要(佩龙)特征值的指数
# 找出主(佩龙)特征值的指数
i = np.argmax(eigval)

# 获取佩龙特征向量
Expand Down Expand Up @@ -347,6 +354,7 @@ for M in A1, A2, A3:
```

在非原始矩阵的情况下,不会观察到收敛。

让我们通过一个例子来说明

```{code-cell} ipython3
Expand All @@ -372,11 +380,11 @@ check_convergence(B)
(spec_markov)=
#### 示例2:与马尔可夫链的联系

我们现在准备好将这两节课中使用的语言联系起来
现在让我们把这两节课中使用的语言联系起来

原始矩阵既是不可约的,又是非周期的。

因此,佩龙-弗罗贝尼乌斯定理解释了为什么{ref}`伊玛目和寺庙矩阵 <mc_eg3>`和[哈密顿矩阵](https://en.wikipedia.org/wiki/Hamiltonian_matrix)都收敛到一个平稳分布,这就是这两个矩阵的佩龙投影。
因此,佩龙-弗罗贝尼乌斯定理解释了为什么{ref}`Imam 和 Temple 矩阵 <mc_eg3>`和{ref}`汉弥尔顿矩阵<mc_eg2>`都收敛到一个平稳分布,这就是这两个矩阵的佩龙投影。

```{code-cell} ipython3
P = np.array([[0.68, 0.12, 0.20],
Expand Down Expand Up @@ -406,25 +414,23 @@ mc = qe.MarkovChain(P_hamilton)
ψ_star
```

我们还可以验证 Perron-Frobenius 定理暗示的这些随机矩阵的其他性质。

+++
我们还可以验证佩龙-弗罗贝尼乌斯定理给出的这些随机矩阵的其他性质。

另一个例子是收敛间隙和收敛速率之间的关系
其中一个例子是收敛间隙和收敛速率之间的关系

在{ref}`练习<mc1_ex_1>`中,我们指出收敛速率由谱间隙决定,即最大特征值和第二大特征值之间的差异。

利用我们在这里学到的知识,可以证明这一点。

请注意,在本讲中我们使用 $\mathbb{1}$ 表示全1向量。

对于具有状态空间 $S$ 和转移矩阵 $P$ 的马尔可夫模型,我们可以将 $P^t$ 写成
对于具有状态空间 $S$ 和转移矩阵 $P$ 的马尔可夫模型$M$,我们可以将 $P^t$ 写成

$$
P^t=\sum_{i=1}^{n-1} \lambda_i^t v_i w_i^{\top}+\mathbb{1} \psi^*,
$$

这在{cite}`sargent2023economic`中得到证明,[这里](https://math.stackexchange.com/questions/2433997/can-all-matrices-be-decomposed-as-product-of-right-and-left-eigenvector)有一个很好的讨论
这在{cite}`sargent2023economic`中得到证明,[在这里](https://math.stackexchange.com/questions/2433997/can-all-matrices-be-decomposed-as-product-of-right-and-left-eigenvector)也有一个很好的讨论

在这个公式中,$\lambda_i$ 是 $P$ 的特征值,$v_i$ 和 $w_i$ 分别是对应的右特征向量和左特征向量。

Expand All @@ -441,7 +447,7 @@ $$
这可以用[Gershgorin圆盘定理](https://en.wikipedia.org/wiki/Gershgorin_circle_theorem)来证明,
但这超出了本讲的范围。

因此,根据 Perron-Frobenius 定理的第(6)条陈述,当 $P$ 是原始的时候,对所有 $i<n$,有 $\lambda_i<1$,且 $\lambda_n=1$。
因此,根据佩龙-弗罗贝尼乌斯定理的第(6)条陈述,当 $P$ 是原始的时候,对所有 $i<n$,有 $\lambda_i<1$,且 $\lambda_n=1$。

因此,在取欧几里得范数偏差后,我们得到

Expand All @@ -456,7 +462,8 @@ $$
```{exercise-start} 列昂惕夫投入产出模型
:label: eig_ex1
```
[瓦西里·列昂惕夫](https://en.wikipedia.org/wiki/Wassily_Leontief)开发了一个具有$n$个部门生产$n$种不同商品的经济模型,代表了经济不同部门之间的相互依存关系。
[华西里·列昂惕夫](https://baike.baidu.com/item/%E5%8D%8E%E8%A5%BF%E9%87%8C%C2%B7%E5%88%97%E6%98%82%E6%83%95%E5%A4%AB/11051863)
给出了一个具有$n$个部门生产$n$种不同商品的经济模型,代表了经济不同部门之间的相互依存关系。

在这个模型中,一部分产出在行业内部消耗,其余部分由外部消费者消费。

Expand All @@ -465,9 +472,9 @@ $$
下表描述了产出如何在经济中分配:
| | 总产出 | 农业 | 工业 | 服务业 | 消费者 |
|:----:|:-----:|:----:|:----:|:-----:|:-----:|
| 农业 | $x_1$ |0.3$x_1$|0.2$x_2$|0.3$x_3$| 4 |
| 工业 | $x_2$ |0.2$x_1$|0.4$x_2$|0.3$x_3$| 5 |
|服务业| $x_3$ |0.2$x_1$|0.5$x_2$|0.1$x_3$| 12 |
| 农业 | $x_1$ |0.3 $x_1$|0.2 $x_2$|0.3 $x_3$| 4 |
| 工业 | $x_2$ |0.2 $x_1$|0.4 $x_2$|0.3 $x_3$| 5 |
|服务业| $x_3$ |0.2 $x_1$|0.5 $x_2$|0.1 $x_3$| 12 |

第一行描述了农业的总产出$x_1$是如何分配的

Expand Down
Loading