LOADING
793 字
4 分钟
随机向量协方差矩阵的对称非负定性质及其意义

随机向量协方差矩阵的对称非负定性质及其意义对称性证明

性质:协方差矩阵 Σ\Sigma 是对称矩阵,即 ΣT=Σ\Sigma^T = \Sigma

证明

σij=Cov(Xi,Xj)=E[(XiE[Xi])(XjE[Xj])]\sigma_{ij} = \text{Cov}(X_i, X_j) = E[(X_i - E[X_i])(X_j - E[X_j])]σji=Cov(Xj,Xi)=E[(XjE[Xj])(XiE[Xi])]\sigma_{ji} = \text{Cov}(X_j, X_i) = E[(X_j - E[X_j])(X_i - E[X_i])]

由于乘法的交换性,(XiE[Xi])(XjE[Xj])=(XjE[Xj])(XiE[Xi])(X_i - E[X_i])(X_j - E[X_j]) = (X_j - E[X_j])(X_i - E[X_i]),因此:

σij=σji\sigma_{ij} = \sigma_{ji}

这说明协方差矩阵关于主对角线对称。

非负定性(半正定性)证明

性质:协方差矩阵 Σ\Sigma 是非负定(半正定)矩阵,即对任意非零向量 vRnv \in \mathbb{R}^n,有 vTΣv0v^T \Sigma v \geq 0

证明方法一(分量形式)

对任意实向量 v=(v1,v2,,vn)Tv = (v_1, v_2, \dots, v_n)^T,有:

vTΣv=i=1nj=1nviσijvjv^T \Sigma v = \sum_{i=1}^n \sum_{j=1}^n v_i \sigma_{ij} v_j

Y=vTX=i=1nviXiY = v^T X = \sum_{i=1}^n v_i X_i,则:

vTΣv=vTE[(XE[X])(XE[X])T]vv^T \Sigma v = v^T E[(X - E[X])(X - E[X])^T] v=E[vT(XE[X])(XE[X])Tv]= E[v^T (X - E[X])(X - E[X])^T v]=E[(vT(XE[X]))2]=Var(Y)0= E[(v^T (X - E[X]))^2] = \text{Var}(Y) \geq 0

因为方差总是非负的,所以 vTΣv0v^T \Sigma v \geq 0

证明方法二(整体形式)

vTΣv=vTE[(Xμ)(Xμ)T]v=E[vT(Xμ)(Xμ)Tv]v^T \Sigma v = v^T E[(X - \mu)(X - \mu)^T] v = E[v^T (X - \mu)(X - \mu)^T v]=E[((Xμ)Tv)T((Xμ)Tv)]=E[(Xμ)Tv22]0= E[((X - \mu)^T v)^T ((X - \mu)^T v)] = E[\| (X - \mu)^T v \|^2_2] \geq 0

重要推论

  1. 特征值非负:由于 Σ\Sigma 是非负定矩阵,其所有特征值 λi0\lambda_i \geq 0

  2. 可对角化:由于 Σ\Sigma 是实对称矩阵,存在正交矩阵 QQ 使得:

    Σ=QΛQT\Sigma = Q \Lambda Q^T

    其中 Λ\Lambda 是对角矩阵,对角线元素为特征值

  3. 正定性的条件:当且仅当随机向量 XX 的分量线性无关时,Σ\Sigma 是正定矩阵(所有特征值 >0> 0

几何意义

1. 数据分布的”蓝图”

协方差矩阵描述了多维数据在空间中的分布形状:

  • 特征向量:指示数据分布的主轴方向(椭球的旋转方向)
  • 特征值:表示沿各主轴方向的伸展程度(椭球的轴长)
  • 行列式:等于所有特征值的乘积,代表椭球的”体积”

2. 椭球表示

在多元正态分布中,协方差矩阵定义了等概率密度面的形状——一个椭球:

  • 当协方差矩阵为对角阵时,椭球轴与坐标轴对齐
  • 当协方差矩阵有非零非对角元素时,椭球发生旋转

实际应用意义

1. 主成分分析(PCA)

PCA的核心就是对协方差矩阵进行特征值分解:

  • 找到数据方差最大的方向(最大特征值对应的特征向量)
  • 实现数据降维,保留主要信息
  • 消除变量间的相关性

2. 马氏距离

马氏距离定义为:

DM(x,μ)=(xμ)TΣ1(xμ)D_M(x, \mu) = \sqrt{(x - \mu)^T \Sigma^{-1} (x - \mu)}

相比欧氏距离,马氏距离:

  • 考虑了变量间的相关性
  • 不受量纲影响
  • 能更准确地衡量多维数据点的异常程度

3. 金融投资组合优化

在现代投资组合理论中:

  • 协方差矩阵描述资产间的风险相关性
  • 用于计算投资组合的方差(风险)
  • 非负定性保证了风险度量的合理性

4. 多元统计分析

  • 多元正态分布的参数
  • 假设检验的基础
  • 回归分析中的关键工具
随机向量协方差矩阵的对称非负定性质及其意义
/posts/study/multivariate-statistical-analysis/随机向量协方差矩阵的对称非负定性质及其意义对称性证明/
作者
Xs
发布于
2026-04-29
许可协议
CC BY-NC-SA 4.0

部分信息可能已经过时