文章信息
-
作者:Suvadeep Hajra1,Sayandeep Saha2,Manaar Alam3,Debdeep Mukhopadhyay1 。
这个系列是为了开题、汇报、论文中可能要用到的预备知识开设的,亦可用做入门练习。
协方差:用来描述两个随机变量之间的相关程度的指标,如果是正值,则说明二者正相关,负值则说明负相关,0则表示二者没有关系,公式如下所示: $$ \begin{equation} COV(X,Y)=\frac{1}{n-1}\sum_{i=1}^{n}(X_i - \bar{X})(Y_i - \bar{Y}) \end{equation} $$ 尽管协方差可以表示两个随机变量的相关程度,但其面临尺度不统一的问题,即由于没有执行标准化操作,其值取决于变量的单位,无法从直观上去判断具体的相关性。例如,在二维空间中,假设数据的分布较为离散,具体分布如表1所示。