相关系数r的两个公式推导(等级相关系数在实践中非常有用但却不容易解释)

首先,它是一个估计量,但被它所估计的东西是什么?换言之,它是通过观测值计算的,但观测值的函数在观测值范围之外是没有什么相关性的,除非该函数是某分布之某个参数的估计量。现在的问题是这样的分布意味着什么?对于r = 1及r=-1,答案很显然;这种情况下研究对象个体的每种能力都是另一种能力的单调函数,这就是被等级相关系数所估计的东西(即研究对象个体能力的分布状况)。同样地,若研究对象个体的两种能力独立,则r的期望是0,所以,如果在一项研究中发现等级相关系数等于0,很自然地可将其视为(研究对象个体)两种能力无关的一种表示。然而,关于等级相关系数既不为0、也不为±1的那些数值的解释,就不那么容易了。计算等级相关系数的公式

r = ∑({x-(n 1)/2}{y-(n 1)/2})/√(∑{(x-(n 1)/2)^2} ∑{(y-(n 1)/2)^2 })

(亦可表为r = 1 – (6∑(x-y)^2 )/(n^3-n))

原本是为(两随机变量)正态相关而推导的;正态相关面在两随机变量取值中心凸起最高,而在(该两变量)其余取值处则会向各个方向延伸。在一项特定的试验中,正态相关面的各种组合都是可能出现的。但x和y的可能取值均在有限区间内,且x, y(一次)只能在其中取到也仅能取到一个值。因此,由等级相关系数公式表示的x和y的相关关系就需要作进一步的考察。等级相关系数r可能为某分布之一参数的估计量,但这分布为何并不清楚,而r是否为该参数的最佳估计也不清楚。

本文转述杰弗里关于等级相关系数的看法,更详细的讨论可见厦门大学出版社2014年出版的哈罗德·杰弗里著、龚凤乾译《概率论》4.7 等级相关,pp 251-258.

本文来自投稿,不代表8898网立场,如若转载,请注明出处:https://m.jiameng8898.com/16696.html