标准差是数值分散的测量。
标准差的符号是 σ (希腊语字母 西格马,英语 sigma)
公式很简单:方差的平方根。那么…… "方差是什么?"
方差的定义是:
离平均的平方距离的平均。
按照以下的步骤来计算方差:
求数值的 平均
从每一个数值减去平均,然后求差的平方。
求结果的平均。(为什么要求平方?)
你和朋友们量度了狗狗的身高(毫米)
身高(到肩膀)是:600mm、470mm、170mm、430mm 和 300mm。
求平均、方差和标准差。
第一步是求平均:
平均 = 600 + 470 + 170 + 430 + 3005 = 19705 = 394
平均身高是 394 mm。我们画在图上:
要计算方差,求每个距离的平方,然后求平均:
方差是 21,704
标准差是方差的平方根:
标准差σ= √21,704= 147.32……=147(到最近的毫米)
标准差很有用。 我们现在可以显示哪个高度是在离平均一个标准差(147mm)之内:
标准差是一个甄别数值是正常与否的"标准"。
以上例子的数据是对象总体的数据(我们的对象就是那 5条狗)。
但如果数据是个样本(只是对象总体的一部分),计算便会有点改变!
其他的计算步骤不变,包括计算平均在内。
想象这是对样本数据的 "修补"。
这是在 标准差公式 网页里的两个公式(你可以去看看来了解更多):
"对象总体标准差":
"样本标准差":
乍看很复杂,但其实只是在计算样本方差时,有个重要的改变:
以除以 N-1 来代替除以 N。
脚注:为什么要求差的平方?
如果我们只把和平均的差加起来……负值和正值便会互相抵消:
4 + 4 − 4 − 44=0
这不行。我们可以用绝对值吗?
|4| + |4| + |−4| + |−4|4=4 + 4 + 4 + 44=4
不错(这叫 平均差),但看看这个例子:
|7| + |1| + |−6| + |−2|4=7 + 1 + 6 + 24=4
糟了!数据比较分散,但结果还是 4。
我们来试试求每个差的平方(最后才取平方根):
√(42+ 42+ 42+ 424)=√(644)=4
√(72+ 12+ 62+ 224)=√(904)=4.74...
好极了!当数据比较分散时,标准差也比较大……正是我们想要的。
其实这个方法和 两点之间的距离 都是基于同一个原理,不过应用不同而已。
同时,用代数来处理平方和平方根比处理绝对值要容易很多,标准差也比较容易被应用在其他数学领域。
本文非原创,本文非原创,本文非原创,原文转载自https://www.shuxuele.com/data/standard-deviation.html
下面几个问题的答案来自专业课教科书解答
Why do we square the deviations?
First, the sum of the squared deviations of any set of observations from their mean is the smallest that the sum of squared deviations from any number can possibly be. This is not true of the unsquared distances. So squared deviations point to the mean as center in a way that distances do not.
Second, the standard deviation turns out to be the natural measure of spread for a particularly important class of symmetric unimodal distributions, the Normal distributions.
Why do we emphasize the standard deviation rather than the variance?
One reason is that s, not s2, is the natural measure of spread for Normal distributions
There is also a more general reason to prefer s to s2. Because the variance involves squaring the deviations, it does not have the same unit of measurement as the original observations. The variance of the metabolic rates, for example, is measured in squared calories. Taking the square root gives us a description of the spread of the distribution in the original measurement units.
Why do we average by dividing by n – 1 rather than n in calculating the variance?
Because the sum of the deviations is always zero, the last deviation can be found once we know the other n − 1. So we are not averaging n unrelated numbers. Only n − 1 of the squared deviations can vary freely, and we average by dividing the total by n − 1.
degrees of freedom
The number n – 1 is called the degrees of freedom of the variance or standard deviation. Many calculators offer a choice between dividing by n and dividing by n − 1, so be sure to use n − 1.