统计学第4章数据的概括性度量集中趋势

91百科网 50 0

第 4 章 数据汇总测量

集中趋势 集中趋势

集中趋势是指一组数据向某个中心值移动的程度,反映了一组数据中心点的位置。

模式

众数是一组数据中出现次数最多的变量值,用M0表示。 该众数主要用于衡量分类数据的集中趋势。 当然,它也适合作为序数数据和数值数据的集中趋势的度量。 一般来说,只有当数据量很大时,该模式才有意义。 【批量:如果数据量较小,也可以将数据处理成分组数据后使用该模式】

位数 中位数

中位数是一组数据排序后位于中间位置的变量值,用Me表示。 中位数主要用来衡量序数数据的集中趋势。 当然,它也适合衡量数值数据的集中趋势,但不适用于分类数据。 【批次:这里的分类数据不是分组数据,分组数据的中位数也是可以计算出来的,有意义】

四分位数

四分位数也称为四分位点,是一组数据排序后位于 25% 和 75% 位置的值。 四分位数通过 3 个点将所有数据分为 4 个相等的部分,每个部分包含 25% 的数据。 中间四分位数是中位数,因此四分位数通常指 25% 位置的值(称为下四分位数)和 75% 位置的值(称为下四分位数)。 是上四分位数)。

平均平均数

平均值也称为均值,是将一组数据相加并除以数据个数的结果。 均值是集中趋势最重要的衡量标准。 主要适用于数值数据[批量:区间数据和常比数据],但不适用于分类数据和序数数据。

简单的意思 简单的意思

根据未分组的数据计算出的平均值称为简单平均值。

加权平均 加权平均

根据分组数据计算出的平均值称为加权平均值。

几何平均数 几何平均数

几何平均数是n个变量乘积的n次方根,用G表示。几何平均数主要用于计算平均比率。 当变量值本身为比率形式时,采用求和平均法计算平均比率更为合理。 几何平均数主要用于计算某种现象的平均增长率。

变异率

异质性比是指非众数组的频率占总频率的比例,用Vr表示。 异质比主要用来衡量众数对一组数据的代表性。 异质比越大,说明非众数组的频数占总频数的比例越大,众数的代表性越差; 异质比越小,说明非众数组的频率占总频率的比例越小,众数的代表性越好。

四分位数偏差/四分位数范围/四分位数范围

四分位距是上四分位数和下四分位数之间的差值,用 Qd 表示。 四分位距反映了中间50%数据的分散程度。 值越小,数据越集中在中间; 值越大,说明中间的数据越分散。 四分位距不受极值的影响。 由于中位数也位于数据的中间,因此四分位距也在一定程度上说明了中位数代表一组数据的程度。

范围/全范围

一组数据的最大值和最小值之间的差值称为极差,也称为极差,用R表示。极差是描述数据分散程度的最简单的度量,但很容易受到极值的影响。

平均偏差/平均绝对偏差

平均差是各变量值与其平均值之差的绝对值的平均值,用Md表示。平均差以均值为中心,反映各数据与均值的平均差值。 它能够全面、准确地反映一组数据的离散状态。

方差方差

方差是每个变量的值与其平均值的平方偏差的平均值。 数据处理时,采用平方法消除偏差的正负号,然后求平均值。

标准差标准差

方差的平方根称为标准差。 标准差是有量纲的,与变量值具有相同的计量单位,其实际含义比方差更清晰。

自由度

计算样本方差时,偏差平方和除以样本数据个数减1,其中n-1,样本数据个数减1,称为自由度。

标准分 标准分

变量值与其均值的离差除以标准差的值称为标准分数,也称为标准化值或 z 分数。 标准分数给出了一组数据中值的相对位置。

异常值

几乎所有数据都包含在平均数据的±3个标准差范围内,而在±3个标准差之外的数据在统计学上被称为异常值。 【批次:离群值是极大值和远离平均值的极小值; 也可以以中位数±1.5四分位距​​为界来衡量]

色散系数/变异系数

离散系数也称为变异系数,是一组数据的标准差与其相应均值的比值。 离散系数是衡量数据离散程度的相对统计量。 主要用于比较不同样本数据的离散程度。 离散系数大,说明数据的离散程度也大; 离散系数小,说明数据的离散程度也小。

偏度

偏度一词最早由 Pearson 于 1895 年提出。它是数据分布对称性的度量。 【批:也有人把“偏度”称为“偏度”】

偏度系数 / SK

衡量偏度的统计量是偏度系数。 如果一组数据的分布是对称的,则偏度系数等于0; 如果偏度系数明显不等于0,则表明分布是不对称的; 偏度系数越大,偏度越大。

峰度

峰度一词由 Pearson 于 1905 年首次提出。它是衡量数据分布平坦程度或峰值程度的指标。

峰度系数 / K

测量峰度的统计量是峰度系数。 峰度通常与标准正态分布进行比较。 如果一组数据服从标准正态分布,则峰度系数的值等于0; 如果峰度系数的值明显不等于0,则表明该分布比正态分布更平坦或更尖锐,通常称为平峰分布或尖峰分布。 分散式。

标签: 平均 数据 系数 位数 比率

发表评论 (已有39075条评论)

评论列表