每组的最小值称为下(组)限,每组的最大值称为上(组)限,组限一般决定事物性质的数量界限。第一组80~90中,90是这组的最大值,所以是第一组的上组限。80是第二组的下组限。
一般地,连续变量分组多采用重叠组限,在分组时,凡遇到某单位标志值刚好等于相邻两组上下限数值时,一般把此值归并到下限的那一组。不重叠组限指在相邻两组中,较小一组的上限与较大一级的下限间断开,如100~499人,500~999人等。离散变量分组多采用不重叠组限。
扩展资料
1、确定组数。一组数据的组数一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。
2、确定各组的组距。组距为一个组的上限与下限的差,可根据全部数据的最大值和最小值(即极差)及所分的组数来确定,即组距=(最大值-最小值)/组数。
3、根据分组整理成频数分布表。
参考资料来源:百度百科-组距分组
参考资料来源:百度百科-组限
在进行组距式分组时,组距两端的数值称为组限(class boundary)。其中,每组的起点值称为下限。连续型变量中,上一组的上限同时也是下一组的下限。在分组时,凡遇到单位的标志值刚好等于相邻两组上下限数值时,一般把此值归并到作为下限的那一组。
上限 (upper boundary) 与下限 (lower boundary) 之间的中点数值称为组中值,
它是各组上下限数值的简单平均,即组中值=(上限+下限)/2。组中值经常被用以代表各组标志值的平均水平。分组中通常把上下两端的组运用开放式的组距,
即第一组用"多少以下",最后一组用"多少以上"表示,这两个组的组中值可参照相邻组的组距来决定, 其公式为 组中值 = 上限 - 相邻组的组距 /
2或下限 + 相邻组的组距 / 2,实务中组距大多相同,所以可以就简参照相邻组的组距来决定.
例如:"30岁以上的人"中,30即为下限,可运用上限公式计算组中值,而"50岁以下的人"中,50即为上限,可运用下限公式计算组中值.
在未明确上、下组限范围的情况下执行“上组限不在内”原则,“上组限不在内”原则是为了解决分组时的“不重”问题而
规定的,即,当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。例如:150这一数据不算在“140~150”这一
组内,而计算在“150~160”这一组。
这个问题统计学的书上是没有定义的,这个我想高中的时候应该讲过.在组距分组中,一个组的最小值称为下限,一个组的最大值称为上限.
不会出现第一组100~90,第二组90~80,第三组80~70 的情况.显然不合常理的,数字只可能由小排到大.
你的书上有数据分组么?
数据分组是根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。
数据分组有两种方法:单变量值分组和组距分组。
在连续变量或变量值较多的情况下,通常采用组距分组,它是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
在组距分组中,一个组的最小值称为下限,一个组的最大值称为上限。