思考题:
离散数据统计分组和连续数据统计分组各有什么特点?
何谓等距分组?何谓异距分组?举例说明它们各自的适用场合。
说明组距、组限、组数与组中值的含义及其计算方法。
考察单变量的特征时,为什么必须运用集中趋势和离散趋势两种测量法?
为什么低层次变量不能使用高层次变量的集中值和离散值?
变异系数与极差、四分位差、标准差相比,在数值表现形式上有何特点?在分析上又有何差别?
练习题:
被调查者的受教育年限如下、(年):
18、14、16、6、16、17、12、14、16、18、14、14、16、9、20、18、12
15、13、16、16、21、21、9、16、20、14、14、16、16
要求回答:(1)将数据分组,使组中值分别为6,9,12,15,18,21;(2)对分组数据做频数分布表;(3)做出频数分布的直方图;(4)10.5年的受教育年限在第几百分位数上。
美国2005年发行的电影风格及其分级资料如下表所示:
| 电影风格 | G | PG | PG-13 | R | 合计 |
|---|---|---|---|---|---|
| 动作与冒险 | 66.7 | 25.0 | 30.4 | 23.7 | 29.2 |
| 喜剧 | 33.3 | 60.0 | 35.7 | 10.5 | 31.7 |
| 艺术 | 0 | 15.0 | 14.3 | 44.7 | 23.3 |
| 惊险恐怖 | 0 | 0 | 19.6 | 21.1 | 15.8 |
| 合计 | 100 | 100 | 100 | 100 | 100 |
G——大众级;PG——辅导级,一些内容可能不适合儿童观看;PG-13——特别辅导级,建议13岁后儿童观看;R——建议17岁以上观看。 要求回答:(1)喜剧电影的占比是多少?(2)PG级中有多少是喜剧电影?(3)艺术电影中有多少是G级?(4)在2005年发行的电影中,有多少是PG级的喜剧?
对某高中理科班毕业前做了一次调查,主要是了解学生毕业后的打算,得到如下统计资料:
| 毕业后打算 | 男生 | 女生 |
|---|---|---|
| 上大学 | 188 | 44 |
| 上大专 | 36 | 6 |
| 参军 | 4 | 1 |
| 就业 | 14 | 3 |
| 其他 | 16 | 3 |
要求回答:(1)调查中男生占多大比例?(2)打算上大专的比例是多少?(3)打算上大专的男生占比是多少?(4)男生中参军与上大专加起来的比例是多少?(5)计划上大专的学生中有多少是男生?
某企业两个车间的工人生产定额完成情况如下表:
| 技术水平 | A车间 | A车间 | A车间 | B车间 | B车间 | B车间 |
|---|---|---|---|---|---|---|
| 工人数 | 完成定额工时 | 人均完成工时 | 工人数 | 完成定额工时 | 人均完成工时 | |
| 高 | 50 | 14,000 | 280 | 20 | 6,000 | 300 |
| 中 | 30 | 7,500 | 250 | 40 | 10,400 | 260 |
| 低 | 20 | 4,000 | 200 | 40 | 8,200 | 205 |
| 合计 | 100 | 25,500 | 255 | 100 | 24,600 | 246 |
从表中看,各个技术级别的工人劳动生产率都是A车间低于B车间。试问,为什么A车间合计的劳动生产率又会高于B车间?
对某地500户农村居民进行家计调查,按其食品开支占全部消费开支的比重(恩格尔系数)分组后,得到如下的频数分布资料:
| 恩格尔系数 | 居民户数 | 向上累计户数 |
|---|---|---|
| 20以下 | 6 | 6 |
| 20~30 | 38 | 44 |
| 30~40 | 107 | 151 |
| 40~50 | 137 | 288 |
| 50~60 | 114 | 402 |
| 60~70 | 74 | 476 |
| 70及以上 | 24 | 500 |
| 合计 | 500 | — |
要求回答:(1)计算500户农户的恩格尔系数的中位数和众数,并说明这两个平均数的具体分析意义。(2)利用上表资料,按农户户数计算恩格尔系数的算数平均数。(3)上面计算的算数平均数能否说明该地区恩格尔系数的一般水平。
根据第5题,将500户农户按年收入水平分组后,分别观察其食品开支占全部消费支出的比重(恩格尔系数),整理得到如下的复合分组资料。试以恩格尔系数为考察变量,利用上表资料分别计算该变量的总方差、组内方差和组间方差,并验证三者的数量关系。
| 恩格尔系数 | 年收入水平 2万元以下 | 年收入水平 2万~5万元 | 年收入水平 5万元及以上 | 合计 |
|---|---|---|---|---|
| 20以下 | 0 | 0 | 6 | 6 |
| 20~30 | 0 | 24 | 14 | 38 |
| 30~40 | 15 | 60 | 32 | 107 |
| 40~50 | 26 | 96 | 15 | 137 |
| 50~60 | 48 | 57 | 9 | 114 |
| 60~70 | 35 | 35 | 4 | 74 |
| 70及以上 | 16 | 8 | 0 | 24 |
| 合计 | 140 | 280 | 80 | 500 |
已知某村人均住房面积100平方米,标准差为80平方米,人均年收入为12000元,标准差为7000元,试问人均住房面积与人均月收入两个变量的差异哪个更大?
2014年中国普通本科院校情况如下表所示:
2014年中国普通本科院校情况
| 院校类型 | 院校数量(所) |
|---|---|
| 综合大学 | 291 |
| 理工院校 | 352 |
| 农业院校 | 42 |
| 林业院校 | 6 |
| 医药院校 | 103 |
| 师范院校 | 151 |
| 语文院校 | 30 |
| 财经院校 | 122 |
| 政法院校 | 33 |
| 体育院校 | 16 |
| 艺术院校 | 42 |
| 民族院校 | 14 |
| 合计 | 1202 |
资料来源:中华人民共和国统计局.中国统计年鉴:2015:704.
要求:
(1)绘制2014年中国普通本科院校情况的条形图;
(2)找出众数并计算异众比率。
某社区465名60周岁及以上老人养老情况如下表所示:
某社区60周岁及以上老人养老情况
| 养老类型 | 人数(人) |
|---|---|
| 与配偶或保姆居住 | 225 |
| 与子女同住 | 165 |
| 养老院养老 | 32 |
| 其他 | 43 |
| 合计 | 465 |
要求:
(1)绘制该社区60周岁及以上老人养老情况的条形图;
(2)绘制该社区60周岁及以上老人养老情况的饼图;
(3)找出该社区60周岁及以上老人养老情况的众数。
某班50名学生的统计学考试成绩数据如下表所示:
某班统计学考试成绩
| 44 | 52 | 57 | 60 | 60 | 62 | 63 | 65 | 67 | 67 |
|---|---|---|---|---|---|---|---|---|---|
| 68 | 69 | 70 | 70 | 72 | 73 | 73 | 73 | 74 | 74 |
| 75 | 75 | 75 | 76 | 76 | 77 | 78 | 78 | 79 | 79 |
| 80 | 81 | 81 | 83 | 84 | 84 | 85 | 85 | 85 | 86 |
| 87 | 87 | 87 | 88 | 89 | 90 | 91 | 92 | 95 | 98 |
要求:对上面的数据进行适当的分组,编制频次和百分比分布表,并绘制直方图和饼图。
下表是36名网络用户的年龄数据:
36名网络用户的年龄 单位:周岁
| 19 | 23 | 41 | 15 | 21 | 20 | 27 | 20 | 29 | 36 | 19 | 22 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 23 | 31 | 25 | 22 | 19 | 34 | 17 | 24 | 18 | 16 | 24 | 23 |
| 30 | 23 | 32 | 19 | 23 | 25 | 40 | 35 | 23 | 27 | 22 | 33 |
要求:根据上表数据,
(1)计算众数、中位数;
(2)计算四分位差;
(3)计算平均数和标准差。
某社区100名20~40周岁居民的月收入情况如下表所示:
某社区20~40周岁居民的月收入
| 收入(元) | 人数(人) |
|---|---|
| 8000以上 | 5 |
| 6000~8000 | 12 |
| 4000~6000 | 31 |
| 2000~4000 | 45 |
| 2000以下 | 7 |
要求:计算他们月收入的中位数、平均值及标准差。
将30个数据分为两部分。第一部分含有12个数据,均值为55,标准差为6;第二部分含有18个数据,均值为80,标准差为4。求这30个数据的均值与标准差。
下表是2014年中国各地区城市公园个数数据,
2014年中国各地区城市公园个数
| 地区 | 公园个数 | 地区 | 公园个数 | 地区 | 公园个数 |
|---|---|---|---|---|---|
| 北京 | 245 | 安徽 | 348 | 重庆 | 307 |
| 天津 | 94 | 福建 | 557 | 四川 | 466 |
| 河北 | 479 | 江西 | 310 | 贵州 | 63 |
| 山西 | 259 | 山东 | 790 | 云南 | 646 |
| 内蒙古 | 260 | 河南 | 306 | 西藏 | 59 |
| 辽宁 | 374 | 湖北 | 329 | 陕西 | 191 |
| 吉林 | 183 | 湖南 | 247 | 甘肃 | 116 |
| 黑龙江 | 331 | 广东 | 3408 | 青海 | 29 |
| 上海 | 161 | 广西 | 196 | 宁夏 | 73 |
| 江苏 | 883 | 海南 | 58 | 新疆 | 163 |
| 浙江 | 1106 |
资料来源:中华人民共和国统计局.中国统计年鉴:2015:854.
要求:根据上表数据,
(1)绘制2014年我国各地区城市公园个数的条形图;
(2)计算2014年我国各地区城市公园个数平均值和标准差。