思考题:

  1. 离散数据统计分组和连续数据统计分组各有什么特点?

  2. 何谓等距分组?何谓异距分组?举例说明它们各自的适用场合。

  3. 说明组距、组限、组数与组中值的含义及其计算方法。

  4. 考察单变量的特征时,为什么必须运用集中趋势和离散趋势两种测量法?

  5. 为什么低层次变量不能使用高层次变量的集中值和离散值?

  6. 变异系数与极差、四分位差、标准差相比,在数值表现形式上有何特点?在分析上又有何差别?

练习题:

  1. 被调查者的受教育年限如下、(年):

    18、14、16、6、16、17、12、14、16、18、14、14、16、9、20、18、12

    15、13、16、16、21、21、9、16、20、14、14、16、16

    要求回答:(1)将数据分组,使组中值分别为6,9,12,15,18,21;(2)对分组数据做频数分布表;(3)做出频数分布的直方图;(4)10.5年的受教育年限在第几百分位数上。

  2. 美国2005年发行的电影风格及其分级资料如下表所示:

    电影风格GPGPG-13R合计
    动作与冒险66.725.030.423.729.2
    喜剧33.360.035.710.531.7
    艺术015.014.344.723.3
    惊险恐怖0019.621.115.8
    合计100100100100100

    G——大众级;PG——辅导级,一些内容可能不适合儿童观看;PG-13——特别辅导级,建议13岁后儿童观看;R——建议17岁以上观看。 要求回答:(1)喜剧电影的占比是多少?(2)PG级中有多少是喜剧电影?(3)艺术电影中有多少是G级?(4)在2005年发行的电影中,有多少是PG级的喜剧?

  3. 对某高中理科班毕业前做了一次调查,主要是了解学生毕业后的打算,得到如下统计资料:

    毕业后打算男生女生
    上大学18844
    上大专366
    参军41
    就业143
    其他163

    要求回答:(1)调查中男生占多大比例?(2)打算上大专的比例是多少?(3)打算上大专的男生占比是多少?(4)男生中参军与上大专加起来的比例是多少?(5)计划上大专的学生中有多少是男生?

  4. 某企业两个车间的工人生产定额完成情况如下表:

    技术水平A车间A车间A车间B车间B车间B车间
     工人数完成定额工时人均完成工时工人数完成定额工时人均完成工时
    5014,000280206,000300
    307,5002504010,400260
    204,000200408,200205
    合计10025,50025510024,600246

    从表中看,各个技术级别的工人劳动生产率都是A车间低于B车间。试问,为什么A车间合计的劳动生产率又会高于B车间?

  5. 对某地500户农村居民进行家计调查,按其食品开支占全部消费开支的比重(恩格尔系数)分组后,得到如下的频数分布资料:

    恩格尔系数居民户数向上累计户数
    20以下66
    20~303844
    30~40107151
    40~50137288
    50~60114402
    60~7074476
    70及以上24500
    合计500

    要求回答:(1)计算500户农户的恩格尔系数的中位数和众数,并说明这两个平均数的具体分析意义。(2)利用上表资料,按农户户数计算恩格尔系数的算数平均数。(3)上面计算的算数平均数能否说明该地区恩格尔系数的一般水平。

  6. 根据第5题,将500户农户按年收入水平分组后,分别观察其食品开支占全部消费支出的比重(恩格尔系数),整理得到如下的复合分组资料。试以恩格尔系数为考察变量,利用上表资料分别计算该变量的总方差、组内方差和组间方差,并验证三者的数量关系。

    恩格尔系数年收入水平
    2万元以下
    年收入水平
    2万~5万元
    年收入水平
    5万元及以上
    合计
    20以下0066
    20~300241438
    30~40156032107
    40~50269615137
    50~6048579114
    60~703535474
    70及以上168024
    合计14028080500
  7. 已知某村人均住房面积100平方米,标准差为80平方米,人均年收入为12000元,标准差为7000元,试问人均住房面积与人均月收入两个变量的差异哪个更大?

  8. 2014年中国普通本科院校情况如下表所示:

    2014年中国普通本科院校情况

    院校类型院校数量(所)
    综合大学291
    理工院校352
    农业院校42
    林业院校6
    医药院校103
    师范院校151
    语文院校30
    财经院校122
    政法院校33
    体育院校16
    艺术院校42
    民族院校14
    合计1202

    资料来源:中华人民共和国统计局.中国统计年鉴:2015:704.

    要求:

    (1)绘制2014年中国普通本科院校情况的条形图;

    (2)找出众数并计算异众比率。

  9. 某社区465名60周岁及以上老人养老情况如下表所示:

    某社区60周岁及以上老人养老情况

    养老类型人数(人)
    与配偶或保姆居住225
    与子女同住165
    养老院养老32
    其他43
    合计465

    要求:

    (1)绘制该社区60周岁及以上老人养老情况的条形图;

    (2)绘制该社区60周岁及以上老人养老情况的饼图;

    (3)找出该社区60周岁及以上老人养老情况的众数。

  10. 某班50名学生的统计学考试成绩数据如下表所示:

    某班统计学考试成绩

    44525760606263656767
    68697070727373737474
    75757576767778787979
    80818183848485858586
    87878788899091929598

    要求:对上面的数据进行适当的分组,编制频次和百分比分布表,并绘制直方图和饼图。

  11. 下表是36名网络用户的年龄数据:

    36名网络用户的年龄 单位:周岁

    192341152120272029361922
    233125221934172418162423
    302332192325403523272233

    要求:根据上表数据,

    (1)计算众数、中位数;

    (2)计算四分位差;

    (3)计算平均数和标准差。

  12. 某社区100名20~40周岁居民的月收入情况如下表所示:

    某社区20~40周岁居民的月收入

    收入(元)人数(人)
    8000以上5
    6000~800012
    4000~600031
    2000~400045
    2000以下7

    要求:计算他们月收入的中位数、平均值及标准差。

  13. 将30个数据分为两部分。第一部分含有12个数据,均值为55,标准差为6;第二部分含有18个数据,均值为80,标准差为4。求这30个数据的均值与标准差。

  14. 下表是2014年中国各地区城市公园个数数据,

    2014年中国各地区城市公园个数

    地区公园个数地区公园个数地区公园个数
    北京245安徽348重庆307
    天津94福建557四川466
    河北479江西310贵州63
    山西259山东790云南646
    内蒙古260河南306西藏59
    辽宁374湖北329陕西191
    吉林183湖南247甘肃116
    黑龙江331广东3408青海29
    上海161广西196宁夏73
    江苏883海南58新疆163
    浙江1106

    资料来源:中华人民共和国统计局.中国统计年鉴:2015:854.

    要求:根据上表数据,

    (1)绘制2014年我国各地区城市公园个数的条形图;

    (2)计算2014年我国各地区城市公园个数平均值和标准差。