第2章 单变量统计描述分析

一、单选题(10题)

  1. 社会统计学中,变量取值必须满足的两个核心原则是( ) A. 全面性和完整性 B. 完备性和互斥性 C. 准确性和客观性 D. 系统性和关联性

  2. 下列哪种统计图最适合用于展示定类变量的分布情况( ) A. 直方图 B. 折线图 C. 圆瓣图 D. 累计图

  3. 对于定序变量的统计表制作,与定类变量的主要区别在于( ) A. 不需要标注表号和表头 B. 变量取值需保留固有次序 C. 不能同时列出频次和百分比 D. 无需设置表尾的资料来源

  4. 当研究某城市居民收入分布时,发现存在少数极高收入群体导致分布右偏,此时最适合作为集中趋势的测量值是( ) A. 均值 B. 众值 C. 中位值 D. 几何均值

  5. 直方图与条形图的本质区别在于( ) A. 直方图的长条宽度有实际意义 B. 条形图不能展示百分比 C. 直方图仅适用于定类变量 D. 条形图的长条必须垂直排列

  6. 下列哪种离散趋势测量方法仅适用于定距变量( ) A. 异众比率 B. 极差 C. 四分互差 D. 标准差

  7. 在洛伦茨曲线中,完全平均分配的表现形式是( ) A. 下凸的曲线 B. 上凸的曲线 C. 从原点到(100,100)的对角线 D. 水平直线

  8. 计算分组数据的中位值时,需通过累计百分比中的哪个点来确定中位值所在区间( ) A. 25% B. 50% C. 75% D. 100%

  9. 当变量分布呈现双峰形态时,不适合采用哪种集中值进行描述( ) A. 众值 B. 中位值 C. 均值 D. 累计值

  10. 多选项问题的“多选项二分法”本质上是将一个多选题转化为多个( ) A. 单选题 B. 判断题 C. 排序题 D. 开放题

二、判断题(10题)

  1. 社会统计学中的频次分布是变量取值与对应频次的对数集合。( )

  2. 定类变量的统计表中,变量取值的排列顺序会影响统计结果的准确性。( )

  3. 由于“四舍五入”导致百分比总和为99.9%或100.1%,属于统计错误。( )

  4. 中位值适用于定序变量和定距变量,不适用于定类变量。( )

  5. 直方图的纵轴高度在任何情况下都只能表示频次密度,不能直接用频次表示。( )

  6. 异众比率越接近1,说明众值的代表性越差,数据分布越分散。( )

  7. 分组数据计算均值时,用组中心值代替变量值会产生误差,但对社会学研究而言精度通常足够。( )

  8. 洛伦茨曲线越下凸,说明收入分配越平均,基尼系数越接近0。( )

  9. 定距变量分为连续型和离散型,家庭子女数属于连续型定距变量。( )

  10. 加权平均法通过对答案重要性打分并赋予权数,可保留答案的顺序信息。( )

三、计算题(10题)

  1. 某社区调查了200户家庭的结构类型,结果为:核心家庭110户,直系家庭60户,联合家庭15户,其他家庭15户。请计算异众比率。

  2. 以下是10名居民的月收入(单位:元):3000、3500、4000、4500、5000、5500、6000、6500、7000、7500。请计算该组数据的均值和极差。

  3. 某学校15名教师的教龄(单位:年)为:2、3、3、5、6、6、7、8、8、8、9、10、12、15、18。请计算教龄的众值和中位值。

  4. 某分组数据的组距为5,其中某组的真实组界为14.5 - 19.5,求该组的标明组界和中心值。

  5. 已知某变量的方差为64,调查总数N = 100,求该变量的标准差。

  6. 某地区家庭人口数的频次分布如下:1人户20户,2人户30户,3人户40户,4人户10户。请计算该地区家庭人口数的均值。

  7. 某分组数据中,中位值所在区间的真实下界L = 20,真实上界U = 25,下界累计百分比L% = 40%,上界累计百分比U% = 65%,请用线性插值法计算中位值。

  8. 以下数据为5名学生的社会学课程成绩:75、82、88、90、95。请计算成绩的方差(结果保留一位小数)。

  9. 某调查中,Q₂₅ = 35,Q₇₅ = 60,求该数据的四分互差。

  10. 某社区100名居民的每日运动时间分组统计,其中一组的频次为25,组距为2,求该组的频次密度。

四、应用题(10题)

  1. 某城市开展民族构成调查,收集到数据:汉族80万人,回族12万人,藏族5万人,其他民族3万人。请据此制作一份规范的定类变量百分比统计表,并注明表号、表头、标识行、主体行和表尾(假设资料来源为“某城市2024年人口普查数据”)。

  2. 某企业对300名职工的教育程度进行调查,结果分为:小学及以下40人,初中80人,高中100人,大专50人,本科及以上30人。请指出该变量的层次,并选择合适的集中值和离散值进行分析,说明选择理由。

  3. 某研究机构调查了100名离婚者的婚龄,其中婚龄7 - 9年的有25人,是所有分组中频次最高的组,该组的真实组界为6.5 - 9.5。请确定该组的中心值,并以此作为众值,结合婚龄分布的特点,分析该众值的社会学意义。

  4. 某社区居民月收入数据如下(单位:元):2000 - 3000(30人),3000 - 4000(50人),4000 - 5000(70人),5000 - 6000(35人),6000以上(15人)。请制作该数据的直方图,并说明直方图中长条宽度和高度的含义。

  5. 某学校对学生参与社团活动的情况进行调查,选项为书社(C)、摄影组(P)、舞蹈团(J)、体育组(O),部分调查结果为:CCCPOPCCCPOOPCOCPCCPOCPCCOCJCOOCPCCOOOOP。请采用多选项统计的合适方法处理该数据,并简要说明处理步骤。

  6. 某地区家庭子女数的累计频次分布显示,小于2名子女的累计频次为80,大于2名子女的累计频次为40,总家庭数为120。请据此分析该地区家庭子女数的集中趋势,并说明累计表在该分析中的作用。

  7. 某城市不同收入群体的家庭累计百分比与收入累计百分比数据如下:低收入群体20%对应收入累计5%,中低收入群体20%对应收入累计15%,中等收入群体20%对应收入累计30%,中高收入群体20%对应收入累计25%,高收入群体20%对应收入累计25%。请绘制洛伦茨曲线的大致形状,并判断该城市收入分配的公平程度。

  8. 某企业职工年龄分布为:21 - 30岁50人,31 - 40岁80人,41 - 50岁60人,51 - 60岁30人。请计算该数据的四分互差,并解释结果的社会学含义。

  9. 某调查机构对居民幸福感进行评价,将幸福程度分为非常幸福、比较幸福、一般、不太幸福、非常不幸福,分别赋予5、4、3、2、1的权数。调查100人后,非常幸福20人,比较幸福35人,一般25人,不太幸福15人,非常不幸福5人。请用加权平均法计算居民幸福感的平均得分,并分析该结果反映的居民幸福状况。

  10. 某社区开展垃圾分类知晓率调查,问卷设置5个多选题,询问居民知晓的垃圾分类方法。回收有效问卷200份,其中有120人选择了“可回收物分类”,100人选择了“厨余垃圾处理”,80人选择了“有害垃圾识别”。请采用多选项二分法处理该数据,并说明这种方法的优势。