首页 / 数据分析技术 / 单元考查卷(一)

单元考查卷(一)

第1-2章(数据分析概述 + 数据预处理与清洗)

数据分析技术 · 单元考查卷(一)
考查范围:第1-2章(数据分析概述 + 数据预处理与清洗) 满分:100分 时间:90分钟
第1题 选择题 (3分)
数据分析流程的第一步是?
A. 收集数据
B. 明确问题
C. 清洗处理
D. 可视化呈现
解析
第一步是明确问题。
第2题 选择题 (3分)
下列哪项不属于数据质量评估维度?
A. 完整性
B. 一致性
C. 复杂性
D. 准确性
解析
数据质量四维度不含复杂性。
第3题 选择题 (3分)
某列数据缺失比例为2%,最合适的处理方法是?
A. 直接删除该行
B. 用均值填充
C. 用回归预测填充
D. 不做处理
解析
缺失比例很小时直接删除最简单有效。
第4题 选择题 (3分)
箱线图中,IQR指的是?
A. 最大值-最小值
B. Q3-Q1
C. Q2-Q1
D. 均值-中位数
解析
IQR = Q3 - Q1。
第5题 选择题 (3分)
Python pandas中,查看缺失值数量的方法是?
A. df.null()
B. df.isnull().sum()
C. df.missing()
D. df.na().count()
解析
df.isnull().sum()统计每列缺失值数量。
第6题 选择题 (3分)
数据分布右偏时,用什么填充缺失值更稳健?
A. 均值
B. 中位数
C. 最大值
D. 最小值
解析
右偏分布用中位数填充更稳健。
第7题 选择题 (3分)
3sigma原则中,约多少%的数据落在均值+/-3倍标准差范围内?
A. 68%
B. 95%
C. 99.7%
D. 100%
解析
3sigma原则约99.7%。
第8题 选择题 (3分)
商务数据分析师的核心工具不包括?
A. Excel
B. SQL
C. Photoshop
D. Python
解析
Photoshop不是数据分析核心工具。
第9题 选择题 (3分)
删除重复行的pandas命令是?
A. df.drop_null()
B. df.drop_duplicates()
C. df.remove_dup()
D. df.unique()
解析
df.drop_duplicates()删除重复行。
第10题 选择题 (3分)
数据清洗的主要目的不包括?
A. 提高数据质量
B. 删除所有缺失值
C. 修正错误数据
D. 统一数据格式
解析
不是删除所有缺失值,而是根据情况处理。
第11题 判断题 (2分)
数据分析的最后一步是可视化呈现。( )
正确
错误
解析
最后一步是输出建议。
第12题 判断题 (2分)
缺失值比例超过50%的列建议直接删除。( )
正确
错误
解析
缺失比例过高时填充不可靠,建议删除。
第13题 判断题 (2分)
异常值一定是错误数据,必须删除。( )
正确
错误
解析
异常值不一定是错误,可能是真实极端情况。
第14题 判断题 (2分)
Tableau Public是免费的数据可视化工具。( )
正确
错误
解析
Tableau Public是免费版本。
第15题 判断题 (2分)
数据一致性要求同一含义的数据格式统一。( )
正确
错误
解析
一致性要求格式统一。
0/100分
← 返回课程总览