单元考查卷(一)
第1-2章(数据分析概述 + 数据预处理与清洗)
数据分析技术 · 单元考查卷(一)
考查范围:第1-2章(数据分析概述 + 数据预处理与清洗)
满分:100分
时间:90分钟
第1题
选择题 (3分)
数据分析流程的第一步是?
解析
第一步是明确问题。
第2题
选择题 (3分)
下列哪项不属于数据质量评估维度?
解析
数据质量四维度不含复杂性。
第3题
选择题 (3分)
某列数据缺失比例为2%,最合适的处理方法是?
解析
缺失比例很小时直接删除最简单有效。
第4题
选择题 (3分)
箱线图中,IQR指的是?
解析
IQR = Q3 - Q1。
第5题
选择题 (3分)
Python pandas中,查看缺失值数量的方法是?
解析
df.isnull().sum()统计每列缺失值数量。
第6题
选择题 (3分)
数据分布右偏时,用什么填充缺失值更稳健?
解析
右偏分布用中位数填充更稳健。
第7题
选择题 (3分)
3sigma原则中,约多少%的数据落在均值+/-3倍标准差范围内?
解析
3sigma原则约99.7%。
第8题
选择题 (3分)
商务数据分析师的核心工具不包括?
解析
Photoshop不是数据分析核心工具。
第9题
选择题 (3分)
删除重复行的pandas命令是?
解析
df.drop_duplicates()删除重复行。
第10题
选择题 (3分)
数据清洗的主要目的不包括?
解析
不是删除所有缺失值,而是根据情况处理。
第11题
判断题 (2分)
数据分析的最后一步是可视化呈现。( )
解析
最后一步是输出建议。
第12题
判断题 (2分)
缺失值比例超过50%的列建议直接删除。( )
解析
缺失比例过高时填充不可靠,建议删除。
第13题
判断题 (2分)
异常值一定是错误数据,必须删除。( )
解析
异常值不一定是错误,可能是真实极端情况。
第14题
判断题 (2分)
Tableau Public是免费的数据可视化工具。( )
解析
Tableau Public是免费版本。
第15题
判断题 (2分)
数据一致性要求同一含义的数据格式统一。( )
解析
一致性要求格式统一。0/100分