首页 / 数据采集与处理 / 数据采集与处理 - 单元考查卷(二)

数据采集与处理 - 单元考查卷(二)

考查范围:第4-5章 | 满分100分 | 考试时间90分钟

数据采集与处理 - 单元考查卷(二)
考查范围:第4-5章 | 满分100分 | 考试时间90分钟
第1题 选择题 (3分)
Pandas中,删除含有缺失值的行应使用?
df.fillna()
df.dropna()
df.isnull()
df.replace()
答案解析
dropna()用于删除包含缺失值的行。
第2题 选择题 (3分)
以下哪个函数用于按指定列对DataFrame进行分组?
merge()
concat()
groupby()
pivot()
答案解析
groupby()用于分组操作。
第3题 选择题 (3分)
将两个DataFrame按共同列横向拼接,应使用?
pd.concat()
pd.merge()
df.join()
df.append()
答案解析
pd.merge()按共同列横向拼接。
第4题 选择题 (3分)
Min-Max归一化后,数据的范围是?
(-1, 1)
(0, 1)
均值为0
标准差为1
答案解析
Min-Max归一化将数据缩放到0到1之间。
第5题 选择题 (3分)
df.pivot_table中的aggfunc='mean'表示?
求和
计数
求平均值
求最大值
答案解析
aggfunc='mean'表示求平均值。
第6题 填空题 (6分)
Pandas中,检测缺失值的函数是 ______,填充缺失值的函数是 ______。
答案解析
isnull()或isna()检测缺失值,fillna()填充缺失值。
第7题 填空题 (3分)
merge函数的how='left'表示 ______ 连接。
答案解析
how='left'表示左连接,保留左表全部记录。
第8题 填空题 (6分)
groupby之后常用的聚合函数有 ______、______、______(写出3个即可)。
答案解析
常用聚合函数:mean(平均)、sum(求和)、count(计数)、max(最大)、min(最小)、std(标准差)等,任写3个即可。
第9题 实操题 (25分)
给定一个包含学生姓名、班级、语文、数学、英语成绩的CSV文件,请使用Pandas完成:1)计算每个学生的总分和平均分;2)按班级分组,计算各班平均分;3)找出总分最高的前5名学生。
参考答案与解析
评分标准:正确读取CSV(3分) + 计算总分(4分) + 计算平均分(4分) + 按班级分组(5分) + 各班平均分(4分) + 前5名(3分) + 代码规范(2分)
第10题 实操题 (30分)
有两个CSV文件:orders.csv(订单表,含订单ID、用户ID、金额)和users.csv(用户表,含用户ID、用户名、注册城市)。请使用merge合并两个表,然后:1)计算每个城市的总消费金额;2)找出消费金额最高的前3个城市。
参考答案与解析
评分标准:正确读取两个CSV(4分) + merge合并(8分) + 按城市分组(5分) + 计算总消费(5分) + 前3名(5分) + 代码规范(3分)
0/0