数据采集与处理 - 单元考查卷(二)
考查范围:第4-5章 | 满分100分 | 考试时间90分钟
数据采集与处理 - 单元考查卷(二)
考查范围:第4-5章 | 满分100分 | 考试时间90分钟
第1题
选择题 (3分)
Pandas中,删除含有缺失值的行应使用?
答案解析
dropna()用于删除包含缺失值的行。
第2题
选择题 (3分)
以下哪个函数用于按指定列对DataFrame进行分组?
答案解析
groupby()用于分组操作。
第3题
选择题 (3分)
将两个DataFrame按共同列横向拼接,应使用?
答案解析
pd.merge()按共同列横向拼接。
第4题
选择题 (3分)
Min-Max归一化后,数据的范围是?
答案解析
Min-Max归一化将数据缩放到0到1之间。
第5题
选择题 (3分)
df.pivot_table中的aggfunc='mean'表示?
答案解析
aggfunc='mean'表示求平均值。
第6题
填空题 (6分)
Pandas中,检测缺失值的函数是 ______,填充缺失值的函数是 ______。
答案解析
isnull()或isna()检测缺失值,fillna()填充缺失值。
第7题
填空题 (3分)
merge函数的how='left'表示 ______ 连接。
答案解析
how='left'表示左连接,保留左表全部记录。
第8题
填空题 (6分)
groupby之后常用的聚合函数有 ______、______、______(写出3个即可)。
答案解析
常用聚合函数:mean(平均)、sum(求和)、count(计数)、max(最大)、min(最小)、std(标准差)等,任写3个即可。
第9题
实操题 (25分)
给定一个包含学生姓名、班级、语文、数学、英语成绩的CSV文件,请使用Pandas完成:1)计算每个学生的总分和平均分;2)按班级分组,计算各班平均分;3)找出总分最高的前5名学生。
参考答案与解析
评分标准:正确读取CSV(3分) + 计算总分(4分) + 计算平均分(4分) + 按班级分组(5分) + 各班平均分(4分) + 前5名(3分) + 代码规范(2分)
第10题
实操题 (30分)
有两个CSV文件:orders.csv(订单表,含订单ID、用户ID、金额)和users.csv(用户表,含用户ID、用户名、注册城市)。请使用merge合并两个表,然后:1)计算每个城市的总消费金额;2)找出消费金额最高的前3个城市。
参考答案与解析
评分标准:正确读取两个CSV(4分) + merge合并(8分) + 按城市分组(5分) + 计算总消费(5分) + 前3名(5分) + 代码规范(3分)
0/0