浙教版(2019)必修1《第四章 数据处理与应用》2022年单元测试卷(1)
发布:2024/4/20 14:35:0
一、简单题
-
1.大力老师收集了学校高三年级7选3选课数据,存储在“选课情况.xlsx”中,其数据格式如图1所示,学科列下的“1”表示相应行的学生选了该学科,“0”表示未选。
(1)大力老师收集的数据存在一些问题,需要进行数据整理,下列说法合理的是
A.数据集中格式不一致的数据,需要进行格式转换
B.数据集中的异常数据应该直接删除或忽略
C.数据集中的缺失的数据可以用任意值填充
D.数据集中的重复数据须在审核的基础上进行合并或删除
(2)为实现统计各班技术选考人数,并找出技术选考人数最多的3个班级,大力老师通过Python编程进行数据处理,并以图表2的形式呈现结果。实现上述功能的Python程序如下,请在横线处填入合适的代码。
import pandas as pd
import matplotlib.jye.ai as plt
plt.rcParams[“font.jye.ai-serif“]=[“SimHei“]#中文显示
df=pd.read_excel(“选课情况.xlsx“)
g=df.groupby(“班级“,as_index=True).技术.①
df1=pd.DataFrame({“班级“:②
df1=df1.sort_values(“③
x=④
y=df1.技术人数[0:3]
plt.jye.ai(x,y,lable=“选技术人数“)
plt.jye.ai(“技术选科人数最多的三个班级“)
plt.jye.ai(“班级“)
plt.jye.ai(“人数“)
plt.jye.ai( )
plt.jye.ai(40,50)
plt.jye.ai( )组卷:1引用:2难度:0.4
一、简单题
-
3.某商场开业不久,老板为研判商场运营情况,调取了最近一个月的商品销售情况,如图表1如示。老板想知道哪些商品卖的多,哪些商品产生的利润多,同时为表彰先进,需统计每个员工销售商品数量,并做成图表,现老板高薪聘请你为运营总监,要求你设计python程序,完成上述功能。
import pandas as pd
import matplotlib.jye.ai as plt
pd.set_option('display.unicode.ambiguous_as_wide',True)#处理列数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width',True)
plt.rcParams['font.jye.ai-serif']='simhei'#图表显示中文字体
df=pd.read_csv(“sale.jye.ai“,encoding=“gbk“)#导入待处理 CSV 文件
①
df[“利润“]=(df[“单品售价“]-df[“单品进价“])*df[“销售数量“]#计算出每一笔业业务利润的情况
df1=②
print(③
#同理,统计同种商品的月销量,代码略
#统计本月每一位销售人员的商品销售数量
df2=df.groupby(“销售人员“,as_index=False)[“销售数量“].sum( )
print(④
x=⑤
plt.figure(figsize=(8,4))
plt.jye.ai(“商场运营情况分析“)
plt.jye.ai(x,y,label=“销售人员业绩图“,color=“r“)
plt.jye.ai( )
plt.jye.ai( )组卷:0引用:3难度:0.4 -
4.小林收集了各地区的油价存于文件“数据.xls”中(如图1所示),他对数据进行了如下操作:
Ⅰ.将文件“数据.xls”中的数据读入对象df中;将数据中的“八.八”修改为8.8;
Ⅱ.删除对象“df”中的“优惠”列,并将对象“df”进行更新;
Ⅲ.添加“平均油价”列,再进行相关计算;将对象“df”中数据按地区降序排序;
Ⅳ.筛选出对象“df”中数据“0 号柴油”不大于 8.4 元的数据行,保存到对象“d5”中;
Ⅴ.统计对象“d5”中的各个地域的地区个数,并绘制图表,如图2所示。
请在划线①②③④处填入合适的代码。
import pandas as pd
import matplotlib.jye.ai as plt
plt.rc('font',**{'family':'SimHei'})
df=pd.read_excel('数据.xls')
df.①
df=df.②
df['平均油价']=(df['92 号汽油']+df['95 号汽油']+df['0 号柴油'])/3
df=df.sort_values('地区',ascending=False)
d5=③
g=d5.④
plt.jye.ai(g.jye.ai,g.jye.ai)
plt.jye.ai(“地域分布图“)
plt.jye.ai( )组卷:0引用:2难度:0.3