大力老师收集了学校高三年级7选3选课数据,存储在“选课情况.xlsx”中,其数据格式如图1所示,学科列下的“1”表示相应行的学生选了该学科,“0”表示未选。

(1)大力老师收集的数据存在一些问题,需要进行数据整理,下列说法合理的是 ADAD(多选)
A.数据集中格式不一致的数据,需要进行格式转换
B.数据集中的异常数据应该直接删除或忽略
C.数据集中的缺失的数据可以用任意值填充
D.数据集中的重复数据须在审核的基础上进行合并或删除
(2)为实现统计各班技术选考人数,并找出技术选考人数最多的3个班级,大力老师通过Python编程进行数据处理,并以图表2的形式呈现结果。实现上述功能的Python程序如下,请在横线处填入合适的代码。
import pandas as pd
import matplotlib.jye.ai as plt
plt.rcParams[“font.jye.ai-serif“]=[“SimHei“]#中文显示
df=pd.read_excel(“选课情况.xlsx“)
g=df.groupby(“班级“,as_index=True).技术.①sum( )sum( )
df1=pd.DataFrame({“班级“:②g.jye.aig.jye.ai,“技术人数“:g.jye.ai})
df1=df1.sort_values(“③技术人数技术人数“,ascending=False)
x=④df1.班级[0:3]或df1[“班级“][0:3]df1.班级[0:3]或df1[“班级“][0:3]
y=df1.技术人数[0:3]
plt.jye.ai(x,y,lable=“选技术人数“)
plt.jye.ai(“技术选科人数最多的三个班级“)
plt.jye.ai(“班级“)
plt.jye.ai(“人数“)
plt.jye.ai( )
plt.jye.ai(40,50)
plt.jye.ai( )
【考点】Python语言变量和赋值语句.
【答案】AD;sum( );g.jye.ai;技术人数;df1.班级[0:3]或df1[“班级“][0:3]
【解答】
【点评】
声明:本试题解析著作权属菁优网所有,未经书面同意,不得复制发布。
发布:2024/5/27 14:0:0组卷:1引用:2难度:0.4
相似题
-
1.运行下列Python程序后输出的结果是( )
发布:2025/1/2 9:30:2组卷:1引用:3难度:0.6 -
2.期中考试结束后,学生的姓名、班级、信息、通用成绩保存在“成绩.xlsx”文件中,部分数据截图如图a所示。为了得到技术平均分前3名的班级信息,小李同学利用pandas模块进行数据分析,分析结果如图b所示。数据分析代码如下,请回答以下问题。
(1)加框处代码有误,请修改成正确代码。
(2)请将横线处代码补充完整。发布:2025/1/2 10:30:2组卷:2引用:1难度:0.3 -
3.小明打算搭建一个大棚温度报警控制系统,传感器获取的温度数据经智能终端和IOT模块发送到服务器,服务器端程序采用FlaskWeb框架编写,网站的功能页面规划如表所示:
序号 访问地址 功能说明 1 / 主页,显示历史温度列表 2 /input?id=1&temp=25 提交传感器id和温度数据,并返回提示 3 /execute 分析统计温度数据 … … …
(1)由以上代码可知访问主页的地址是http://
(2)阅读代码可知提交的数据保存在
(3)①处路由为
(4)③处应填写的代码为发布:2025/1/2 10:30:2组卷:2引用:1难度:0.4