千锋教育-做有情怀、有良心、有品质的职业教育机构

400-811-9990
手机站
千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频
千锋教育

关注千锋学习站小程序
随时随地免费学习课程

上海
  • 北京
  • 郑州
  • 武汉
  • 成都
  • 西安
  • 沈阳
  • 广州
  • 南京
  • 深圳
  • 大连
  • 青岛
  • 杭州
  • 重庆
当前位置:贵阳千锋IT培训  >  技术干货  >  python实现Excel数据的探索和清洗

python实现Excel数据的探索和清洗

来源:千锋教育
发布人:xqq
时间: 2023-11-08 22:29:36

python实现Excel数据的探索和清洗

数据的探索和清洗

1、读取Excel文件的数据并转换为dataframe

#1.读取Excel文件的数据并转换为dataframe

file="d:/test/Summary/Data_Summary.xlsx"

data_raw=pd.read_excel(file,header=0,index_col=0)

#header设定为0:是为了使第1行的数据成为列的字段名

2、查看数据集的整体状态,了解基本特征列的情况

data_raw.head()

3、删除无效的数据列

remove_col=["序号"]

data_prep0=data_raw.drop(columns=remove_col,axis=1,inplace=None)

data_prep0.head()

4、查看数据集的整体信息,了解缺失值的分布情况

data_prep0.info()

5、检看数据集中缺失值的状态并删除缺失值

data_prep=data_prep0.dropna(subset=["产品"],axis=0)

data_prep.info()

6、检查数据集中重复值的状态并删除重复值

print("数据集中的重复值数量:",np.sum(data_prep.duplicated()))

#如果重复值的数量不为"0",则表示有重复值存在,可使用下列代码删除

#data_prep.drop_duplicates(keep="first",inplace=True)

以上就是Python实现Excel数据的探索和清洗,希望能对大家有所帮助。更多Python学习教程请关注IT培训机构:千锋教育。

声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。

猜你喜欢LIKE

python中如何使用@contextmanage?

2023-11-08

python中string和float之间的转换

2023-11-08

Python中PIL库有何用法?

2023-11-08

最新文章NEW

python实现Excel数据的探索和清洗

2023-11-08

python的ndarray与pandas的series如何相互转换?

2023-11-08

python os.listdir()解决乱码

2023-11-08

相关推荐HOT

更多>>

快速通道 更多>>

最新开班信息 更多>>

网友热搜 更多>>