分享好友

×
取消 复制
【Python代替Excel】3:数据的预览
2020-06-23 13:47:34

之前已经讲到anaconda的安装,如何读取Excel数据。

今天要学习读取了Excel数据之后,在Python里如何预览。当然print(amazon_data)可以查看数据,但是如果想知道data的其他信息,可以从下面的方法来看。

  • 查看列名:amazon_data.columns
  • 查看行数列数:amazon_data.shape
  • 查看前5行/后5行数据: amazon_data.head(5)、amazon_data.tail(5)
前5行数据
后5行数据
  • 查看每列的数据格式:amazon_data.dtypes
  • 数据的索引

列的索引:amazon_data['Id']或者amazon_data.loc[:, 'Id'] 数据ID列

行的索引:amazon_data.loc[0, :] 读取第1行(Python的索引从0开始)

某行某列:amazon_data.loc[2, 'Id'] ID列的第3个

  • 数据描述:amazon_data.describe()

包含了每一列的个数、均值、方差、最小值、最大值、分位数。如果查看某一列的,可以加上列的索引:amazon_data['Id'].describe()

包含了每一列的个数、有无空值、数据格式、内存大小

  • 语法讲解及延伸

大家要多注意数据的索引这部分,因为后续分析、处理数据,会经常使用到。如果查看某列数据,用amazon_data['Id']是可以的。但是如果要修改这列,最好使用amazon_data.loc[:,'Id']这种写法。

当然还有 amazon_data.iloc[ ] ,这是根据物理位置索引。比如第3行第5列,可以写 amazon_data.iloc[ 2, 4 ],注意索引都是从0开始的。

多行多列,可用 amazon_data.iloc[ 2:8, 1:3]

这里涉及到切片,比如 2:8,从2开始,但是到7结束。同样 1:3,从1开始,到2结束。

自己多动手操作一下。

分享好友

分享这个小栈给你的朋友们,一起进步吧。

数据分析与数据挖掘
创建时间:2020-06-17 15:23:29
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。 数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • 栈栈
    专家
戳我,来吐槽~