广告位联系
返回顶部
分享到

Python查看数据类型与格式

python 来源:互联网 作者:佚名 发布时间:2022-09-26 20:45:37 人浏览
摘要

Python查看数据类型与格式 一般我们拿到一个数据,会先看一下这个数据有多少行多少列,各个字段是什么,数据格式类型是什么。在开始讲数据格式前,需要先梳理一下各个数据类型。

Python查看数据类型与格式

一般我们拿到一个数据,会先看一下这个数据有多少行多少列,各个字段是什么,数据格式类型是什么。在开始讲数据格式前,需要先梳理一下各个数据类型。

我们常使用的库一般是numpy和pandas,Numpy下的核心是数组(array,ndarray),Pandas下的核心是数据框(Series,DataFrame)

先随机创一点数据用来测试

1

2

3

4

5

import pandas as pd

import numpy as np

df=pd.DataFrame(np.random.randint(5,10,size=(10,2)),columns=['a','b'])

Array=np.random.randint(5,10,size=(10,2))

#假设我们不知道df和Array是什么数据类型

查看现有的数据是数据框类型还是数组矩阵类型

语法:type(XXX),适用于tuple/list/array/ndarray/Series/Dataframe

1

2

3

4

5

6

7

8

print(type(df))

#输出 class 'pandas.core.frame.DataFrame'这是DataFrame类型的数据

print(type(Array))

#输出class 'numpy.ndarray'这是多维数组

print(type(tuple(Array)))

#输出'tuple'这是元组

print(type(list(df['a'])))

#输出'class list'这是一个list类型

查看数据格式是字符串还是数字格式

这里需要区分一下Numpy和Pandas的查看方式略有不同,一个是dtype,一个是dtypes

1

2

3

4

print(Array.dtype)

#输出int64

print(df.dtypes)

#输出Df下所有列的数据格式 a:int64,b:int64

Python数据类型bytes

1 bytes类型的特性

Python 3.x之后,Python自带字符默认使用utf-8格式编码和显示

  • Python默认字符串string数据类型是utf-8显示形式的序列
  • bytes数据类型是utf-8格式的二进制形式的不可变序列
  • bytearray数据类型是utf-8格式的二进制形式的可变序列

1.1 ASCII表 

2 bytes类型创建与转化

2.1 bytes类型与数字

数字类型并不是字符串,无法直接生成对应的bytes类

Python对数字类型定义了特殊意义

① 当入参为数字时,表示创建nul(\x00)的向量

1

2

3

byte_str = bytes(10)

print(byte_str)

>>> b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'

② 当入参为数字的序列时,直接转为bytes的序列,且对应值相同,将数字序列直接写入底层应该使用这种方法

1

2

3

byte_str = bytes([1, 10, 0xF])

print(byte_str)

>>> b'\x00\x10\x0f'

③ 当二进制数据在[33, 126]区间时,属于ASCII表上可显示字符范围,会直接显示对应的字符

数字直接使用bytes创建

1

2

3

byte_str = bytes([33, 48, 126])

print(byte_str)

>>> b'!0~'

2.2 bytes类型与ASCII字符

2.2.1 创建bytes数据

① 使用b''创建

1

2

3

byte_str = b'Python'

print(byte_str)

>>> b'Python'

② 使用bytes()创建不可变序列

1

2

3

byte_str = bytes('Python', encoding='utf-8')

print(byte_str)

>>> b'Python'

③ 使用bytearray()创建可变序列

1

2

3

byte_str = bytearray('Python', encoding='utf-8')

print(byte_str)

>>> bytearray(b'Python')

2.2.2 还原bytes数据

① 使用bytes.decode()还原不可变序列

1

2

3

4

byte_str = bytes('Python', encoding='utf-8')

utf_str = bytes.decode(byte_str)

print(utf_str)

>>> 'Python'

② 使用bytearray.decode()还原可变序列

1

2

3

4

byte_str = bytearray('Python', encoding='utf-8')

utf_str = bytearray.decode(byte_str)

print(utf_str)

>>> 'Python'

2.3 bytes类型与汉字

在UTF-8中,每个汉字用3个Byte表示

1

2

3

byte_str = bytes('我是', encoding='utf-8')

print(byte_str)

>>> b'\xe6\x88\x91\xe6\x98\xaf'

还原:

1

2

3

4

byte_str = b'\xe6\x88\x91\xe6\x98\xaf'

utf_str = bytes.decode(byte_str)

print(utf_str)

>>> '我是'

3 bytes类型切片迭代

① 通过bytes[index]方式返回的是底层int类型

1

2

3

4

5

byte_str = b'a'

print(type(byte_str[0]))

print(byte_str[0])

>>> <class 'int'>

>>> 97

1

2

3

4

5

byte_str = b'abc'

print(type(byte_str[2]))

print(byte_str[2])

>>> <class 'int'>

>>> 99

② 通过for ... in bytes方式返回的是底层int类型

1

2

3

4

5

6

7

8

9

10

11

byte_str = b'abc'

for byte in byte_str:

    print(type(byte))

    print(byte)

     

>>> <class 'int'>

>>> 97

>>> <class 'int'>

>>> 98

>>> <class 'int'>

>>> 99

③ 通过bytes[start:end]方式返回的是底层bytes类型

1

2

3

4

5

byte_str = b'a'

print(type(byte_str[:]))

print(byte_str[:])

>>> <class 'bytes'>

>>> b'a'


版权声明 : 本文内容来源于互联网或用户自行发布贡献,该文观点仅代表原作者本人。本站仅提供信息存储空间服务和不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权, 违法违规的内容, 请发送邮件至2530232025#qq.cn(#换@)举报,一经查实,本站将立刻删除。
原文链接 : https://blog.csdn.net/Arwen_H/article/details/83473177
相关文章
  • Python Django教程之实现新闻应用程序

    Python Django教程之实现新闻应用程序
    Django是一个用Python编写的高级框架,它允许我们创建服务器端Web应用程序。在本文中,我们将了解如何使用Django创建新闻应用程序。 我们将
  • 书写Python代码的一种更优雅方式(推荐!)

    书写Python代码的一种更优雅方式(推荐!)
    一些比较熟悉pandas的读者朋友应该经常会使用query()、eval()、pipe()、assign()等pandas的常用方法,书写可读性很高的「链式」数据分析处理代码
  • Python灰度变换中伽马变换分析实现

    Python灰度变换中伽马变换分析实现
    1. 介绍 伽马变换主要目的是对比度拉伸,将图像灰度较低的部分进行修正 伽马变换针对的是对单个像素点的变换,也就是点对点的映射 形
  • 使用OpenCV实现迷宫解密的全过程

    使用OpenCV实现迷宫解密的全过程
    一、你能自己走出迷宫吗? 如下图所示,可以看到是一张较为复杂的迷宫图,相信也有人尝试过自己一点一点的找出口,但我们肉眼来解谜
  • Python中的数据精度问题的介绍

    Python中的数据精度问题的介绍
    一、python运算时精度问题 1.运行时精度问题 在Python中(其他语言中也存在这个问题,这是计算机采用二进制导致的),有时候由于二进制和
  • Python随机值生成的常用方法

    Python随机值生成的常用方法
    一、随机整数 1.包含上下限:[a, b] 1 2 3 4 import random #1、随机整数:包含上下限:[a, b] for i in range(10): print(random.randint(0,5),end= | ) 查看运行结
  • Python字典高级用法深入分析讲解
    一、 collections 中 defaultdict 的使用 1.字典的键映射多个值 将下面的列表转成字典 l = [(a,2),(b,3),(a,1),(b,4),(a,3),(a,1),(b,3)] 一个字典就是一个键对
  • Python浅析多态与鸭子类型使用实例
    什么多态:同一事物有多种形态 为何要有多态=》多态会带来什么样的特性,多态性 多态性指的是可以在不考虑对象具体类型的情况下而直
  • Python字典高级用法深入分析介绍
    一、 collections 中 defaultdict 的使用 1.字典的键映射多个值 将下面的列表转成字典 l = [(a,2),(b,3),(a,1),(b,4),(a,3),(a,1),(b,3)] 一个字典就是一个键对
  • Python淘宝或京东等秒杀抢购脚本实现(秒杀脚本

    Python淘宝或京东等秒杀抢购脚本实现(秒杀脚本
    我们的目标是秒杀淘宝或京东等的订单,这里面有几个关键点,首先需要登录淘宝或京东,其次你需要准备好订单,最后要在指定时间快速
  • 本站所有内容来源于互联网或用户自行发布,本站仅提供信息存储空间服务,不拥有版权,不承担法律责任。如有侵犯您的权益,请您联系站长处理!
  • Copyright © 2017-2022 F11.CN All Rights Reserved. F11站长开发者网 版权所有 | 苏ICP备2022031554号-1 | 51LA统计