广告位联系
返回顶部
分享到

Python实现批量提取Excel数据

python 来源:互联网 作者:佚名 发布时间:2024-12-18 21:15:27 人浏览
摘要

在数据处理和分析的过程中,Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据,进行汇总和分析。本文将详细介绍如何使用 pandas、openpyxl 和 xlrd 三种库

在数据处理和分析的过程中,Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据,进行汇总和分析。本文将详细介绍如何使用 pandas、openpyxl 和 xlrd 三种库来批量提取 Excel 数据,并提供相应的示例代码。

使用 pandas 批量提取 Excel 数据

pandas 是一个强大的数据分析库,它提供了直接读取和处理 Excel 文件的功能。

1. 安装 pandas

首先,确保已安装 pandas 和 openpyxl:

1

pip install pandas openpyxl

2. 读取单个 Excel 文件

1

2

3

4

5

6

7

import pandas as pd

 

# 读取 Excel 文件

df = pd.read_excel('data.xlsx')

 

# 显示前几行数据

print(df.head())

3. 批量读取多个 Excel 文件

假设有多个 Excel 文件存放在一个文件夹中,文件名格式为 data_1.xlsx, data_2.xlsx,以此类推。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

import os

 

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

 

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

 

# 初始化一个空的 DataFrame

all_data = pd.DataFrame()

 

# 逐个读取并合并

for file in file_list:

    df = pd.read_excel(file)

    all_data = all_data.append(df, ignore_index=True)

 

# 显示合并后的数据

print(all_data.head())

使用 openpyxl 批量提取 Excel 数据

openpyxl 是一个专门处理 Excel 文件的库,适用于处理 .xlsx 格式的文件。

1. 安装 openpyxl

1

pip install openpyxl

2. 读取单个 Excel 文件

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

from openpyxl import load_workbook

 

# 加载 Excel 文件

wb = load_workbook('data.xlsx')

 

# 选择活动工作表

ws = wb.active

 

# 读取所有数据

data = []

for row in ws.iter_rows(values_only=True):

    data.append(row)

 

# 打印数据

for row in data:

    print(row)

3. 批量读取多个 Excel 文件

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

import os

from openpyxl import load_workbook

 

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

 

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

 

# 初始化一个空的列表

all_data = []

 

# 逐个读取并合并

for file in file_list:

    wb = load_workbook(file)

    ws = wb.active

    for row in ws.iter_rows(values_only=True):

        all_data.append(row)

 

# 打印合并后的数据

for row in all_data:

    print(row)

使用 xlrd 批量提取 Excel 数据

xlrd 是一个用于读取 Excel 文件的库,适用于 .xls 和 .xlsx 格式的文件。

1. 安装 xlrd

1

pip install xlrd

2. 读取单个 Excel 文件

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

import xlrd

 

# 打开 Excel 文件

workbook = xlrd.open_workbook('data.xls')

 

# 选择工作表

sheet = workbook.sheet_by_index(0)

 

# 读取所有数据

data = []

for row_idx in range(sheet.nrows):

    row = sheet.row_values(row_idx)

    data.append(row)

 

# 打印数据

for row in data:

    print(row)

3. 批量读取多个 Excel 文件

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

import os

import xlrd

 

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

 

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]

 

# 初始化一个空的列表

all_data = []

 

# 逐个读取并合并

for file in file_list:

    workbook = xlrd.open_workbook(file)

    sheet = workbook.sheet_by_index(0)

    for row_idx in range(sheet.nrows):

        row = sheet.row_values(row_idx)

        all_data.append(row)

 

# 打印合并后的数据

for row in all_data:

    print(row)

总结

本文详细介绍了如何使用 pandas、openpyxl 和 xlrd 三种库批量提取 Excel 数据,并提供了相应的示例代码。通过这些方法,可以高效地处理多个 Excel 文件,提高数据处理的效率。希望这些内容能够帮助大家在实际开发中更好地处理 Excel 数据。


版权声明 : 本文内容来源于互联网或用户自行发布贡献,该文观点仅代表原作者本人。本站仅提供信息存储空间服务和不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权, 违法违规的内容, 请发送邮件至2530232025#qq.cn(#换@)举报,一经查实,本站将立刻删除。
原文链接 :
相关文章
  • Python实现自动化批量调整Word样式
    处理大量的Word文档是一个常见的任务,尤其是需要批量修改文档的样式时,手动操作既费时又容易出错。幸运的是,Python提供了丰富的库,
  • Python实现批量提取Excel数据
    在数据处理和分析的过程中,Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据,进行汇总和分析。
  • Python在PDF中添加或删除超链接的操作

    Python在PDF中添加或删除超链接的操作
    PDF文件现已成为文档存储和分发的首选格式。然而,PDF文件的静态特性有时会限制其交互性。超链接是提高PDF文件互动性和用户体验的关键
  • 从基础到进阶带你玩转Python中的JSON
    在Python中处理JSON数据是日常开发中的常见任务之一。JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,在Web开发、数据存储等多个
  • 基于Python开发一个Instant Messaging(IM)聊天工具
    在现代社会中,即时通讯工具已经成为人们日常沟通的重要工具。开发一个IM聊天工具不仅能够提高我们的编程技能,还能让我们更好地理解
  • 使用Python和Flask编写一个留言簿
    在本文中,我们将通过创建一个简单的留言簿应用来入门Flask。这个项目将帮助我们理解Flask的基本概念和功能,如路由、模板、表单处理等
  • python makedirs() 递归创建目录介绍
    在 Python 中,os.makedirs() 函数用于递归地创建目录。也就是说,它不仅会创建指定的目录,还会创建任何必要的父目录。这个函数在处理需要
  • 基于Python构建深度学习图像分类模型
    在人工智能的浪潮中,图像分类作为计算机视觉领域的基础任务之一,一直备受关注。随着深度学习技术的快速发展,基于Python的深度学习
  • python3.12.7降级到3.10.0的方法
    先将Python 3.12.7 降级到 3.10.0,然后将3.10.0版本设置为默认版本 步骤一: 要将 Python 从 3.12.7 降级到 3.10.0,你可以使用以下方法: 方法 1:从
  • Python数据可视化中常见的4种标注方式及示例

    Python数据可视化中常见的4种标注方式及示例
    常见的标注方式 文本标注 箭头标注 突出标注 趋势线标注 让我们通过Python实现来了解所有这些用于数据可视化的标注技术。 文本标注 文本
  • 本站所有内容来源于互联网或用户自行发布,本站仅提供信息存储空间服务,不拥有版权,不承担法律责任。如有侵犯您的权益,请您联系站长处理!
  • Copyright © 2017-2022 F11.CN All Rights Reserved. F11站长开发者网 版权所有 | 苏ICP备2022031554号-1 | 51LA统计