Python实现批量提取Excel数据_F11 - 专业站长和开发者的学习网站

本站首页收藏本站

广告位联系

APP正在开发中...

返回顶部

分享到

Python实现批量提取Excel数据

python 来源：互联网作者：佚名发布时间：2024-12-18 21:15:27 人浏览

摘要

在数据处理和分析的过程中，Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据，进行汇总和分析。本文将详细介绍如何使用 pandas、openpyxl 和 xlrd 三种库

在数据处理和分析的过程中，Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据，进行汇总和分析。本文将详细介绍如何使用 pandas、openpyxl 和 xlrd 三种库来批量提取 Excel 数据，并提供相应的示例代码。

使用 pandas 批量提取 Excel 数据

pandas 是一个强大的数据分析库，它提供了直接读取和处理 Excel 文件的功能。

1. 安装 pandas

首先，确保已安装 pandas 和 openpyxl：

1	`pip` `install` `pandas openpyxl`

2. 读取单个 Excel 文件

import pandas as pd

# 读取 Excel 文件

df = pd.read_excel('data.xlsx')

# 显示前几行数据

print(df.head())

3. 批量读取多个 Excel 文件

假设有多个 Excel 文件存放在一个文件夹中，文件名格式为 data_1.xlsx, data_2.xlsx，以此类推。

import os

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的 DataFrame

all_data = pd.DataFrame()

# 逐个读取并合并

for file in file_list:

df = pd.read_excel(file)

all_data = all_data.append(df, ignore_index=True)

# 显示合并后的数据

print(all_data.head())

使用 openpyxl 批量提取 Excel 数据

openpyxl 是一个专门处理 Excel 文件的库，适用于处理 .xlsx 格式的文件。

1. 安装 openpyxl

1	`pip` `install` `openpyxl`

2. 读取单个 Excel 文件

from openpyxl import load_workbook

# 加载 Excel 文件

wb = load_workbook('data.xlsx')

# 选择活动工作表

ws = wb.active

# 读取所有数据

data = []

for row in ws.iter_rows(values_only=True):

data.append(row)

# 打印数据

for row in data:

print(row)

3. 批量读取多个 Excel 文件

import os

from openpyxl import load_workbook

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的列表

all_data = []

# 逐个读取并合并

for file in file_list:

wb = load_workbook(file)

ws = wb.active

for row in ws.iter_rows(values_only=True):

all_data.append(row)

# 打印合并后的数据

for row in all_data:

print(row)

使用 xlrd 批量提取 Excel 数据

xlrd 是一个用于读取 Excel 文件的库，适用于 .xls 和 .xlsx 格式的文件。

1. 安装 xlrd

1	`pip` `install` `xlrd`

2. 读取单个 Excel 文件

import xlrd

# 打开 Excel 文件

workbook = xlrd.open_workbook('data.xls')

# 选择工作表

sheet = workbook.sheet_by_index(0)

# 读取所有数据

data = []

for row_idx in range(sheet.nrows):

row = sheet.row_values(row_idx)

data.append(row)

# 打印数据

for row in data:

print(row)

3. 批量读取多个 Excel 文件

import os

import xlrd

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一个空的列表

all_data = []

# 逐个读取并合并

for file in file_list:

workbook = xlrd.open_workbook(file)

sheet = workbook.sheet_by_index(0)

for row_idx in range(sheet.nrows):

row = sheet.row_values(row_idx)

all_data.append(row)

# 打印合并后的数据

for row in all_data:

print(row)

总结

本文详细介绍了如何使用 pandas、openpyxl 和 xlrd 三种库批量提取 Excel 数据，并提供了相应的示例代码。通过这些方法，可以高效地处理多个 Excel 文件，提高数据处理的效率。希望这些内容能够帮助大家在实际开发中更好地处理 Excel 数据。

您可能感兴趣的文章 :

原文链接 :

Tag : Excel(52)python(1030)

Python实现自动化批量调整Word样式

处理大量的Word文档是一个常见的任务，尤其是需要批量修改文档的样式时，手动操作既费时又容易出错。幸运的是，Python提供了丰富的库，
Python实现批量提取Excel数据

在数据处理和分析的过程中，Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据，进行汇总和分析。
Python在PDF中添加或删除超链接的操作

PDF文件现已成为文档存储和分发的首选格式。然而，PDF文件的静态特性有时会限制其交互性。超链接是提高PDF文件互动性和用户体验的关键
从基础到进阶带你玩转Python中的JSON

在Python中处理JSON数据是日常开发中的常见任务之一。JSON（JavaScript Object Notation）是一种轻量级的数据交换格式，在Web开发、数据存储等多个
基于Python开发一个Instant Messaging(IM)聊天工具

在现代社会中，即时通讯工具已经成为人们日常沟通的重要工具。开发一个IM聊天工具不仅能够提高我们的编程技能，还能让我们更好地理解
使用Python和Flask编写一个留言簿

在本文中，我们将通过创建一个简单的留言簿应用来入门Flask。这个项目将帮助我们理解Flask的基本概念和功能，如路由、模板、表单处理等
python makedirs() 递归创建目录介绍

在 Python 中，os.makedirs() 函数用于递归地创建目录。也就是说，它不仅会创建指定的目录，还会创建任何必要的父目录。这个函数在处理需要
基于Python构建深度学习图像分类模型

在人工智能的浪潮中，图像分类作为计算机视觉领域的基础任务之一，一直备受关注。随着深度学习技术的快速发展，基于Python的深度学习
python3.12.7降级到3.10.0的方法

先将Python 3.12.7 降级到 3.10.0，然后将3.10.0版本设置为默认版本步骤一：要将 Python 从 3.12.7 降级到 3.10.0，你可以使用以下方法：方法 1：从
Python数据可视化中常见的4种标注方式及示例

常见的标注方式文本标注箭头标注突出标注趋势线标注让我们通过Python实现来了解所有这些用于数据可视化的标注技术。文本标注文本

Python实现批量提取Excel数据

使用 pandas 批量提取 Excel 数据

1. 安装 pandas

2. 读取单个 Excel 文件

3. 批量读取多个 Excel 文件

使用 openpyxl 批量提取 Excel 数据

1. 安装 openpyxl

2. 读取单个 Excel 文件

3. 批量读取多个 Excel 文件

使用 xlrd 批量提取 Excel 数据

1. 安装 xlrd

2. 读取单个 Excel 文件

3. 批量读取多个 Excel 文件

总结

您可能感兴趣的文章 :

Python实现自动化批量调整Word样式

Python实现批量提取Excel数据

Python在PDF中添加或删除超链接的操作

从基础到进阶带你玩转Python中的JSON

基于Python开发一个Instant Messaging(IM)聊天工具

使用Python和Flask编写一个留言簿

python makedirs() 递归创建目录介绍

基于Python构建深度学习图像分类模型

python3.12.7降级到3.10.0的方法

Python数据可视化中常见的4种标注方式及示例

python批量下载抖音视频

利用Pyecharts可视化微信好友的方法

python爬取豆瓣电影TOP250数据

基于tensorflow权重文件的解读

解决Python字典查找报Keyerror的问题