批量读取文件并生成 DataFrame

工作中经常会遇到需要分别读取一个文件夹下的多个文件,今天分享一个简便的方法来解决这种问题。

假如我们要读取的文件如下,怎样才能用最简便的方式读取所有的文件并生成 DataFrame 呢?

批量读取文件为 DataFrame 很简单,一个 for 循环就行,关键是如何用不同的变量保存对应的 DataFrame,exec 能够很好的解决这个问题。

完整代码如下:

from functools import reduce
import pandas as pd
import numpy as np
import glob

files = glob.glob('/Users/hp/Documents/Work/*.xlsx')
for f in files:
    name = 'df_' + f.split('/')[-1][:4] # 生成的 DataFrame 文件名
    exec("{} = pd.read_excel(f)".format(name))

发表评论

电子邮件地址不会被公开。