IT教程 ·

用 Python 读写 Excel 表格

.NET Core 获取程序运行环境信息与反射的应用

Python 能够读写 Excel 表格吗?

固然能够。 Python 下有许多类库能够做到, openpyxl 就是个中的佼佼者。

openpyxl 的设想异常美丽 ,你一定会喜好它!不信请往下看:

事情簿

入手下手 openpyxl 前,无需提早建好事情簿( Workbook )。 只需导入 Workbook 类,便可在内存中建立新事情簿并入手下手操纵:

>>> from openpyxl import Workbook
>>> wb = Workbook()

新建的事情簿默许预先建好一个事情表,经由过程 active 属性即可猎取:

>>> ws = wb.active

注解

假如事情簿包含多个事情表,该属性将返回第一个。

经由过程 create_sheet 要领,能够建立新的事情表。 建立能够是在后面追加:

>>> ws1 = wb.create_sheet('Mysheet')

或许,在前面插进去:

>>> ws1 = wb.create_sheet('Mysheet', 0)

未指定表格名将自动生成,序列形如: SheetSheet1Sheet2 ,以此类推。 固然了,你以为不合适能够举行修正:

>>> ws.title = 'New Title'

事情表标题标签背景色彩默许是白色。 用一个 RGB 色彩代码设置 sheet_properties.tabColor 属性即可修正:

>>> ws.sheet_properties.tabColor = "1072BA"

一旦你给事情表定名,便能够经由过程该名字来定位:

>>> ws3 = wb["New Title"]

经由过程 sheetnames 属性,能够掏出一切事情表表名:

>>> print(wb.sheetnames)
['Sheet2', 'New Title', 'Sheet1']

固然了,遍历一切事情表,直接 for-in 更加文雅:

>>> for sheet in wb:
...     print(sheet.title)

运用 copy_worksheet 要领,可在事情簿内拷贝事情表:

>>> source = wb.active
>>> target = wb.copy_worksheet(source)

从文件加载

假如已有事情簿,可经由过程 openpyxl.load_workbook 函数举行加载:

>>> from openpyxl import load_workbook
>>> wb2 = load_workbook('test.xlsx')
>>> print(wb2.sheetnames)
['Sheet2', 'New Title', 'Sheet1']

数据处理

单个单元格

操纵事情表,从修正单元格内容入手下手。单元格能够经由过程事情表键直接接见:

>>> cell = ws['A4']

这个语句将返回 A4 单元格,或许在单元格不存在时建立它。能够直接赋值:

>>> ws['A4'] = 10

另一种体式格局是运用 cell 要领接见单元格,指定行和列:

>>> cell = ws.cell(row=4, column=2, value=10)

注解

事情表建立后,不包含任何单元格,单元格在第一次被接见时自动建立。

多单元格

一连多个单元格能够经由过程切片获得:

>>> cell_range = ws['A1':'C2']

切片获得的单元格局限以下:

以行或列为单元也能够:

# 掏出 C 列
>>> colC = ws['C']

# 掏出 C 至 D 列
>>> col_range = ws['C:D']

# 掏出第 10 行
>>> row10 = ws[10]

# 掏出第 5 至 10 行
>>> row_range = ws[5:10]

运用 iter_rows 要领也能够:

# 从第 1 行入手下手遍历,直到第 2 行,每行最多返回 3 列
>>> for row in ws.iter_rows(min_row=1, max_row=2, max_col=3):
...    for cell in row:
...        print(cell)
<Cell Sheet1.A1>
<Cell Sheet1.B1>
<Cell Sheet1.C1>
<Cell Sheet1.A2>
<Cell Sheet1.B2>
<Cell Sheet1.C2>

如需遍历表格一切行或列,能够运用相干属性。运用 rows 属性遍历一切行:

>>> ws = wb.active
>>> ws['C9'] = 'hello world'
>>> tuple(ws.rows)
((<Cell Sheet.A1>, <Cell Sheet.B1>, <Cell Sheet.C1>),
(<Cell Sheet.A2>, <Cell Sheet.B2>, <Cell Sheet.C2>),
(<Cell Sheet.A3>, <Cell Sheet.B3>, <Cell Sheet.C3>),
(<Cell Sheet.A4>, <Cell Sheet.B4>, <Cell Sheet.C4>),
(<Cell Sheet.A5>, <Cell Sheet.B5>, <Cell Sheet.C5>),
(<Cell Sheet.A6>, <Cell Sheet.B6>, <Cell Sheet.C6>),
(<Cell Sheet.A7>, <Cell Sheet.B7>, <Cell Sheet.C7>),
(<Cell Sheet.A8>, <Cell Sheet.B8>, <Cell Sheet.C8>),
(<Cell Sheet.A9>, <Cell Sheet.B9>, <Cell Sheet.C9>))

运用 columns 属性遍历一切列:

>>> tuple(ws.columns)
((<Cell Sheet.A1>,
<Cell Sheet.A2>,
<Cell Sheet.A3>,
<Cell Sheet.A4>,
<Cell Sheet.A5>,
<Cell Sheet.A6>,
...
<Cell Sheet.B7>,
<Cell Sheet.B8>,
<Cell Sheet.B9>),
(<Cell Sheet.C1>,
<Cell Sheet.C2>,
<Cell Sheet.C3>,
<Cell Sheet.C4>,
<Cell Sheet.C5>,
<Cell Sheet.C6>,
<Cell Sheet.C7>,
<Cell Sheet.C8>,
<Cell Sheet.C9>))

数据存储

Excel 表格经由过程单元格存储数据,直接赋值即可:

>>> cell.value = 'hello, world'
>>> print(cell.value)
'hello, world'

>>> cell2.value = 3.14
>>> print(cell2.value)
3.14

与此同时,还能够给单元格附加范例以及格式化信息,建立事情簿时须要指定 guess_types 参数:

>>> wb = Workbook(guess_types=True)

这样一来,文本(包含百分比)将自动转换成浮点数:

>>> cell.value = '31.50'
>>> print(cell.value)
31.5

>>> cell2.value = '12%'
>>> print(cell2.value)
0.12

日期能够直接由原生的 datetime 对象来设置:

>>> import datetime
>>> cell.value = datetime.datetime.now()
>>> print cell.value
datetime.datetime(2010, 9, 10, 22, 25, 18)

保留至文件

最保险的保留体式格局是挪用 save 要领保留到指定文件:

>>> wb = Workbook()
>>> wb.save('balances.xlsx')

正告

这个操纵将掩盖已存在的文件,没有任何提醒!

借助 template 属性,能够将事情表保留成模板文档:

>>> wb = load_workbook('document.xlsx')
>>> wb.template = True
>>> wb.save('document_template.xltx')

或许保留成一般文档:

>>> wb = load_workbook('document_template.xltx')
>>> wb.template = False
>>> wb.save('document.xlsx', as_template=False)

保留至流

FlaskDjangoWeb 运用,大概须要将文件保留到流( stream )。 借助一个临时文件( NamedTemporaryFile )能够轻松完成:

>>> from tempfile import NamedTemporaryFile
>>> from openpyxl import Workbook
>>> wb = Workbook()

# 先保留到临时文件,再将文件内容读出
>>> with NamedTemporaryFile() as tmp:
...     wb.save(tmp.name)
...     tmp.seek(0)
...     stream = tmp.read()

附录

更多 Python 技术文章请接见:

一起了解 .Net Foundation 项目 No.8

参与评论