当前位置: 首页 > 编程日记 > 正文

Python openpyxl 之 Excel 文档简单操作

背景:生活中常常因日常工作,在记录统计方面需频繁处理较多 Excel 表格,这部分工作虽可由人工完成,但这样会显得有些繁琐且可能存在偏差,遂闲时查阅了是否有相关基于python处理Excel表格的学习文档,后获知这主要可以运用 win32 和 openpyxl 等第三方库来帮助完成。在此分享一下学习过程中有关 openpyxl 库的基本使用方法和一些心得体会。

openpyxl 是一个用于处理 xlsx 格式Excel表格文件的第三方python库,其支持Excel表格绝大多数基本操作。

安装方法

使用 pip 或通过专门python IDE(如pyCharm)进行安装

其中pip安装方法,命令行输入:  pip install openpyxl

基本使用

第一步先是要导入 openpyxl 模块

import openpyxl

读取Excel文档

通过调用方法load_workbook(filename)进行文件读取,该方法中还有一个read_only参数用于设置文件打开方式,默认为可读可写,该方法最终将返回一个workbook的数据对象

# 文件必须是xlsx格式,如果是其他格式在执行前可利用win32辅助转化
wb = openpyxl.load_workbook(‘example.xlsx’)

(一)获取工作表

每一个Excel表格中都会有很多张sheet工作表,在对表格操作前需要先选定一张工作表

# 获取所有工作表名(返回一个列表)
sheets = wb.get_sheet_names()# 获取某一特定的工作表
sheet = wb.get_sheet_by_name('Sheet2')# 获取工作表的表名
sheet_name = sheet.title# 一般来说,表格大多数用到的是打开时显示的工作表,这时可以用active来获取当前工作表
sheet = wb.active

(二)获取单元格

对Excel表格的操作最终都落于对单元格的操作,获取单元格有两种获取方法:sheet[列行名]sheet.cell(row,column)

# 通过sheet[列行名]获取
a = sheet['A2']# 通过sheet.cell(row,column)获取
b = sheet.cell(1, 2)  # 即sheet['B1']# 获取单元格内容
print(a.value)# 获取单元格所在列和行
print(‘a is ’+str((a.column,a.row)))

需要注意的是,sheet.cell(row,column)中参数分别是行和列,且必须为整数,如果列为英文字母,可以利用 openpyxl.utils 中的   column_index_from_string(char)进行字母数字的转化。顺便一说,同理也可以利用get_column_letter(number)进行数字字母间的转化

from openpyxl.utils import get_column_letter, column_index_from_string# 对列进行字母/数字转化
c_num = column_index_from_string('B')  # c_num = 2
c_char = get_column_letter(5)          # c_char = 'E‘

(三)获取行和列

在处理Excel表格有时可能需要对表格进行遍历查找,openpyxl中便提供了一个行和列的生成器(sheet.rowssheet.columns),这两个生成器里面是每一行(或列)的数据,每一行(或列)又由一个tuple包裹,借此可以很方便地完成对行和列的遍历

# 对行进行遍历,输出A1,B1,C1
for row in sheet.rows:for cell in row:print(cell.value)# 对列进行遍历,输出A1,A2,A3
for column in sheet.columns:for cell in column:print(cell.value)

学习时还发现也可以通过list(sheet.rows)[index](或list(sheet.columns)[index])对某一行或列进行遍历,而在此值得注意的是,由于sheet.rows(或sheet.columns)是生成器类型,是不能直接调用的,需将其转化为一个list类型,然后再通过索引遍历

# 对某一特定的行进行遍历
for cell in list(sheet.rows)[0]:print(cell.value)

同时,也可以通过使用sheet[行列值:行列值]来对给定单元格范围进行遍历

# 对某一单元格范围进行遍历
for spaces in sheet['A1':'B2']:for cell in spaces:print(cell.value)

另外,有时候我们还可能需要确定表格的大小,即获取表格行和列的最大值,可以用max_rowmax_column来获取

# 获得最大列和最大行
print(sheet.max_row)
print(sheet.max_column)

写入Excel文档

在开头读取时已经介绍,默认的打开方式为可读可写,那么使用load_workbook(filename)读取Excel文档后也就可以直接写入了。另外,如果需要新建一个Excel文件,可以使用Workbook()方法,同时它会自动提供一个sheet工作表。对于删除一个工作表,则可以使用workbook对象的remove(sheet)方法删除

# 新建一个Excel文档
wb = openpyxl.Workbook()# 删除某个工作表 
wb.remove(sheet)

(一)写入单元格

获取工作表和之前一样,如果使用load_workbook(filename)读取,那么获取工作表后可以直接通过sheet[行列值]写入单元格。学习时,有资料介绍还可以传入Excel中的公式进行赋值,不过要注意,在读取文件时需要加上参数data_only=True这样才能返回数字,否则将返回字符串,即公式本身

# 直接赋值
sheet['A1'].value = 2# 公式赋值
sheet['A6'].value = '=SUM(A1:A5)'

另外,也可使用sheet.append(parameters)一行或多行写入

# 写入一行
row = [1 ,2, 3, 4, 5]
sheet.append(row)# 写入多行
rows = [['ID', 'Name', 'Department'],['001', 'Lee','CS'],['002', 'John','MA'],['003', 'Amy','IS']
]
sheet.append(rows)

(二)保存文件

写完文件后,使用workbook.save(path+filename)进行保存,不过要注意文件扩展名一定要是xlsx格式

# 保存文件至当前目录
wb.save('new_file.xlsx')

设置单元格样式

单元格样式主要包括字体、边框、颜色以及对齐方式等,这些均位于openpyxl.styles库中

# 导入字体、边框、颜色以及对齐方式相关库
from openpyxl.styles import Font, Border, Side, PatternFill, colors, Alignment

(一)字体

通过sheet单元格font属性设置字体风格

# 设置字体风格为Times New Roman,大小为16,粗体、斜体,颜色蓝色
sheet['A1'].font = Font(name='Times New Roman', size=16, bold=True, italic=True, color=colors.BLUE)

(二)对齐方式

通过sheet单元格alignment属性设置文本对齐风格

# 通过参数horizontal和vertical来设置文字在单元格里的对齐方式,此外设置值还可为left和right
sheet['B1'].alignment = Alignment(horizontal='center',vertical='center')

(三)边框

通过sheet单元格border属性设置字体风格

# 首先设置边框四个方向的线条种类
left, right, top, bottom = [Side(style='thin', color='000000')] * 4
# 再将各方向线条作为参数传入Border方法
sheet['C1'].border = Border(left=left, right=right, top=top, bottom=bottom)

(四)设置行高和列宽

行和列的长度大小可以通过row_dimensions[序号].heightcolumn_dimensions[标号].width来设置

# 设置行高
sheet.row_dimensions[1].height = 25# 设置列宽
sheet.column_dimensions['D'].width = 15.5

(五)合并和拆分单元格

对单元格的合并与拆分,主要是通过sheet的merge_cells(args1:args2)unmerge_cells(args1:args2)两个方法来实现的

# 合并单元格
sheet.merge_cells('A1:B2')# 拆分单元格
sheet.unmerge_cells('A1:B2')

当然,除了对角矩形区域化合并,也可以对一行或一列进行合并,只需相应修改参数即可。不过,这里要注意的是,合并后单元格显示的文本内容是合并前最左上角单元格的内容,而其他单元格内容则会自动清除。

其他

在学习过程中,发现了一个有趣的现象:在对Excel文件利用前面所介绍的workbook.save(path+filename)方法保存后,再次打开保存的文件时发现之前已合并的单元格都只保留了原最左上角单元格的边框效果,而其他单元格的效果则全部被去除了。就此问题,起初是通过对合并区域内所有子单元格设置边框以防止保存后边框效果的消失,不过这种策略难免有一些麻烦。究此现象原因,目前博客论坛上较少有相关问题的提出和解释,我也暂时未能很好地解决此问题,如大家有更好的想法或见解,欢迎留言分享。


更多关于openpyxl的介绍,可以参阅readthedocs相关文档Openpyxl Documentation

转载于:https://www.cnblogs.com/Unikfox/p/9124767.html

相关文章:

售价910元!周志华等人英文新书《演化学习》出炉!

点击上方↑↑↑蓝字关注我们~整理 | 琥珀出品 | AI 科技大本营(公众号ID:rgznai100)关于人工智能教育,从学生培养方案,到课程设置、教材,甚至是授课老师,全国各大高校正探索一条新道路。先是从去…

linux 查看 文档 不显示注释 命令

原文:http://www.weiruoyu.cn/?p661 最近发现一个很好的命令,就是linux 查看 文档 不显示注释 的命令[rootlocalhost ha.d]# cat ha.cf |grep -v ^# logfile /var/log/ha-log 转载于:https://blog.51cto.com/weiruoyu/705840

【C++】C++11 STL算法(二):修改序列的操作(Modifying sequence operations)

目录一、copy、copy_if1、原型:2、说明:3、官方demo二、copy_n1、原型:2、说明:3、官方demo三、copy_backward1、原型:1、说明:1、官方demo四、move1、原型:2、说明:3、官方demo五、…

ECharts测量图,功率图

/*** 测量图,功率图1,仪表盘*/ mainpage.prototype.initEcharsGLT1 function(oneJZ){ //if(myChartGLT1 null && myChartGLT1 ! "" && myChartGLT1 ! undefined) {myChartGLT1.dispose(); //每次加载之前清除之前的echar…

北京智源人工智能研究院启动“智源学者计划”,与旷视发布首个智源联合实验室

4月16日,北京智源人工智能研究院与中国人工智能领军企业旷视召开“智源学者计划暨联合实验室发布会”。北京市科委副主任张光连,海淀区委常委、副区长李俊杰,以及来自科技部、北京市科委、海淀区人民政府、朝阳区人民政府、中关村管委会&…

配置隧道模式的IPSec.×××

一、拓扑及IP配置 二、配置清单 R1#show run Building configuration... Current configuration : 1449 bytes ! upgrade fpd auto version 12.4 service timestamps debug datetime msec service timestamps log datetime msec no service password-encryption ! hostname R1 …

【C++】C++11 STL算法(三):分隔操作(Partitioning operations)、排序操作(Sorting operations)

目录分隔操作(Partitioning operations)一、is_partitioned1、原型:2、说明:3、官网demo二、partition1、原型:2、说明:3、官方demo三、partition_copy1、原型:2、说明:3、官方demo四…

浪潮发布重磅产品“元脑”,专注AI全栈能力输出

整理 | 一一出品 | AI科技大本营(ID:rgznai100)4月16日,以“智慧凝聚”为题的IPF2019浪潮云数据中心合作伙伴大会在上海举办。大会重点聚焦浪潮“智慧计算”战略,以AI计算力和创新力,联接、承载、赋能合作伙伴。为了布…

React+Redux+中间件

MVVM是Model-View-ViewModel的缩写。mvvm是一种设计思想。Model 层代表数据模型,也可以在Model中定义数据修改和操作的业务逻辑;View 代表UI 组件,它负责将数据模型转化成UI 展现出来,ViewModel 是一个同步View 和 Model的对象。在…

ピエタ~幸せの青い鳥~相关

先打全所有升级补丁 不然没有end4 补丁下载页 4个end出现方法 只看律视角 选项任意→end1 只看愛视角 选项任意→end2 检查一下 这两个流程的CG是否收全了 开启唯视角以后有些CG是找不回的 只看唯视角 选项任意→end3 只看唯视角 最后一个选项选“唯” 此后只要律或愛的视角开…

【C++】C++11 STL算法(四):二分查找法(Binary search operations)、合并操作

目录一、lower_bound1、原型:2、说明:3、官方demo二、upper_bound1、原型:2、说明:3、官方demo三、binary_search1、原型:2、说明:3、官方demo四、equal_range1、原型:2、说明:3、官…

腾讯开源分布式NoSQL存储系统DCache | 技术头条

作者 | 山宝银,腾讯后台高级工程师,专注于分布式 NoSQL 存储领域的技术研发工作,参与腾讯多个自研存储系统的开发,在分布式系统、高可用与高性能服务等领域有较丰富的经验。来源 | 腾讯技术博客当你在电商平台秒杀商品或者在社交网…

老司机带你学爬虫——Python爬虫技术分享

什么是“爬虫”? 简单来说,写一个从web上获取需要数据并按规定格式存储的程序就叫爬虫; 爬虫理论上步骤很简单,第一步获取html源码,第二步分析html并拿到数据。但实际操作,老麻烦了~ 用Python写“爬虫”有哪…

[转载]分享WCF聊天程序--WCFChat

http://www.cnblogs.com/gaoweipeng/archive/2009/09/04/1560260.html 无意中在一个国外的站点下到了一个利用WCF实现聊天的程序,作者是:Nikola Paljetak。研究了一下,自己做了测试和部分修改,感觉还不错,分享给大家。…

【C++】C++11 STL算法(五):设置操作(Set operations)、堆操作(Heap operations)

目录设置操作(Set operations)一、includes1、原型:2、说明:3、官方demo二、set_difference1、原型:2、说明:3、官方demo三、set_intersection1、原型:2、说明:3、官方demo四、set_symmetric_difference1、…

63万张!旷视发布最大物体检测数据集Objects365 | 技术头条

编辑 | 琥珀来源 | AI科技大本营(id:rgznai100)昨日,在旷视科技联合北京智源人工智能研究院举办的发布会上,旷视研究院发布了物体检测数据集 Objects365,包含 63 万张图像数量,365 个类别数量&a…

(一)Android Studio 安装部署 华丽躲坑

叨叨两句先 小宇之前一直做前后端开发,只是略懂JS,未接触过Java和Android 近期工作任务也是兴趣使然,开始琢磨DJI二次开发 DJI是我最服气的无人机厂商,无人机稳定性极强,性价比狂高,还给了极度丰富的二次开…

linux 环境配置 安装jdk

一. 下载jdk5.0 for linux 到sun的主页 http://java.sun.com/j2se/1.5.0/download.jsp 下载jdk安装文件jdk-1_5_0_05-linux-i586.bin 二. 解压安装jdk 在shell终端下进入jdk-1_5_0_05-linux-i586.bin文件所在目录,执行命令 ./jdk-1_5_0_05-linux-i586.bin 这时会出现…

【C++】C++11 STL算法(六):最小/最大操作(Minimum/maximum operations)、比较运算(Comparison operations)

目录最小/最大操作(Minimum/maximum operations)一、max1、原型:2、说明:3、官方demo二、max_element1、原型:2、说明:3、官方demo三、min1、原型:2、说明:3、官方demo四、min_element1、原型:2…

springboot之定时任务

定时线程 说到定时任务,通常会想到JDK自带的定时线程来执行,定时任务。 回顾一下定时线程池。 public static ScheduledExecutorService newScheduledThreadPool(int var0) {return new ScheduledThreadPoolExecutor(var0);}public static ScheduledExec…

10只机器狗拉卡车!井然有序,毫不费力 | 极客头条

整理 | 琥珀出品 | AI科技大本营(ID:rgznai100)看来,这家娱乐网友多年的机器人公司终于要开始实现商用化了!最先备受期待的是它的网红机器狗 SpotMini。今日凌晨,据多家外媒报道,波士顿动力 (Boston Dynami…

linux下查看nginx,apache,mysql,php的编译参数

有时候nginx,apache,mysql,php编译完了想看看编译参数可以用以下方法 nginx编译参数: #/usr/local/nginx/sbin/nginx -V nginx version: nginx/0.6.32 built by gcc 4.1.2 20071124 (Red Hat 4.1.2-42) configure arguments: --us…

【C++】C++11 STL算法(七):排列操作(Permutation operations)、数值操作(Numeric operations)

排列操作&#xff08;Permutation operations&#xff09; 一、is_permutation 1、原型&#xff1a; template< class ForwardIt1, class ForwardIt2 > bool is_permutation( ForwardIt1 first1, ForwardIt1 last1, ForwardIt2 first2 );template< class ForwardIt…

码书:入门中文NLP必备干货:5分钟看懂“结巴”分词(Jieba)

导读&#xff1a;近年来&#xff0c;随着NLP技术的日益成熟&#xff0c;开源实现的分词工具越来越多&#xff0c;如Ansj、盘古分词等。在本文中&#xff0c;我们选取了Jieba进行介绍和案例展示&#xff0c;主要基于以下考虑&#xff1a;社区活跃。截止本文发布前&#xff0c;Ji…

《你必须掌握的Entity Framework 6.x与Core 2.0》正式出版感想

前言 借书正式出版之际&#xff0c;完整回顾下从写博客到写书整个历程&#xff0c;也算是对自己近三年在技术上的一个总结&#xff0c;整个历程可通过三个万万没想到来概括&#xff0c;请耐心阅读。 写博、写书完整历程回顾 从2013年12月注册博客园账号&#xff0c;注册博客园账…

JSF实现“Hello World!”

我们编写一个在页面上显示是“Hello World! ”&#xff0c;我们至少需要编写一个Page对象和一个对应模板文件&#xff08;tml&#xff09;。 第一步&#xff0c;Page对象编写 在Tapestry5中Page是与一个页面对应的POJO对象&#xff0c;它不需要继承Tapestry框架的任何基类或实现…

《权力的游戏》最终季上线!谁是你最喜爱的演员?这里有一份Python教程 | 附源码...

译者 | 刘畅编辑 | 琥珀出品 | AI科技大本营&#xff08;id&#xff1a;rgznai100&#xff09;《权力的游戏》最终季已于近日开播&#xff0c;对于全世界翘首以待的粉丝们来说&#xff0c;其最大的魅力就在于“无法预知的人物命运”。那些在魔幻时代的洪流中不断沉浮的人们&…

【C++】C++11 STL算法(八):对未初始化内存的操作(Operations on uninitialized memory)、C库(C library)

对未初始化内存的操作&#xff08;Operations on uninitialized memory&#xff09; 一、uninitialized_copy 1、原型&#xff1a; template< class InputIt, class ForwardIt > ForwardIt uninitialized_copy( InputIt first, InputIt last, ForwardIt d_first );2、…

OSPF高级设置实现全网互通

OSPF(开放式最短路径优先)是对链路状态路由协议的一种实现&#xff0c;隶属内部网关协议&#xff08;IGP&#xff09;&#xff0c;故运作于自治系统内部(AS)。采用戴克斯特拉算法&#xff08;Dijkstras algorithm&#xff09;被用来计算最短路径树。“Cost”作为路由度量值。链…

学习PHP ?

学PHP的决定真的是好的吗&#xff1f; 不怕又再错一次了吗&#xff1f; 已经是最后的一年半上学时间了.... 真的不愿再走之前那条失败的路&#xff0c;不愿&#xff0c;真的不愿&#xff1b; 这年半无论如何都要把一样技术搞精了 一年半的时间&#xff0c;对我来讲够了....只看…