首先引入一个概念,python这个语言里面有很多很成熟的“包”,也就是各种操作的moudle,对于某一个特定的project里面的code,我们可以调用各种各样的包来帮助我们完成某些操作,这里不由得感叹一句,那些开发出这些包的人真的是蛮厉害的
读了一些各位大牛的博客之后发现,好像python的话常用来操作excel的有这个openpyxl,xlwt,xlrd等等,大概看了看大佬们的推荐,感觉openpyxl的功能比较全面,而且只有一个包就够了
好像这个的缺点是处理数据需要的时间相对来说比较长,不过我的数据处理量也没有那么大,于是就选择了openpyxl这个包来折腾
首先明确一下这个脚本的目的,就是读取从server上下载的.dat文件,这个文件里面的格式大概是这样的
对于这样一个文件,我们把它转换成Excel的文件会更容易进行直观的编辑,我们想要的结果大概是这样的
而我们有一大堆这样的文件,分别处于以规律的数字命名的directory里(其实也就是提交job时候的文件夹),于是我们就需要一个script来分别打开这样的.dat文件,再把他们写入到一个workbook里面,每一个.dat文件独占一个worksheet,worksheet以读取该.dat文件的directory的名字命名,这就是我们这个script的意义步骤如下:1. 读取.dat文件
再将读取的数据分割成columns,因为数据一共7个cols,所以这里分割成了7个,这个写得有点愚蠢,大大们不要喷我哈,以后再尝试改成更精简的方法
这样我们就得到了一个存着被分割好的数据的list(这个list感觉就像c里面的一个2d array,不知道我理解得有没有问题),然后我们把这个list写进.xlsx文件就可以了
openpyxl这个Moudle似乎比较特殊,要先安装jdcal这个moudle,否则是无法安装成功的?这里有大大懂这个的话希望可以帮忙解释一下
这样就可以打开/创建一个处于给定的path的xlsx文件了,这个文件是一个workbook,里面最开始会自动创建一个worksheet,名叫Sheet,这个操作就和直接新建一个空白的xlsx是一样的
在创建了这个文件之后,我们可以对这个文件进行写入和读出等操作,首先是创建一个以读取.dat文件的directory的名字命名的worksheet
然后将之前的list写入,保存文件就可以了,记得写完之后要保存,不然就像我们平时写东西但是退出的时候选择’不保存‘一样,白干一场了
加入一些读取格式错误的prompts,让这些prompts能够print到log文件里,以后出了问题查起来也方便,当然最好是不出问题
这个就是最后的半成品了,可以再加一些其他的功能,整体的框架大概就是这样,引入了一个openpyxl的包,实现了对.xlsx文件的创建以及写入,希望能帮到苦于机械式重复操作的你
如何使用python将大量数据导出到Excel中的小技巧 (1) 问题描述:为了更好地展示数据,Excel格式的...
最近家属的工作有个频繁操作excel的事情,我想到可以利用python的办公自动化来解决这重复性的工作。py5分钟...
在这一小节,我们将会学习如何使用Python来操作Excel文档以及如何利用Python语言的函数和表达式操纵Ex...
C语言是面向过程的,而C++是面向对象的 C和C++的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程...
生活源于不甘的平凡,路上的日子里,充满着对美好生活的向往,生而为人务必善良,这是我妈经常唠叨的一句话,回到家每每看...
打开“info.plist”,添加一项“Localized resources can be mixed”,值设置...
在那久远的大地上, 我为你猎来一头麋鹿, 我为你采来几个野果。 在无日月星辰的山洞里, ...
文 小迷图 Charlie Wagers 今天有两个新闻,都是和婚姻有关。 4月1日起,领结婚证免费。 北...
【小编推荐】差评遭|呼死你|骚扰警方揭黑色产业链