Python小工具

正文

记录一些日常用到,但容易忘记的Python代码块

读写xlsx

安装指定版本的xlrd, xlwt

1
2
conda install xlrd==1.2.0
conda install xlwt

常用函数

  1. 1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    wb = xlrd.open_workbook(data_path)
    print(len(wb.sheets())) # 查看页数
    sheet1 = wb.sheets()[0] # 根据下标读取指定页
    # 数据总行数
    nrows = sheet1.nrows
    # 数据总列数
    ncols = sheet1.ncols
    # 获取表中第三行的数据
    x = sheet1.row_values(2)
    # 获取表中第二列的数据
    y = sheet1.col_values(1)
    # 获取第五列中的第二个数据
    z = sheet1.col_values(4)[1]
    # 获取表中第二列且不要第一个值的数据
    y_noone = sheet1.col_values(1)[1:]
    # [1:]相当于切片操作
    x_3_y_3 = sheet1.cell(2, 2).value # 也可以直接修改
    # 按行列遍历输出
    for r in range(nrows):
    for c in range(ncols):
    print(sheet1.cell(r, c).value,end=' ')
    print()

  2. 1
    2
    3
    4
    wb = xlwt.Workbook()
    sheet = wb.add_sheet('My Sheet')
    sheet.write(0,0,'value')
    wb.save(file_path)

指定GPU训练

  1. 代码中指定

    1
    os.environ["CUDA_VISIBLE_DEVICES"] = "0"

    要放在import torch之前

  2. 运行时指定

    1
    CUDA_VISIBLE_DEVICES=0

读写csv

CSV文件有以下特点:

  1. 纯文本,使用某种字符集(如ASCII、Unicode、GB2312)等);
  2. 由一条条的记录组成(典型的是每行一条记录);
  3. 每条记录被分隔符(如逗号、分号、制表符等)分隔为字段(列);
  4. 每条记录都有同样的字段序列。
    CSV文件可以使用文本编辑器或类似于Excel电子表格这类工具打开和编辑,当使用Excel这类电子表格打开CSV文件时,你甚至感觉不到CSV和Excel文件的区别。很多数据库系统都支持将数据导出到CSV文件中,当然也支持从CSV文件中读入数据保存到数据库中,这些内容并不是我们这里讨论的重点。

CSV写入

现有五个学生三门课程的考试成绩需要保存到一个CSV文件中,要达成这个目标,可以使用Python标准库中的csv模块,该模块的writer函数会返回一个csvwriter对象,通过该对象的writerow或writerows方法就可以将数据写入到CSV文件中,具体的代码如下所示。

1
2
3
4
5
6
7
8
9
10
11
12
import csv
import random

with open('scores.csv', 'w') as file:
writer = csv.writer(file)
writer.writerow(['姓名', '语文', '数学', '英语'])
names = ['关羽', '张飞', '赵云', '马超', '黄忠']
for i in range(5):
verbal = random.randint(50, 100)
math = random.randint(40, 100)
english = random.randint(30, 100)
writer.writerow([names[i], verbal, math, english])

需要说明的是上面的writer函数,该函数除了传入要写入数据的文件对象外,还可以dialect参数,它表示CSV文件的方言,默认值是excel。除此之外,还可以通过delimiter、quotechar、quoting参数来指定分隔符(默认是逗号)、包围值的字符(默认是双引号)以及包围的方式。其中,包围值的字符主要用于当字段中有特殊符号时,通过添加包围值的字符可以避免二义性。大家可以尝试将上面第5行代码修改为下面的代码,看看生成的CSV文件到底有什么区别。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
```

## CSV读取
如果要读取刚才创建的CSV文件,可以使用下面的代码,通过csv模块的reader函数可以创建出csvreader对象,该对象是一个迭代器,可以通过next函数或for-in循环读取到文件中的数据。
```python
import csv

with open('scores.csv', 'r') as file:
reader = csv.reader(file, delimiter='|')
for line in reader:
print(reader.line_num, end='\t')
for elem in line:
print(elem, end='\t')
print()

注意:上面的代码对csvreader对象做for循环时,每次会取出一个列表对象,该列表对象包含了一行中所有的字段。

文件遍历排序重命名

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import os
import shutil
from functools import cmp_to_key
def compare(t1,t2):
t1_n = t1.split('_')[0] # 把最前面编号切下来
t2_n = t2.split('_')[0] # 把最前面编号切下来
if int(t1_n) > int(t2_n):
return 1;
elif int(t1_n) < int(t2_n):
return -1;
else:
return 0;

if __name__ == '__main__':
path = '/Users/SWP/data' # 原文件夹路径
target = '/Users/SWP/new_data' # 改名后保存文件夹路径
dirs = os.listdir(path) # 获取原文件夹下面子文件
for dir in dirs: # 遍历子文件夹
if not os.path.exists(os.path.join(target, dir)): os.makedirs(os.path.join(target, dir))
files = os.listdir(os.path.join(path, dir)) # 遍历子文件夹中的文件
files.sort(key=cmp_to_key(compare), reverse=False) # 排序
for i,file in enumerate(files):
shutil.copy(os.path.join(path, dir,file), os.path.join(target,dir,'P'+str(i)+'.nii.gz'))


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!