如何读取xls的颜色并按照一连一致颜色进行分组？

动我来个眼神

近来碰上一个需供，需求给物流行业的Excel婚配派收费，详细完好需供较为庞大。此中触及的一个费事面能够拿出去给大家讲讲。
那些物流定单表中，经由过程持续不异的色彩标识属于开票派收，其实不像数据库有零丁的字段标识表记标帜。明天我们的完成目的是读与持续不异的色彩，标识表记标帜统一个分组编号。
经由过程openpyxl读与xlsx格局的色彩比力简朴没有做演示了，读者也能够思索先将xls格局先转换为xlsx格局再读与色彩。不外我明天演示的是利用xlrd库间接读与xls格局的Excel表，从而剖析出色彩，并阐发能否是持续不异的色彩，给一个独一的分组编号。
举个例子，关于以下Excel表：

那4个色彩持续不异的的单位格，标识表记标帜为统一个编号。
起首我们读与那个Excel表：

import xlrd
# 翻开Excel，为了读与款式疑息需求指定formatting_info=True
book = xlrd.open_workbook("test.xls", formatting_info=True)
# 获得第一张sheet
sheet = book.sheets()[0]
sheet

复造代码

[/code] 起首我们先尝试读与第一个有色彩的单位格：
[code]cell = sheet.cell(2, 1)
print(cell.value, cell.xf_index)

复造代码

KSTD152 77

复造代码

曾经胜利读与到详细的值战对应的款式索引。
**那末假如按照索引获得色彩值呢？**这时候需求利用齐局色彩界说表：

colour_index = book.xf_list[cell.xf_index].background.pattern_colour_index
book.colour_map[colour_index]

复造代码

(255, 102, 0)

复造代码

将以上历程启拆起去，再测试一下读与另外一个开票的色彩：

def get_cell_color(cell):
colour_index = book.xf_list[cell.xf_index].background.pattern_colour_index
return book.colour_map[colour_index]
get_cell_color(sheet.cell(8, 1))

复造代码

(204, 204, 255)

复造代码

那阐明我们曾经能够提掏出指订单元格的色彩值了。
**怎样批量读与数据？**利用get_rows天生器最简朴：

import pandas as pd
rows = sheet.get_rows()
header = [cell.value for cell in next(rows)]
data = []
for row in rows:
data.append([cell.value for cell in row])
df = pd.DataFrame(data, columns=header)
df.head(20)

复造代码

基于以上代码，上面我们批量读与全部Excel的数据，并按照色彩值付与一个开票编号：

import pandas as pd
rows = sheet.get_rows()
header = [cell.value for cell in next(rows)]
header.append("开票编号")
data = []
last_color = None
num = 0
for row in rows:
t = [cell.value for cell in row]
color = get_cell_color(row[1])
if color and color != (255, 255, 255):
if color != last_color:
num += 1
t.append(num)
else:
t.append(pd.NA)
last_color = color
data.append(t)
df = pd.DataFrame(data, columns=header)
df.head(20)

复造代码

能够看到曾经准确的给持续不异的色彩挨上了不异的编号：

如许我们便处理了那个成绩。完好代码以下：

import pandas as pd
import xlrd
def get_cell_color(cell):
colour_index = book.xf_list[cell.xf_index].background.pattern_colour_index
return book.colour_map[colour_index]
# 翻开Excel，为了读与款式疑息需求指定formatting_info=True
book = xlrd.open_workbook("test.xls", formatting_info=True)
# 获得第一张sheet
sheet = book.sheets()[0]
rows = sheet.get_rows()
header = [cell.value for cell in next(rows)]
header.append("开票编号")
data = []
last_color = None
num = 0
for row in rows:
t = [cell.value for cell in row]
color = get_cell_color(row[1])
if color and color != (255, 255, 255):
if color != last_color:
num += 1
t.append(num)
else:
t.append(pd.NA)
last_color = color
data.append(t)
df = pd.DataFrame(data, columns=header)
df

复造代码

年夜天然的搬运工滥觞https://blog.csdn.net/as604049322/article/details/120027068
免责声明：假如进犯了您的权益，请联络站少，我们会实时删除侵权内乱容，感谢协作！

如何读取xls的颜色并按照一连一致颜色进行分组？

浏览过的版块