在工作中處理excel遇到需要根據(jù)器件生產(chǎn)供應(yīng)商全稱(chēng)填寫(xiě)簡(jiǎn)稱(chēng)的一列,由于數(shù)據(jù)表格中器件數(shù)多達(dá)幾萬(wàn)條,單純靠excel篩選功能手動(dòng)處理需要耗費(fèi)大量時(shí)間,這里使用Python中的pandas模塊,讀取excel進(jìn)行處理。
1、需求
根據(jù)存儲(chǔ)有供應(yīng)商全稱(chēng)簡(jiǎn)稱(chēng)對(duì)應(yīng)的表格對(duì)應(yīng)關(guān)系.xlsx,自動(dòng)填寫(xiě)帶有供應(yīng)商全稱(chēng)的表格待處理文件.xlsx中簡(jiǎn)稱(chēng)的一列。


2.腳本思路
首先使用pandas讀取第一個(gè)表格對(duì)應(yīng)關(guān)系.xlsx,然后將其儲(chǔ)存在一個(gè)字典中,字典的鍵為供應(yīng)商的全稱(chēng),字典的值為供應(yīng)商的簡(jiǎn)稱(chēng)。
然后讀取第二個(gè)表格待處理文件.xlsx,根據(jù)列的標(biāo)題頭,找到供應(yīng)商全稱(chēng)所處在的列,根據(jù)這一列每一個(gè)供應(yīng)商的全稱(chēng)查詢(xún)字典中對(duì)應(yīng)鍵的值,將其寫(xiě)入表格中對(duì)應(yīng)行的簡(jiǎn)稱(chēng)處。(這里暫時(shí)假設(shè)對(duì)應(yīng)關(guān)系和待處理文件中供應(yīng)商的全稱(chēng)如果是同一家公司則公司全稱(chēng)是一模一樣的,存在些許差別的處理的方法在下一篇文章中在記錄)。
3.代碼
# -*- coding: utf-8 -*-
"""
Created on Thu Mar 4 21:25:05 2021
@author: ruofei
"""
import pandas as pd
#填寫(xiě)待處理文件和對(duì)應(yīng)關(guān)系的excel文件路徑
#注意:腳本運(yùn)行時(shí)需保證被使用excel文件處于關(guān)閉狀態(tài)
file1 = r'待處理文件.xlsx'
file2 = r'對(duì)應(yīng)關(guān)系.xlsx'
#填寫(xiě)待處理文件中 全稱(chēng)所在的列名和簡(jiǎn)稱(chēng)要放置的列名
qc1="供應(yīng)商"
jc1="簡(jiǎn)稱(chēng)"
#填寫(xiě)對(duì)應(yīng)關(guān)系中 全稱(chēng)所在的列數(shù)和簡(jiǎn)稱(chēng)所在的列數(shù)
qc2="全稱(chēng)"
jc2="簡(jiǎn)稱(chēng)"
#填寫(xiě)讀取excel文件的sheet表名
sheet1="Sheet1"
sheet2="Sheet1"
#--------------------*-------------*--------------*---------------------
#--------------------*-------------*--------------*---------------------
data1 = pd.read_excel(file1, sheet_name = sheet1)
data2 = pd.read_excel(file2, sheet_name = sheet2)
#print("輸出表格所有")
#print(data1)
row1 = data1.shape[0]#行數(shù)
col1=data1.shape[1]#列數(shù)
row2 = data2.shape[0]#行數(shù)
col2=data2.shape[1]#
#print("表格文件有"+str(row1)+"行,"+str(col1)+"列")
duiying=dict()
#生成對(duì)應(yīng)關(guān)系的字典
for i in range(row2):
quancheng=data2.loc[i,qc2]
jiancheng=data2.loc[i,jc2]
duiying[quancheng]=jiancheng
#print(quancheng)
#company1=data1.loc[0][0]
#company2=data1.loc[1][0]
#print("公司一為"+str(company1)+"\n"+"公司二為"+str(company2))
for i in range(row1):
a=data1.loc[i,qc1]
#[qc1-1]
#print(str(a))
jiancheng=duiying.get(a)
if a in duiying.keys():
#print(jiancheng)
data1.loc[i,jc1]=jiancheng
else:
#此處修改沒(méi)有簡(jiǎn)稱(chēng)賦予值,若賦予全稱(chēng)值則=a,若為空則=" "
data1.loc[i,jc1]=a
data1.to_excel('處理好的文件.xlsx',sheet_name='Sheet1')
4.實(shí)現(xiàn)功能
根據(jù)預(yù)先整理好的對(duì)應(yīng)關(guān)系表格自動(dòng)填寫(xiě)了表格中簡(jiǎn)稱(chēng)空白的一列,如果表格中存在對(duì)應(yīng)關(guān)系中不存在的公司,則在相應(yīng)的簡(jiǎn)稱(chēng)位置填寫(xiě)其全稱(chēng)本身。如下圖中,由于表中的小米華為沒(méi)有給出其簡(jiǎn)稱(chēng),因此原樣照填。

5.存在問(wèn)題
在實(shí)際應(yīng)用中處理幾萬(wàn)條數(shù)據(jù)時(shí),絕大部分正常,存在問(wèn)題是,比如對(duì)應(yīng)關(guān)系中全稱(chēng)為(中國(guó))茅臺(tái)公司,而在要處理的文件中不存在括號(hào),或者括號(hào)中英文不同,或者括號(hào)中空格數(shù)不同,都會(huì)在后面讀取為不同的字符串,在查詢(xún)字典中顯示不存在。處理方式在下篇中解決。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
您可能感興趣的文章:- Python應(yīng)用實(shí)現(xiàn)處理excel數(shù)據(jù)過(guò)程解析
- Python利用pandas處理Excel數(shù)據(jù)的應(yīng)用詳解
- Python Excel處理庫(kù)openpyxl詳解
- 教你怎么用Python處理excel實(shí)現(xiàn)自動(dòng)化辦公
- 使用python對(duì)excel表格處理的一些小功能
- 如何用python處理excel表格
- python操作openpyxl導(dǎo)出Excel 設(shè)置單元格格式及合并處理代碼實(shí)例
- Python Excel處理庫(kù)openpyxl使用詳解
- 教你用Python實(shí)現(xiàn)Excel表格處理