Copy code
# 示例代碼
import
pandas
as
pd
# 讀取表格數(shù)據(jù)
df = pd.read_excel(
"students.xlsx"
# 檢測(cè)重復(fù)行
duplicate_rows = df[df.duplicated()]
# 輸出重復(fù)行
"重復(fù)行:"
(duplicate_rows)
# 檢測(cè)姓名列的重復(fù)值
duplicate_names = df[df[
"姓名"
].duplicated()]
# 輸出姓名重復(fù)的行
"姓名重復(fù)的行:"
(duplicate_names)
# 檢測(cè)學(xué)號(hào)列的唯一值
unique_ids = df[
"學(xué)號(hào)"
].unique()
# 輸出學(xué)號(hào)的唯一值
"學(xué)號(hào)的唯一值:"
(unique_ids)
以上示例代碼演示了如何使用Python的pandas庫(kù)實(shí)現(xiàn)對(duì)表格不同列的查重功能。通過(guò)讀取表格數(shù)據(jù)、檢測(cè)重復(fù)行、查找重復(fù)值等步驟,可以快速有效地分析表格數(shù)據(jù),發(fā)現(xiàn)其中的重復(fù)或不一致情況。