Python Pandas 删除某列重复值，同时根据另一列数值选取保留行

最新推荐文章于 2025-10-30 16:36:26 发布

原创最新推荐文章于 2025-10-30 16:36:26 发布 · 8.7k 阅读

24 ·

本内容遵循CC 4.0 BY-SA版权协议

收录于

计算机基础专栏收录该内容

20 篇文章

订阅专栏

本文介绍如何使用Python Pandas库处理数据表格中的重复行问题，具体为删除重复行的同时保留B列的最大值所在行。提供了两种方法：一种是对B列进行排序后删除重复项，另一种是通过groupby方法实现。

问题描述

假设我们有 “表1” 这样一个数据，需要删除A列的重复行，同时保留重复行中B列最大值所在的行，即需要得到 “表2” 的结果。

table = pd.DataFrame({"A":["甲", "乙", "甲", "甲"], 
              "B":[2,2,3,4]})
table

表1：
在这里插入图片描述

表2：
在这里插入图片描述

解决方案1

对 B 列进行降序排序；
删除 A 列的重复的行，但保留第一次出现的行。
重置索引

table.sort_values("B", ascending=False).drop_duplicates("A", keep='first').reset_index(drop=True)

解决方案2

通过 groupby 的方法实现。

table.groupby(['A'])['B'].max()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

图灵生信

关注关注

10
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【Python】基于某些列删除数据框中的重复值

阿黎逸阳的博客

05-22

1万+

Python按照某些列去重

删除重复列名数据

i_newbie的博客

08-14

4282

pandas删除重复列名数据

参与评论您还未登录，请先登录后发表或查看评论

pandas去除某几列相同数据的记录并保存

连正的博客

04-08

3691

1 问题现在有这样一个需求，在一份记录着微信聊天记录的 csv 文件中，去除同一天同一个人发的同一条消息的记录。 2 实现代码 # -*- coding: utf-8 -*- import pandas as pd import os from tqdm import * class DeleteRepetition: def __init__(self, finished_filed...

Pandas优先保留某一列频数少，然后再对另外一列进行去重

m0_65626159的博客

04-20

1320

删除id重复的情况：由于前面的排序是把计数少的在前面，为了尽可能的保留计数少的，所以我们去重的时候要优先保留第一个，也就是下面的keep='first'文章大概的解决的需求是，要对某一列（下文以“办理人id”为例）进行去重，并且要优先保留另外一列（下文以““事项名称””为例）计数较少的。先导入一组数，需求是要计算字段“事项名称”出现的总次数，并且在df新增一列，把计数结果放入。先用value_counts()计数，并且转换为dataframe的格式。然后进行排序，根据自己的需求，把频数较少的排列在前面。

Python 删除列表中的重复数据

Python热爱者的博客

07-08

4197

list0=['b','c', 'd','b','c','a','a'] 方法1：使用set() list1=sorted(set(list0),key=list0.index) # sorted output print( list1) 方法2：使用 {}.fromkeys().keys() list2={}.fromkeys(list0).keys() print(list2) 方法3：set()+sort() list3=list(set(list0)) list3.sort(key=list0

Pandas 保留某一列为某个值的行，其余删除

三妹的博客

11-11

9064

一、需求多个列中按照某一列 A 取值，保留 A 列中值为 B 的行，其余删除。二、解法使用 isin() 函数~ import pandas as pd data = pd.read_csv('example.cvs') df = pd.DataFrame(data) # 只保留 A 列中值为 test 的行 df = df[df.A.isin(['test'])] 以上，问...

Python pandas 删除指定行/列数据

热门推荐

爱吃干脆面的小潘

03-16

5万+

目录1.滤除缺失数据dropna()1)滤除含有NaN值的所有行2)滤除含有NaN值的所有列3)滤除元素都是NaN值的行4)滤除元素都是NaN值的列5)滤除指定列中含有缺失的行2.删除重复值 drop_duplicates()3.根据指定条件删除行列drop() 1.滤除缺失数据dropna() import pandas as pd import numpy as np df=pd.DataFrame({"record":[np.nan,"亚健康|潘光|45岁","疾病|张思",np.nan],"date

Python Pandas DataFrame 删除缺失值 None Nan drop dropna 替换缺失值 fillna 重复值删除 duplicate 数值替换 replace apply

好记性不如烂笔头

09-26

1万+

一、获取缺失值。二、剔除缺失值drop dropna。三、缺失值补全 fillna。四、重复值剔除 duplicate（按照行和列）。五、数值转换 replace apply applymap。

python删除表格重复行_python 删除excel表格重复行,数据预处理操作

weixin_39612057的博客

12-29

6160

使用python删除excel表格重复行。# 导入pandas包并重命名为pdimport pandas as pd# 读取Excel中Sheet1中的数据data = pd.DataFrame(pd.read_excel('test.xls', 'Sheet1'))# 查看读取数据内容print(data)# 查看是否有重复行re_row = data.duplicated()print(re_...

Pandas检测删除重复行：duplicated()

2301_77111486的博客

03-25

2858

duplicated() 用于检测数据中的重复值。删除重复行可以用 drop_duplicates() 方法来实现。

【Python】图解Pandas重复值处理

fengdu78的博客

08-15

5595

公众号：尤而小屋作者：Peter编辑：Peter今天带来的文章是关于Pandas中重复值处理。Pandas中处理重复值主要使用的是两个函数：duplicated()：判断是否有重复值dro...

【python】pandas对于数据的处理——插入、删除、空值重复值处理等

weixin_39407597的博客

08-22

3627

pandas常见的对数据的处理有：插入、删除、空值查找/填充、重复值删除、排序、筛选等

python学习 --DataFrame数据清洗（空值、重复值）

m0_60392490的博客

01-01

1万+

目录空值的处理 1、检查是否有空值 2、统计空值的数量 3、删除空值 4、填补空值用value参数替换空值将空值替换成上一列的值将空值替换成上一行的值将空值替换成下一列的值将空值替换成下一行的值 重复值的处理 1、检查是否有重复值 2、删除重复行一、空值的处理 import pandas as pd list1 = [['赵一', 23, '男'], ['钱二', 27, '女'], ['孙三', 26, '女']] list2 = [['赵一', '游

pandas删除index与某一列有重复值所在的行

呆萌的代Ma

05-24

1772

删除重复的index dataframe[~dataframe.index.duplicated(keep='first')] 根据某一列删除重复值 dataframe.drop_duplicates(subset=['列1','列2',])

Python数据分析入门笔记4——数据预处理之重复值

奥特曼打小白的专栏

01-31

1万+

用pandas进行数据分析之前，必须先对缺失值、重复值和异常值进行处理。本文记录了重复值的检测与处理方法。

pandas中的行列删除、重复值、空值的操作

weixin_43070702的博客

02-03

1916

说明：掌握pandas中对指定列的删除，掌握pandas中重复值的操作，掌握pandas中空值的删除和填充操作。 1.DataFrame指定行列的删除函数格式：drop(labels=None,axis=0,index=None,columns=None,inplace=False) 方式一：lables需要删除行或列的列表，axis指定行还是列，默认行（axis=0），删除列指定axis=1 例：p.drop(labels=["a","b","c"],axis=1)按照列进行删除方式二：使用inde

dataframe 一列的不同值_pandas数据清洗:删除重复值

weixin_39889597的博客

11-30

909

df.duplicated() :duplicated方法返回的是一个布尔值Series, 与之前出现的行对比,是否存在重复的行.如果重复则返回True.先来造一个DF数组,重复的行我已经标识出来了.使用duplicated方法后,索引3,4都显示为True,因为3行与1行重复了,而4行与2行重复了.df.drop_duplicates() ⬅注意这里后面是'S'结尾的.drop_duplic...

【Pandas数据清洗必杀技】：掌握按行/列删除数据的5种高效方法