一、用法精讲
876、pandas.Index.duplicated 方法
876-1、语法
pandas.Index.duplicated(keep='first')
876-2、参数
**keep(可选,默认值为'first'):**字符串,该参数决定在检测重复项时保留哪个重复项,它有三个可选值:
- 'first': 保留第一个出现的重复项,标记其余的为重复。
- 'last': 保留最后一个出现的重复项,标记其余的为重复。
- False: 标记所有重复项为重复。
876-3、功能
用于识别索引中的重复值,它可以帮助你在数据处理中识别和处理重复数据的问题。
876-4、返回值
返回一个与索引长度相同的布尔数组,对于每个元素,如果该元素是重复的且不被保留,则返回 True;否则返回 False。
876-5、说明
无
876-6、用法
876-6-2、代码示例
import pandas as pd
index = pd.Index(['a', 'b', 'c', 'b', 'a', 'd'])
# 保留第一个出现的重复项
print(index.duplicated(keep='first'))
# 保留最后一个出现的重复项
print(index.duplicated(keep='last'))
# 标记所有重复项
print(index.duplicated(keep=False))
876-6-3、结果输出
[False False False True True False]
[True True False False False


