本文共 874 字,大约阅读时间需要 2 分钟。
去重是一项常见的数据处理任务,以下是五种常见去重方法的实现代码及解释:
集合具有去重特性,可以通过将列表转换为集合再转换回列表来实现去重操作。
lis = [1, 2, 3, 1, 2, 1, 1]set_lis = list(set(lis))
这种方法简单高效,适合处理简单列表。
通过统计每个元素的出现次数,筛选出现次数为一次的元素。
aa = [1, 2, 3, 1, 2, 1, 1]d = {i: aa.count(i) for i in aa}result = [i for i in d if d[i] == 1] 这种方法可读性高,适用于需要保留所有元素的场景。
通过循环统计并移除重复元素。
aa = [1, 2, 3, 1, 2, 1, 1]for i in aa: if aa.count(i) > 1: for j in range(aa.count(i) - 1): aa.remove(i)
这种方法适用于小型列表,需谨慎处理大数据量。
检查当前元素在后续元素中是否出现。
aa = [1, 2, 3, 1, 2, 1, 1]new_aa = []for i in range(len(aa)): if aa[i] not in aa[i+1:]: new_aa.append(aa[i])
这种方法直观,适合小数据量。
逐个检查元素是否已经存在于新列表中。
aa = [1, 2, 3, 1, 2, 1, 1]new_aa = []for i in aa: if i not in new_aa: new_aa.append(i)
这种方法简单直观,但效率较低,适合小数据量。
以上方法各有优劣,选择时需根据具体需求进行权衡。
转载地址:http://hlqo.baihongyu.com/