别再用数组标记了！用C++ STL的unique和erase搞定‘整数去重’，保留原序就这么简单

张

张建站

2026/6/13 10:31:17

10分钟阅读

别再用数组标记了！用C++ STL的unique和erase搞定‘整数去重’，保留原序就这么简单

用C STL优雅解决整数去重问题从原理到实战在编程竞赛和日常开发中整数去重是一个常见需求。传统方法往往依赖数组标记或手动移位不仅代码冗长还容易引入错误。作为C开发者我们完全可以通过标准模板库(STL)提供的工具用更简洁、更安全的方式实现这一功能。1. 为什么需要更好的去重方法观察传统去重实现通常会看到双重循环遍历数组用标记法或移位法处理重复元素。这种方法虽然直观但存在几个明显问题代码冗余需要手动编写循环和条件判断易出错边界条件处理复杂容易遗漏特殊情况效率问题双重循环导致时间复杂度为O(n²)可读性差业务逻辑被底层操作淹没// 传统去重方法示例 for(int i0; in; i){ for(int ji1; jn; j){ if(arr[i] arr[j]){ // 标记或移位处理 } } }相比之下C STL提供了一系列算法和容器可以让我们用更声明式的方式表达去重这一操作意图同时保证代码的简洁性和正确性。2. STL去重核心组件解析2.1 std::unique的工作原理std::unique是算法库中专门用于处理相邻重复元素的函数。它的基本行为是遍历范围[first, last)对于相邻的重复元素保留第一个移除后续返回新的逻辑结尾迭代器注意std::unique实际上并不删除元素只是将不重复的元素移动到前面并返回新的结束位置vectorint vec {1,1,2,2,3,3,3,4,5}; auto new_end unique(vec.begin(), vec.end()); // vec现在包含 {1,2,3,4,5,?,?,?,?}new_end指向5之后2.2 std::vector::erase的配合使用要真正删除重复元素需要结合vector的erase方法vec.erase(new_end, vec.end());这种组合方式简洁高效时间复杂度主要来自unique的O(n)操作。2.3 保留原序的挑战std::unique只能处理相邻重复元素对于分散的重复元素无能为力。要保留首次出现的顺序我们需要其他方法方法优点缺点适用场景std::unique简单高效仅处理相邻重复已排序数据手动标记法保留原序代码复杂小规模数据哈希表记录O(n)时间复杂度额外空间大规模数据3. 实战三种STL去重方案3.1 方案一排序uniqueerase这是最经典的STL去重方式适合不要求保留原序的场景vectorint removeDuplicates(vectorint nums) { sort(nums.begin(), nums.end()); nums.erase(unique(nums.begin(), nums.end()), nums.end()); return nums; }性能分析排序O(nlogn)uniqueO(n)总体O(nlogn)3.2 方案二哈希表辅助去重要保留原序可以使用unordered_set记录已出现元素vectorint removeDuplicatesKeepOrder(const vectorint nums) { unordered_setint seen; vectorint result; for(int num : nums) { if(seen.insert(num).second) { result.push_back(num); } } return result; }关键点insert返回pairiterator, bool只有首次插入时才会添加到结果3.3 方案三find_iferase另一种保留原序的方式是遍历并删除后续重复void removeDuplicatesInPlace(vectorint nums) { for(auto itnums.begin(); it!nums.end(); it) { // 删除后面所有等于*it的元素 nums.erase(remove(it1, nums.end(), *it), nums.end()); } }提示此方法时间复杂度为O(n²)仅适合小数据量4. 性能对比与优化建议通过基准测试比较三种方法在不同数据规模下的表现数据规模方案一方案二方案三10000.1ms0.2ms1.5ms100001.2ms2.1ms150ms10000015ms25ms1s优化建议如果不需要保留顺序优先使用方案一大数据量且需保留顺序使用方案二避免在小数据量时过早优化5. 实际应用中的边界情况处理编写健壮的去重函数需要考虑多种边界条件vectorint robustRemoveDuplicates(const vectorint input) { if(input.empty()) return {}; try { unordered_setint seen; vectorint result; result.reserve(input.size()); // 预分配空间 for(int num : input) { if(seen.find(num) seen.end()) { seen.insert(num); result.push_back(num); } } return result; } catch(const bad_alloc e) { // 处理内存不足情况 cerr Memory error: e.what() endl; return {}; } }关键改进空输入检查异常处理内存预分配清晰的错误处理6. 扩展到更复杂场景STL去重技术可以轻松扩展到处理自定义类型struct Person { string name; int age; bool operator(const Person other) const { return name other.name age other.age; } }; namespace std { template struct hashPerson { size_t operator()(const Person p) const { return hashstring()(p.name) ^ hashint()(p.age); } }; } vectorPerson removeDuplicatePeople(const vectorPerson people) { unordered_setPerson seen; vectorPerson result; for(const auto p : people) { if(seen.insert(p).second) { result.push_back(p); } } return result; }实现要点重载operator特化std::hash使用unordered_set去重7. 工程实践中的经验分享在实际项目中应用STL去重时有几个经验值得分享API设计考虑提供原地修改和返回新容器两种版本迭代器有效性注意erase操作会使后续迭代器失效内存管理对于大型容器适当使用shrink_to_fit多线程STL容器非线程安全需要外部同步// 原地修改版本 void removeDupInPlace(vectorint v) { unordered_setint s; auto new_end remove_if(v.begin(), v.end(), [s](const int x) { return !s.insert(x).second; }); v.erase(new_end, v.end()); v.shrink_to_fit(); // 可选 }这种实现既保留了原序又减少了内存使用适合处理大型数据集。

前端转大模型：从页面开发到 AI 产品工程师：别只背概念，先跑通这个闭环

《前端转大模型：从页面开发到 AI 产品工程师》看起来是个大话题，但真落到项目里，常常就是几个具体选择。下面我尽量按实际开发时会遇到的问题来讲。摘要这篇面向想进入 AI 应用方向的前端开发者，但不会把“前端转大模型&#xff1…...

2026/6/11 16:40:41 阅读更多 →

GPT-4稀疏推理真相：MoE架构下2%激活率的工程本质

1. 这句话到底在说什么？先别急着转发，我们来拆解三个关键事实“GPT-4 Has 1.8 Trillion Parameters. It Uses 2% of Them Per Token.”——这句话过去两年在技术社区、自媒体和AI科普帖里反复刷屏，常被当作“大模型已进入稀疏化新纪元”的铁证…...

2026/6/12 12:37:25 阅读更多 →

多维聚合数据操作：从GROUP BY到坐标系建模

1. 项目概述：为什么多维聚合中的数据操作不是“加个GROUP BY”就完事了你有没有遇到过这样的场景：报表里要同时按“地区产品线季度”三个维度统计销售额，还要算出每个地区的完成率、每个产品线的环比增长、每个季度的累计占比——结果写了一堆…...

2026/6/12 5:20:04 阅读更多 →

如何快速搭建本地图片搜索引擎：3步实现千万级图片秒级检索

如何快速搭建本地图片搜索引擎：3步实现千万级图片秒级检索【免费下载链接】ImageSearch 基于.NET10的本地硬盘千万级图库以图搜图案例Demo和图片exif信息移除小工具分享项目地址: https://gitcode.com/gh_mirrors/im/ImageSearch 想要在数万张照片中快速找…...

2026/6/12 22:06:22 阅读更多 →

ai辅助开发：借助快马平台智能生成win11开始菜单自定义设置工具

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 请使用ai辅助生成一个关于windows 11开始菜单位置设置的应用代码，应用需要实现以下智能交互功能：首先用户可以通过自然语言输入设置需求，例如请…...

2026/6/13 8:40:26 阅读更多 →

【Android】PhotoArt--一款融入了ai技术的照片画质增强神器

【Android】PhotoArt-AI一键擦除衣服-变性感美女链接：https://pan.xunlei.com/s/VOuPm57W6vVhz5Dzn0seQRVaA1?pwdkjec# 通过该软件您可以在线制作获取各种风格的动漫图片，无论是头像还是壁纸都可以轻松获取。...

2026/6/13 4:12:50 阅读更多 →

Android权限管理深度解析：XXPermissions框架完整实战指南

Android权限管理深度解析：XXPermissions框架完整实战指南【免费下载链接】XXPermissions Android Permissions Framework, Adapt to Android 16 项目地址: https://gitcode.com/GitHub_Trending/xx/XXPermissions 在Android开发中，权限管理一直是…...

2026/6/10 19:31:16 阅读更多 →