MySQL里没有explode怎么办？用这个SQL技巧搞定竖线分隔的字符串拆分（附性能优化小贴士）

张

张建站

2026/4/23 21:42:34

10分钟阅读

MySQL里没有explode怎么办？用这个SQL技巧搞定竖线分隔的字符串拆分（附性能优化小贴士）

MySQL竖线分隔字符串拆分的实战技巧与性能优化在处理数据库中的非规范化数据时经常会遇到用竖线|分隔的字符串字段比如用户标签、商品分类或多值属性。这类数据在MySQL中直接查询和分析非常不便而Hive等大数据工具提供的explode函数在MySQL中并不存在。本文将深入探讨几种实用的字符串拆分方法并分享性能优化的关键技巧。1. 核心解决方案SUBSTRING_INDEX与数字辅助表MySQL虽然没有内置的数组拆分函数但通过巧妙组合SUBSTRING_INDEX函数和数字辅助表可以实现类似Hive explode的功能。这种方法特别适合处理已知最大元素数量的情况。SELECT role, SUBSTRING_INDEX(SUBSTRING_INDEX(tianfu, |, numbers.n), |, -1) AS talent FROM wow_info JOIN (SELECT 1 AS n UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4) numbers ON CHAR_LENGTH(tianfu) - CHAR_LENGTH(REPLACE(tianfu, |, )) numbers.n - 1;关键点解析SUBSTRING_INDEX(tianfu, |, numbers.n)获取前n个元素外层的SUBSTRING_INDEX(..., |, -1)提取最后一个元素CHAR_LENGTH...条件确保只生成实际存在的元素行性能考虑数字辅助表的大小应根据实际数据中的最大元素数确定过大的数字表会导致不必要的笛卡尔积适合元素数量较少且相对固定的场景2. 动态解决方案递归CTE方法对于元素数量不确定或可能很多的情况MySQL 8.0的递归CTE(WITH RECURSIVE)提供了更灵活的解决方案。WITH RECURSIVE split_cte AS ( SELECT id, role, tianfu, 1 AS pos, SUBSTRING_INDEX(tianfu, |, 1) AS talent, CHAR_LENGTH(tianfu) - CHAR_LENGTH(REPLACE(tianfu, |, )) 1 AS total FROM wow_info UNION ALL SELECT id, role, tianfu, pos 1, SUBSTRING_INDEX(SUBSTRING_INDEX(tianfu, |, pos 1), |, -1), total FROM split_cte WHERE pos total ) SELECT id, role, talent FROM split_cte ORDER BY id, pos;优势对比方法适用版本动态性性能复杂度数字辅助表所有版本低中等简单递归CTE8.0高较好中等存储过程所有版本高依赖实现高3. 性能优化实战技巧当处理大量数据时字符串拆分操作可能成为性能瓶颈。以下是经过实战验证的优化方法3.1 索引优化策略虽然无法直接索引拆分后的元素但可以为原表的主键和常用过滤字段建立合适索引考虑使用生成列(MySQL 5.7)存储元素数量ALTER TABLE wow_info ADD COLUMN talent_count INT GENERATED ALWAYS AS (CHAR_LENGTH(tianfu) - CHAR_LENGTH(REPLACE(tianfu, |, )) 1) STORED; CREATE INDEX idx_talent_count ON wow_info(talent_count);3.2 查询改写技巧避免在WHERE条件中使用拆分函数改为先筛选出符合条件的记录ID再对这些记录进行拆分操作-- 低效写法 SELECT * FROM ( -- 拆分查询 ) t WHERE talent 冰法; -- 高效改写 WITH filtered AS ( SELECT id FROM wow_info WHERE tianfu LIKE %冰法% ) SELECT w.role, SUBSTRING_INDEX(SUBSTRING_INDEX(w.tianfu, |, n.n), |, -1) AS talent FROM filtered f JOIN wow_info w ON f.id w.id JOIN (SELECT 1 AS n UNION ALL SELECT 2 UNION ALL SELECT 3) n ON CHAR_LENGTH(w.tianfu) - CHAR_LENGTH(REPLACE(w.tianfu, |, )) n.n - 1 WHERE SUBSTRING_INDEX(SUBSTRING_INDEX(w.tianfu, |, n.n), |, -1) 冰法;3.3 批量处理优化对于大批量数据处理考虑使用临时表存储中间结果分批处理数据避免单条SQL过大在应用层实现部分逻辑4. 架构层面的解决方案虽然SQL技巧能解决问题但在某些场景下考虑数据模型优化可能更合适4.1 关联表设计建立专门的关联表存储多值关系CREATE TABLE character_talents ( character_id INT, talent VARCHAR(50), PRIMARY KEY (character_id, talent), FOREIGN KEY (character_id) REFERENCES wow_info(id) );4.2 JSON类型的使用MySQL 5.7支持JSON类型提供了更灵活的多值存储ALTER TABLE wow_info MODIFY COLUMN tianfu JSON; -- 查询特定天赋 SELECT * FROM wow_info WHERE JSON_CONTAINS(tianfu, 冰法);4.3 何时选择哪种方案方案适合场景优点缺点SQL技巧临时分析、遗留系统不改动表结构性能较差关联表频繁查询、更新查询高效需要重构JSON类型灵活结构、MySQL5.7现代方案学习曲线在实际项目中我经常遇到需要权衡短期解决方案和长期架构的问题。对于快速原型开发SQL技巧非常实用但对于核心业务数据建议尽早采用规范化的关联表设计。特别是在处理用户标签系统时关联表配合适当的索引能够支持更复杂的查询场景如查找同时具备Java和Python标签的用户。

键盘连击终极修复指南：用KeyboardChatterBlocker拯救你的机械键盘

键盘连击终极修复指南：用KeyboardChatterBlocker拯救你的机械键盘【免费下载链接】KeyboardChatterBlocker A handy quick tool for blocking mechanical keyboard chatter. 项目地址: https://gitcode.com/gh_mirrors/ke/KeyboardChatterBlocker 还在为机械…...

2026/4/23 21:40:56 阅读更多 →

告别硬编码！在Unity中用ScriptableObject优雅配置你的电子围栏系统

告别硬编码！在Unity中用ScriptableObject优雅配置你的电子围栏系统在智慧城市模拟或大型场馆安全管理等复杂项目中，电子围栏系统往往需要管理成百上千个不同形状、参数和规则的围栏。传统硬编码方式会让项目迅速陷入维护噩梦——每次调整围栏高度、颜色…...

2026/4/23 21:39:49 阅读更多 →

gh_mirrors/se/search源码架构分析：从自定义属性到布局渲染

gh_mirrors/se/search源码架构分析：从自定义属性到布局渲染【免费下载链接】search Material You Search component for Android, SearchView 项目地址: https://gitcode.com/gh_mirrors/se/search gh_mirrors/se/search是一个专为Android平台设计的Materia…...

2026/4/23 21:39:38 阅读更多 →

告别UI管理混乱：DoozyUI的UICanvas与UIView如何帮你构建可维护的Unity项目架构

告别UI管理混乱：DoozyUI的UICanvas与UIView如何帮你构建可维护的Unity项目架构在开发中大型Unity项目时，UI系统的复杂度往往随着功能迭代呈指数级增长。当项目包含多个场景、数十个界面和数百个交互元素时，开发者常会遇到以下典型问题&#…...

2026/4/21 20:14:59 阅读更多 →

C语言之整型常量后缀探秘：从1ULL/1UL/1L到跨平台编程(五十五)

1. 整型常量后缀的底层原理第一次看到1ULL这种写法时，我盯着屏幕愣了三秒——数字后面加字母是什么黑魔法？直到在32位系统上调试一个计数器溢出bug后，才真正理解这些后缀的重要性。整型常量后缀实际上是告诉编译器："别用默认…...

2026/4/20 7:00:24 阅读更多 →

VisionMaster企业实操训练系列课程

VisionMaster企业实操训练系列课程主要出于，快速会设计视觉引导定位项目引导定位原理原理演示 1.单相机带角度定位引导 2.12点标定 3.单点抓取 4.上下相机对位引导 5.单相机带角度定位引导（相机在机械手上）...

2026/4/20 0:14:41 阅读更多 →

C#怎么限制Task最大并发数_C#如何自定义TaskScheduler【进阶】

SemaphoreSlim 是控制 Task 并发数最直接轻量的选择，通过异步闸门限制同时执行任务数，需配对 WaitAsync() 和 Release() 并在 finally 中确保释放；自定义 TaskScheduler 适用场景极窄，ParallelOptions.MaxDegreeOfParallelism 仅适…...

2026/4/20 6:29:58 阅读更多 →