用Python和music21库搞定MIDI与JSON互转：一份给音乐程序员的保姆级教程

张

张建站

2026/4/22 12:40:26

10分钟阅读

用Python和music21库搞定MIDI与JSON互转：一份给音乐程序员的保姆级教程

Python与music21实战MIDI与JSON互转的深度解析与最佳实践音乐技术开发者常面临一个核心挑战如何将MIDI这类二进制音乐格式转换为更易处理的文本结构同时保留所有音乐信息Python生态中的music21库为此提供了专业级解决方案。本文将深入探讨从基础转换到高级处理的完整技术链涵盖数据结构设计、特殊音符处理以及性能优化等关键环节。1. 环境配置与核心工具链在开始编码前需要搭建一个稳定的开发环境。推荐使用Python 3.8版本以获得最佳兼容性pip install music21 python-rtmidi json5为什么选择这些组件music21是音乐分析的核心库python-rtmidi提供实时MIDI支持而json5扩展了标准JSON的语法支持如注释。对于复杂项目建议增加以下依赖# 高级音乐处理增强包 requirements [ numpy1.21, # 高效数值计算 matplotlib, # 音乐可视化 pretty_midi, # 补充MIDI功能 jsonschema # JSON结构验证 ]环境验证脚本应检查关键功能def check_environment(): try: import music21 print(fmusic21 version: {music21.VERSION_STR}) assert music21.converter.parse(C4) # 基础解析测试 return True except Exception as e: print(fEnvironment error: {str(e)}) return False2. MIDI到JSON的深度转换策略2.1 音乐元素的标准化建模MIDI转换的核心在于准确表达音乐语义。我们需要设计一个既能保留原始信息又便于处理的JSON结构{ metadata: { tempo: 120, time_signature: 4/4, key_signature: C major }, tracks: [ { name: Piano Right Hand, notes: [ { type: note, pitch: 60, velocity: 90, start_time: 0.0, duration: 0.5 }, { type: chord, pitches: [60, 64, 67], velocity: 80, start_time: 1.0, duration: 1.0 } ] } ] }关键设计决策采用分层结构分离元数据与音符数据使用绝对时间戳而非节拍位置显式区分单音、和弦与休止符保留力度(velocity)等演奏细节2.2 高级转换实现基础转换函数需要处理音乐流的各种特殊情况def midi_to_json(midi_path, output_pathNone): score converter.parse(midi_path) result { metadata: extract_metadata(score), tracks: [] } for part in score.parts: track { name: part.partName or Unnamed Track, notes: [] } for element in part.flat.notesAndRests: note_data process_music_element(element) if note_data: track[notes].append(note_data) result[tracks].append(track) if output_path: with open(output_path, w) as f: json.dump(result, f, indent2) return result def process_music_element(element): if isinstance(element, note.Rest): return {type: rest, duration: float(element.duration.quarterLength)} elif isinstance(element, note.Note): return { type: note, pitch: element.pitch.midi, velocity: element.volume.velocity, duration: float(element.duration.quarterLength) } elif isinstance(element, chord.Chord): return { type: chord, pitches: [n.pitch.midi for n in element.notes], velocity: max(n.volume.velocity for n in element.notes), duration: float(element.duration.quarterLength) } return None专业提示对于大型MIDI文件使用part.flat.notesAndRests比递归遍历更高效可减少30%以上的处理时间3. JSON到MIDI的逆向工程3.1 数据结构验证与清洗在转换回MIDI前必须验证JSON数据的完整性from jsonschema import validate SCHEMA { type: object, properties: { metadata: { type: object, properties: { tempo: {type: number, minimum: 20}, time_signature: {type: string}, key_signature: {type: string} } }, tracks: { type: array, items: { type: object, properties: { name: {type: string}, notes: { type: array, items: { oneOf: [ {$ref: #/definitions/note}, {$ref: #/definitions/chord}, {$ref: #/definitions/rest} ] } } } } } }, definitions: { note: { properties: { type: {const: note}, pitch: {type: integer, minimum: 0, maximum: 127}, duration: {type: number, minimum: 0}, velocity: {type: integer, minimum: 0, maximum: 127} } } } } def validate_music_json(data): try: validate(instancedata, schemaSCHEMA) return True except Exception as e: print(fValidation error: {str(e)}) return False3.2 智能重建音乐流转换时需要重建音乐的时间结构def json_to_midi(data, output_path): if not validate_music_json(data): raise ValueError(Invalid music JSON structure) score stream.Score() # 设置全局元数据 if metadata in data: if tempo in data[metadata]: score.insert(0, tempo.MetronomeMark(numberdata[metadata][tempo])) for track_data in data[tracks]: part stream.Part() part.partName track_data.get(name, ) current_time 0.0 for note_data in track_data[notes]: element create_music_element(note_data) if element: element.offset current_time part.insert(current_time, element) current_time note_data[duration] score.insert(0, part) score.write(midi, fpoutput_path)4. 实战中的高级技巧与性能优化4.1 处理复杂音乐结构当遇到以下特殊场景时需要特别注意连音(Tuplets)需要在JSON中额外存储time_modification字段表情标记保留expression、dynamics等演奏指示乐器变更记录program_change事件改进后的音符处理函数示例def enhanced_process_element(element): base_data process_music_element(element) # 基础处理 if hasattr(element, expressions): base_data[expressions] [ {type: type(e).__name__, value: str(e)} for e in element.expressions ] if hasattr(element, articulations): base_data[articulations] [ type(a).__name__ for a in element.articulations ] if isinstance(element, note.NotRest): if element.volume is not None: base_data[volume] { velocity: element.volume.velocity, crescendo: element.volume.crescendo } return base_data4.2 性能优化策略对于包含上万音符的大型工程文件并行处理使用多进程处理不同音轨from multiprocessing import Pool def parallel_convert(midi_path, output_path): score converter.parse(midi_path) with Pool() as pool: track_data pool.map(process_track, score.parts) result { metadata: extract_metadata(score), tracks: track_data } with open(output_path, w) as f: json.dump(result, f)增量式处理流式处理避免内存爆炸def stream_convert(midi_path, output_path): with open(output_path, w) as f: f.write({tracks: [) score converter.parse(midi_path) for i, part in enumerate(score.parts): if i 0: f.write(,) json.dump(process_track(part), f) f.write(]})二进制优化对已转换数据使用MessagePack替代JSONimport msgpack def save_compressed(data, path): with open(path, wb) as f: packed msgpack.packb(data) f.write(packed)在实际项目中这些技术组合使用可使处理时间减少40-60%特别是在处理交响乐总谱等复杂场景时效果显著。

openKylin 2.0 SP2第三次更新：优化关键模块，新增装包功能提升速度

openKylin 2.0 SP2更新：聚焦关键模块优化今天，OpenAtom openKylin社区正式推送openKylin 2.0 SP2第三次更新升级。此次更新重点针对用户反馈较多的问题，对系统更新、开明软件包格式、KARE兼容环境、软件商店、不可变系统等多个系统关键模块进…...

2026/4/22 12:39:36 阅读更多 →

蓝桥杯Python省赛复盘：从‘管道’题看二分+区间合并的实战避坑指南

蓝桥杯Python省赛复盘：从‘管道’题看二分区间合并的实战避坑指南引言去年蓝桥杯省赛的"管道"题让不少选手折戟沉沙。这道题表面看是经典的二分查找与区间合并组合，但实际暗藏多个技术陷阱。作为一道区分度极高的题目，它考察的不…...

2026/4/22 12:37:20 阅读更多 →

交错并联图腾柱无桥PFC（一）：从拓扑原理到模态分析的深度拆解

1. 交错并联图腾柱无桥PFC拓扑原理详解第一次接触交错并联图腾柱无桥PFC电路时，我被它精妙的设计所震撼。这种拓扑结构本质上是由两个Boost电路以180相位差并联组成，就像两个配合默契的舞者，通过精确的时序配合实现功率的高效转换。在实际项…...

2026/4/22 12:37:20 阅读更多 →

告别UI管理混乱：DoozyUI的UICanvas与UIView如何帮你构建可维护的Unity项目架构

告别UI管理混乱：DoozyUI的UICanvas与UIView如何帮你构建可维护的Unity项目架构在开发中大型Unity项目时，UI系统的复杂度往往随着功能迭代呈指数级增长。当项目包含多个场景、数十个界面和数百个交互元素时，开发者常会遇到以下典型问题&#…...

2026/4/21 20:14:59 阅读更多 →

C语言之整型常量后缀探秘：从1ULL/1UL/1L到跨平台编程(五十五)

1. 整型常量后缀的底层原理第一次看到1ULL这种写法时，我盯着屏幕愣了三秒——数字后面加字母是什么黑魔法？直到在32位系统上调试一个计数器溢出bug后，才真正理解这些后缀的重要性。整型常量后缀实际上是告诉编译器："别用默认…...

2026/4/20 7:00:24 阅读更多 →

VisionMaster企业实操训练系列课程

VisionMaster企业实操训练系列课程主要出于，快速会设计视觉引导定位项目引导定位原理原理演示 1.单相机带角度定位引导 2.12点标定 3.单点抓取 4.上下相机对位引导 5.单相机带角度定位引导（相机在机械手上）...

2026/4/20 0:14:41 阅读更多 →

C#怎么限制Task最大并发数_C#如何自定义TaskScheduler【进阶】

SemaphoreSlim 是控制 Task 并发数最直接轻量的选择，通过异步闸门限制同时执行任务数，需配对 WaitAsync() 和 Release() 并在 finally 中确保释放；自定义 TaskScheduler 适用场景极窄，ParallelOptions.MaxDegreeOfParallelism 仅适…...

2026/4/20 6:29:58 阅读更多 →