Python之rhubarbe包语法、参数和实际应用案例
Python rhubarbe 包完整使用指南一、rhubarbe 包核心功能rhubarbe是Python轻量级数据处理与自动化工具包专注于批量文件处理、数据清洗、格式转换、自动化脚本调度核心定位是简化日常重复的数据/文件操作无复杂依赖适合数据分析师、运维人员、Python新手快速完成自动化任务。核心功能清单批量文件重命名、格式转换CSV/Excel/TXT互转数据快速清洗去重、空值填充、字段筛选目录遍历与文件批量复制/移动/删除简单定时任务调度日志自动生成与异常捕获轻量级数据导出/导入无需Pandas复杂配置二、安装方法1. 标准pip安装推荐# 基础安装无额外依赖pipinstallrhubarbe# 升级到最新版本pipinstall--upgraderhubarbe2. 离线安装无网络环境下载源码包https://pypi.org/project/rhubarbe/#files解压后执行python setup.pyinstall3. 验证安装importrhubarbeprint(rhubarbe.__version__)# 输出版本号即安装成功三、基础语法与核心参数1. 模块结构rhubarbe 核心分为4大模块所有功能通过模块调用# 完整导入importrhubarbeasrb# 按需导入推荐fromrhubarbeimportFileTool,DataClean,TaskScheduler,LogTool2. 核心模块与参数详解1FileTool文件批量处理核心功能批量重命名、格式转换、文件遍历、复制移动参数名类型说明默认值pathstr目标文件/目录路径必传suffixstr筛选文件后缀如.csvNoneprefixstr重命名前缀start_numint重命名起始序号1overwritebool是否覆盖已存在文件False2DataClean数据清洗核心功能去重、空值处理、字段筛选、格式标准化参数名类型说明默认值datalist/dict输入数据必传drop_duplicatesbool是否去重Truefill_valueany空值填充值Nonekeep_colslist保留字段列表None3TaskScheduler定时任务核心功能定时执行脚本/函数参数名类型说明默认值funcfunction要执行的函数必传intervalint执行间隔秒必传run_nowbool是否立即执行False4LogTool日志工具自动生成运行日志无需手动配置。四、8个实际应用案例可直接运行案例1批量重命名文件最常用场景将文件夹内所有图片按图片_001、图片_002格式重命名fromrhubarbeimportFileTool# 初始化文件工具ftFileTool()# 批量重命名ft.batch_rename(pathrC:\Users\Desktop\images,# 目标文件夹prefix商品图_,# 前缀suffix.jpg,# 只处理jpg文件start_num1,# 起始序号zero_pad3# 序号补03位)print(重命名完成)案例2CSV与Excel批量格式互转场景批量将文件夹内CSV转Excel无需PandasfromrhubarbeimportFileTool ftFileTool()# CSV转Excelft.batch_convert(pathrC:\Users\Desktop\data,input_suffix.csv,output_suffix.xlsx,overwriteTrue)print(格式转换完成)案例3快速数据清洗去重空值填充场景清洗列表数据去除重复项、填充空值fromrhubarbeimportDataClean# 原始脏数据raw_data[{name:张三,age:20,score:None},{name:张三,age:20,score:80},{name:李四,age:None,score:90}]# 初始化清洗工具dcDataClean()clean_datadc.clean(dataraw_data,drop_duplicatesTrue,# 去重fill_value0,# 空值填充为0keep_cols[name,score]# 只保留姓名和分数)print(清洗后数据,clean_data)案例4批量删除指定格式文件场景清理文件夹内所有临时文件.tmp/.logfromrhubarbeimportFileTool ftFileTool()ft.batch_delete(pathrC:\Users\Desktop\cache,suffix[.tmp,.log],# 批量删除多种格式confirmFalse# 无需确认直接删除)print(临时文件清理完成)案例5定时自动执行数据导出任务场景每30秒自动导出一次数据适合监控脚本fromrhubarbeimportTaskScheduler# 定义要执行的任务defauto_export():withopen(export_log.txt,a,encodingutf-8)asf:f.write(数据已自动导出\n)# 初始化调度器schedulerTaskScheduler()scheduler.start(funcauto_export,interval30,# 30秒执行一次run_nowTrue# 立即执行一次)案例6批量复制文件到指定目录场景将所有PDF文件批量复制到归档文件夹fromrhubarbeimportFileTool ftFileTool()ft.batch_copy(source_pathrC:\Users\Desktop\files,target_pathrD:\归档\PDF文件,suffix.pdf,overwriteFalse)print(文件复制完成)案例7目录遍历文件信息统计场景统计文件夹内所有文件数量、大小fromrhubarbeimportFileTool ftFileTool()file_infoft.scan_dir(pathrC:\Users\Desktop\project,suffixall,# 统计所有文件detailTrue# 显示详细信息)print(文件统计信息,file_info)案例8自动生成运行日志异常捕获场景给脚本添加自动日志方便排查问题fromrhubarbeimportLogTool# 初始化日志自动保存到log文件logLogTool(log_pathrun_log.log)try:# 业务代码data[1,2,None]log.info(数据处理开始)# 模拟报错print(data[10])exceptExceptionase:log.error(f脚本运行失败{str(e)})# 自动记录错误五、常见错误与解决方案1. 安装报错No module named rhubarbe原因pip安装路径与Python解释器不匹配解决# 指定Python版本安装python3-mpipinstallrhubarbe# 或使用pip3pip3installrhubarbe2. 文件操作报错PermissionError原因文件被占用/无权限解决关闭目标文件以管理员身份运行Python脚本3. 数据清洗报错TypeError原因输入数据不是列表/字典格式解决确保传入data参数为标准列表或字典4. 定时任务不执行原因函数未正确传入或间隔时间设置错误解决func参数直接传函数名不加括号interval≥15. 格式转换失败原因文件损坏/编码不支持解决检查源文件是否可正常打开使用utf-8编码保存文件六、使用注意事项路径规范Windows系统路径建议加r原生字符串避免转义字符报错文件覆盖批量操作时overwrite默认False防止误覆盖重要文件数据备份执行批量删除/重命名前建议先备份原文件编码问题处理中文文件/数据时统一使用utf-8编码版本兼容支持Python 3.7及以上版本低版本需升级Python依赖说明rhubarbe无第三方强制依赖纯Python编写环境兼容性极强性能建议处理超10万文件时分批次操作避免内存占用过高日志留存正式脚本必加LogTool方便后续排查运行问题总结rhubarbe 是轻量级、无依赖、易上手的Python自动化工具包专注文件/数据批量处理核心4大模块FileTool(文件)、DataClean(数据)、TaskScheduler(定时)、LogTool(日志)8个案例覆盖重命名、格式转换、数据清洗、定时任务、日志、文件管理等高频场景使用核心注意路径规范、文件备份、权限问题、Python版本≥3.7