编写程序统计公司各部门月度考勤数据，自动筛选迟到早退高频人员，智能生成考勤整改报表，帮企业规范职场作息制度，降低人员散漫问题。

张

张建站

2026/5/11 23:26:07

10分钟阅读

编写程序统计公司各部门月度考勤数据，自动筛选迟到早退高频人员，智能生成考勤整改报表，帮企业规范职场作息制度，降低人员散漫问题。

目标不是做考勤硬件也不是做人脸打卡而是用数据分析方法把“散漫问题”量化、可视化、可追溯化。一、实际应用场景描述场景一家中型公司约 300–500 人实行弹性上班制各部门自行管理考勤。HR 每月从打卡系统导出 Excel / CSV 原始数据人工统计迟到、早退情况再反馈给部门负责人。典型数据字段- 员工ID- 姓名- 部门- 日期- 上班打卡时间- 下班打卡时间二、引入痛点BI 视角痛点业务映射人工统计效率低数据量大、规则多标准不统一部门对“迟到”定义不一致无法定位重点人员只看总数不看高频个体整改无数据支撑口头提醒缺乏量化依据商务智能切入点- 用聚合分析看部门差异- 用阈值规则识别高频异常- 用自动化报表替代手工 Excel三、核心逻辑讲解设计思想1️⃣ 数据层ETL 思维- 读取原始打卡数据CSV / Excel- 清洗缺失值、异常时间- 统一时间格式2️⃣ 规则层KPI 定义统一规则示例- 上班晚于 09:30 → 迟到- 下班早于 18:00 → 早退- 单月迟到 ≥ 3 次 → 重点关注3️⃣ 分析层OLAP 思维- 按部门聚合- 按员工聚合- 计算- 迟到次数- 早退次数- 异常率4️⃣ 输出层报表自动化- 生成- 部门考勤汇总表- 高频异常人员清单- 整改建议报表文本四、代码模块化结构attendance_bi/│├── etl.py # 数据读取与清洗├── rules.py # 考勤规则定义├── analytics.py # 统计与聚合├── reporter.py # 报表生成├── main.py # 主入口└── README.md五、核心代码示例简化版1️⃣ 数据读取与清洗etl.pyimport pandas as pddef load_attendance_data(file_path: str) - pd.DataFrame:读取原始考勤数据df pd.read_csv(file_path)# 转换时间字段df[check_in] pd.to_datetime(df[check_in], errorscoerce)df[check_out] pd.to_datetime(df[check_out], errorscoerce)# 去除关键字段缺失的数据df.dropna(subset[employee_id, department, date], inplaceTrue)return df2️⃣ 考勤规则定义rules.pyfrom datetime import timeLATE_THRESHOLD time(9, 30)EARLY_LEAVE_THRESHOLD time(18, 0)def is_late(check_in):return check_in.time() LATE_THRESHOLD if pd.notna(check_in) else Falsedef is_early_leave(check_out):return check_out.time() EARLY_LEAVE_THRESHOLD if pd.notna(check_out) else False3️⃣ 统计分析analytics.pyimport pandas as pddef department_summary(df: pd.DataFrame) - pd.DataFrame:按部门统计迟到、早退次数summary (df.groupby(department).agg(late_count(is_late, sum),early_leave_count(is_early_leave, sum),employee_count(employee_id, nunique)).reset_index())summary[late_rate] summary[late_count] / summary[employee_count]return summary4️⃣ 高频人员筛选与报表reporter.pydef find_high_risk_employees(df: pd.DataFrame, threshold3):筛选单月迟到 threshold 的人员risk_df (df.groupby([employee_id, name, department]).agg(late_times(is_late, sum)).reset_index())return risk_df[risk_df[late_times] threshold]5️⃣ 主程序main.pyfrom etl import load_attendance_datafrom rules import is_late, is_early_leavefrom analytics import department_summaryfrom reporter import find_high_risk_employeesdf load_attendance_data(attendance.csv)df[is_late] df[check_in].apply(is_late)df[is_early_leave] df[check_out].apply(is_early_leave)dept_report department_summary(df)risk_employees find_high_risk_employees(df)dept_report.to_csv(department_attendance_report.csv, indexFalse)risk_employees.to_csv(high_risk_employees.csv, indexFalse)print(考勤报表生成完成)六、README 文件精简版# 企业考勤数据分析系统Demo## 功能- 月度考勤数据清洗- 部门级迟到 / 早退统计- 高频异常人员识别- 自动生成整改报表## 使用方法bashpip install pandaspython main.py## 输入数据- attendance.csv- employee_id- name- department- date- check_in- check_out七、使用说明中立化1. 本系统不涉及生物识别数据2. 仅基于已有打卡记录进行分析3. 适用于- 企业 HR 数据分析- BI 课程案例- 管理改进试点项目4. 规则可根据企业制度灵活调整八、核心知识点卡片去营销化模块知识点ETL 数据抽取、清洗、转换规则建模 KPI 定义、阈值判断OLAP 多维聚合分析数据治理缺失值处理、标准化BI 思维从数据到管理决策九、总结工程师 BI 视角这个项目的意义在于- ✅ 把“散漫”这种主观感受变成可量化的指标- ✅ 让管理层看到- 哪个部门问题最突出- 哪些人是重点对象- ✅ 为制度优化、绩效挂钩、文化建设提供数据基础它不是监控工具而是一个管理诊断系统。利用AI解决实际问题如果你觉得这个工具好用欢迎关注长安牧笛

别再死记0.7V了！用Multisim仿真带你直观理解三极管Ube的‘变’与‘不变’

三极管Ube的仿真实验：从静态工作点到动态响应的可视化探索在电子电路设计中，三极管作为核心放大元件，其工作状态的理解直接影响电路性能。传统教学中常简单地将Ube电压默认为0.7V，这种简化虽便于计算，却掩盖了实际工作…...

2026/5/11 23:24:40 阅读更多 →

从手动点到自动选：用C#给SolidWorks草图轮廓选择做个‘智能外挂’

从手动点到自动选：用C#给SolidWorks草图轮廓选择做个‘智能外挂’ 在机械设计领域，SolidWorks作为主流三维CAD软件，其草图绘制功能是建模的基础。然而，当面对包含多个复杂轮廓的草图时，工程师往往需要反复执行相同的选…...

2026/5/11 23:24:25 阅读更多 →

【JAVA】我第一个上线项目

（其实就是黑马头条） 2025.3—2026.4 今天头条(后端核心开发) 项目人线上访问地址： 用户 APP 端：http://47.120.5.9:8801/#/login 自媒体运营端：http://47.120.5.9:8802/#/l…...

2026/5/11 23:24:01 阅读更多 →

OpenClaw智能模型路由：基于任务复杂度与成本约束的动态调度实践

1. 项目概述：一个聪明的AI模型调度器如果你正在使用OpenClaw，并且手头同时接入了多个不同能力、不同成本的AI模型（比如Kimi、GPT、Claude等），那么你很可能遇到过这样的困扰：一个简单的文本总结任务&#xf…...

2026/5/11 19:13:10 阅读更多 →

机器学习的数据合成（二）

原文：annas-archive.org/md5/9d5ab593b867c3a47f27572d629020aa 译者：飞龙协议：CC BY-NC-SA 4.0 第十四章：合成到真实领域自适应本章向您介绍了一个常见的问题，通常限制了合成数据的使用性，称为领域差距…...

2026/5/10 0:10:18 阅读更多 →

cann/catlass MX FP8批量矩阵乘

MXFP8BatchMatmulTla Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 功能介绍演示 Ascend 950 上的 MX FP8 矩阵乘：A、B …...

2026/5/11 13:10:58 阅读更多 →