学生用户画像-考勤主题扩展标签构建与考勤画像可视化分析实验背景1.1实验目的基于已完成的学生考勤主题标签表student_attendance_stats使用 K-Means 聚类算法对学生考勤行为进行自动分群。通过迟到、早退、请假、校服违规次数等核心指标识别不同类型的考勤群体生成可解释的考勤画像为校园学生管理、行为分析提供精准数据支撑基于已完成 K-Means 聚类并标注考勤群体的学生考勤主题标签表本实验聚焦“纪律高危型”群体分析其行为特征。相比其他群体该群体存在高频违纪、多维度异常叠加等行为特征是校园考勤管理中风险最高、影响最大的群体。通过专项画像分析可为精准干预和重点整治提供数据支撑助力校园精细化管理。1.2 实验环境1.助睿数智Uniplore的数据集成平台 ETL​2.数据库MySQL含订单数据和产品信息表​3.数据准备学生考勤主题标签表student_attendance_stats1.3 实验流程通过对数据的观察以及对考勤分群的业务需求分析确定本次建模分析思路如下数据维度清晰、变量数量适中聚焦考勤行为核心指标无需复杂降维。基于考勤业务理解将变量聚焦在迟到次数、早退次数、请假次数、校服违规次数四类行为维度每个维度直接反映一类考勤特征变量间业务含义独立、相关性低可直接用于 K-Means 聚类建模避免变量冗余导致模型解释困难。本次建模采用次数类连续变量数据类型单一、适配 K-Means 算法要求。考勤次数均为非负整数属于连续型变量满足 K-Means 对数据类型的要求无需进行哑变量编码、二值化或特殊转换可直接输入模型简化预处理流程保证聚类结果稳定可靠。学生基础离散属性性别、年级、住校状态等不参与聚类建模仅作为后续画像标签的辅助解释变量。实验步骤1.AI Studio聚类建模新建工作流1.2 数据导入1.3K-Means聚类建模1.4 结果输出与保存2.分析聚类簇编号对应的考勤群体分类2.1 连接数据源2.2 构建数据集2.3 制作工作表2.4搭建仪表盘3.1新增扩展字段3.2聚类簇编号数据获取3.3 字段选择3.4聚类簇编号映射3.5 更新学生考勤主题标签3.6运行转换流3.7 查看结果考勤画像可视化分析4.1 进入助睿BI4.2 构建数据集4.3 制作工作表4.3.1 整体状况指标卡4.3.1.1 纪律高危型总人数4.3.1.2 记录高危型男生人数4.3.1.3 记录高危型女生人数4.3.1.4 纪律高危型未知性别人数4.3.2 纪律高危型学生性别特征分析4.3.2.1 纪律高危型学生男女人数占比4.3.2.2 全校学生男女人数占比4.3.3 纪律高危型学生年纪特征分析4.3.4纪律高危型学生校区类型 年级交叉特征分析4.3.5不同校区类型各年级学生人数4.3.6纪律高危型学生班级特征分析搭建综合仪表盘三、实验结果