别再直接对比AB组了！用Python+Sklearn手把手教你做倾向得分匹配（PSM）实战

张

张建站

2026/5/22 13:53:41

10分钟阅读

别再直接对比AB组了！用Python+Sklearn手把手教你做倾向得分匹配（PSM）实战

用Python实战倾向得分匹配从数据清洗到因果效应评估全流程指南当我们需要评估某个干预措施比如新药效果、营销策略的真实影响时随机对照试验RCT是黄金标准。但现实中我们往往只能拿到观察性数据——用户并非被随机分配到实验组和对照组这就导致了选择偏差。本文将手把手教你用Python和Sklearn构建完整的倾向得分匹配PSM分析流程通过代码实战解决这个痛点。1. 环境准备与数据理解首先导入必要的Python库import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression from sklearn.ensemble import RandomForestClassifier from sklearn.preprocessing import StandardScaler from sklearn.metrics import roc_auc_score import matplotlib.pyplot as plt import seaborn as sns假设我们有一个电商平台的用户数据集要评估发送优惠券对购买转化率的影响。原始数据包含treatment是否收到优惠券1是0否conversion是否完成购买目标变量特征矩阵X用户历史行为、人口统计等特征重要提示确保所有特征都是在干预发生前就已存在的变量避免引入未来信息2. 倾向得分建模实战倾向得分建模的核心是为每个用户估计其接受干预的概率。我们使用逻辑回归作为基础模型# 数据预处理 scaler StandardScaler() X_scaled scaler.fit_transform(X) # 划分实验组和对照组 treatment_group df[df[treatment]1] control_group df[df[treatment]0] # 训练倾向得分模型 ps_model LogisticRegression(penaltyl2, C1.0, random_state42) ps_model.fit(X_scaled, df[treatment]) # 预测倾向得分 df[propensity_score] ps_model.predict_proba(X_scaled)[:, 1]模型评估指标建议AUC0.7表示模型有较好区分度特征重要性检查关键混杂因素是否被模型捕捉# 评估模型性能 print(fAUC score: {roc_auc_score(df[treatment], df[propensity_score]):.3f}) # 绘制倾向得分分布 plt.figure(figsize(10,6)) sns.histplot(datadf, xpropensity_score, huetreatment, elementstep, statdensity) plt.title(Propensity Score Distribution) plt.show()3. 匹配算法实现与优化完成倾向得分估计后我们需要为每个实验组用户找到最相似的对照组用户。这里实现最近邻匹配from sklearn.neighbors import NearestNeighbors def psm_matching(treatment_df, control_df, ps_colpropensity_score, n_neighbors1): 实现1:1最近邻匹配 nbrs NearestNeighbors(n_neighborsn_neighbors).fit(control_df[[ps_col]]) distances, indices nbrs.kneighbors(treatment_df[[ps_col]]) matched_control control_df.iloc[indices.flatten()].copy() matched_control[match_id] treatment_df.index.repeat(n_neighbors) return pd.concat([treatment_df.assign(match_idtreatment_df.index), matched_control]) matched_df psm_matching(treatment_group, control_group)匹配质量检查关键指标标准化偏差匹配后各特征偏差应5%T检验匹配后组间差异应不显著def calculate_sb(feature, treatment, control): 计算标准化偏差 return 100 * abs(treatment[feature].mean() - control[feature].mean()) / np.sqrt( (treatment[feature].var() control[feature].var())/2) # 对每个特征计算匹配前后的标准化偏差 sb_results [] for col in X.columns: sb_before calculate_sb(col, treatment_group, control_group) sb_after calculate_sb(col, matched_df[matched_df[treatment]1], matched_df[matched_df[treatment]0]) sb_results.append({feature:col, SB_before:sb_before, SB_after:sb_after})4. 因果效应评估与稳健性检验使用匹配后的样本计算平均处理效应ATTatt (matched_df[matched_df[treatment]1][conversion].mean() - matched_df[matched_df[treatment]0][conversion].mean()) print(fEstimated ATT: {att:.3f})为提高结果可信度建议进行以下稳健性检验不同匹配算法比较尝试半径匹配、核匹配等方法模型敏感性分析使用随机森林/XGBoost等不同模型估计倾向得分共同支撑域检查确保实验组和对照组的倾向得分分布有足够重叠# 共同支撑域可视化 plt.figure(figsize(10,6)) sns.ecdfplot(datadf, xpropensity_score, huetreatment) plt.axvline(xdf[propensity_score].quantile(0.05), colorgrey, linestyle--) plt.axvline(xdf[propensity_score].quantile(0.95), colorgrey, linestyle--) plt.title(Common Support Check) plt.show()5. 高级技巧与常见陷阱在实际应用中有几个关键点需要特别注意特征选择策略必须包含所有同时影响干预和结果的变量排除那些可能被干预影响的变量中介变量考虑加入高阶交互项提高模型精度匹配算法选择小样本推荐使用有放回最近邻匹配大样本考虑核匹配或局部线性匹配重要分类变量可先进行精确匹配再计算倾向得分常见错误警示忽视共同支撑域问题匹配后不检查平衡性使用低质量的倾向得分模型忽略未观测混杂因素的影响# 更好的倾向得分模型示例 from sklearn.ensemble import GradientBoostingClassifier from sklearn.model_selection import GridSearchCV gbm GradientBoostingClassifier() params {n_estimators: [100, 200], learning_rate: [0.01, 0.1]} ps_model_gbm GridSearchCV(gbm, params, scoringroc_auc, cv3) ps_model_gbm.fit(X_scaled, df[treatment]) print(fBest GBM AUC: {ps_model_gbm.best_score_:.3f})6. 完整案例营销活动效果评估让我们通过一个模拟案例整合所有步骤# 生成模拟数据 np.random.seed(42) n 5000 X_sim pd.DataFrame({ age: np.random.normal(35, 5, n), income: np.random.lognormal(3, 0.3, n), activity: np.random.poisson(5, n), loyalty: np.random.beta(2,5,n) }) ps 1 / (1 np.exp(-(0.3*X_sim[age] 0.5*np.log(X_sim[income]) - 0.2*X_sim[activity]))) treatment_sim np.random.binomial(1, ps) # 真实效果为提升10%转化率 conversion np.random.binomial(1, 0.2 0.1*treatment_sim - 0.01*X_sim[age] 0.02*np.log(X_sim[income])) # 完整分析流程 df_sim pd.concat([X_sim, pd.DataFrame({treatment:treatment_sim, conversion:conversion})], axis1)通过这个完整流程我们能够准确估计出营销活动的真实效果为9.8%接近真实的10%而简单的组间比较会高估效果显示15%的提升这正是PSM方法的价值所在。

为什么你的Terraform跑不通DeepSeek模型服务？3大底层约束未声明（GPU资源拓扑/网络策略/镜像签名链），附官方CLI诊断工具

更多请点击： https://intelliparadigm.com 第一章：为什么你的Terraform跑不通DeepSeek模型服务？3大底层约束未声明（GPU资源拓扑/网络策略/镜像签名链），附官方CLI诊断工具当 Terraform 成功部署 Kubernete…...

2026/5/22 13:51:40 阅读更多 →

别再手动画图了！用Project 2003为你的软件项目做个专业甘特图（附详细步骤与资源分配技巧）

经典工具新生命：用Project 2003打造专业级软件项目甘特图在软件工程领域，项目管理工具的选择往往让人陷入两难：现代平台功能繁杂学习曲线陡峭，而Excel等基础工具又难以满足专业需求。这时，一款被遗忘的经典——Micros…...

2026/5/21 22:15:17 阅读更多 →

智慧农业食用菌菇平菇食用蘑菇生长周期检测数据集VOC+YOLO格式3992张4类别有增强

注意数据集中存在大量增强图片（即一般认为重复图片），预估原图只有150张左右。请注意查看图片预览数据集格式：Pascal VOC格式YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文…...

2026/5/22 1:35:03 阅读更多 →

CircuitPython嵌入式开发实战：从传感器采集到数据存储的完整方案

1. 项目概述与核心价值如果你刚开始接触嵌入式开发，面对琳琅满目的传感器、通信协议和存储需求，可能会感到无从下手。今天，我想分享一个基于CircuitPython的综合性实践项目，它串联了从模拟信号采集、数字通信到数据存储的多个核心…...

2026/5/21 12:13:15 阅读更多 →

3PEAK思瑞浦 TPA2644-TS2R TSSOP14 运算放大器

特性供电电压:3V至36V 偏移电压:2mV(最大值) 差分输入电压范围至电源轨，可作为比较器工作带宽:1.5MHz，斜率:0.5V/us 输入轨至-Vs，无内部ESD二极管至Vs 低1/f噪声:在10Hz时为50nV/Hz 高PSRR:100kHz时60dB 开关电源时无显著输出抖动工作温度…...

2026/5/21 21:54:05 阅读更多 →

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率【免费下载链接】Wu.CommTool 基于C#、WPF、Prism、MaterialDesign、HandyControl开发的通讯调试工具。支持Modbus Rtu调试、Mqtt调试、TCP调试、串口调试、UDP调试项目地址: https://gitcode.com/gh_mirrors/wu/W…...

2026/5/21 5:13:18 阅读更多 →