别再混淆min和argmin了！用Python和NumPy代码实例，5分钟彻底搞懂机器学习里的这两个关键符号

张

张建站

2026/5/27 20:05:09

10分钟阅读

别再混淆min和argmin了！用Python和NumPy代码实例，5分钟彻底搞懂机器学习里的这两个关键符号

从代码实践到算法应用min与argmin的本质差异解析第一次看到min和argmin这两个符号时我也曾困惑不已——它们看起来如此相似却又在机器学习论文和代码库中频繁出现。直到在实战项目中因为混淆两者导致模型评估出错后才真正理解它们的区别。本文将用Python和NumPy带你直击这两个符号的核心差异通过可视化对比和实际算法场景让你彻底掌握它们的正确使用方式。1. 基础概念当数学符号遇见代码实现1.1 min寻找集合中的最小值min的本质是寻找一组数据中的最小数值。在Python中这就像调用内置的min()函数一样简单numbers [3, 1, 9, 8] min_value min(numbers) print(f最小值是{min_value}) # 输出最小值是1但在NumPy中处理多维数组时np.min()展现出更强大的能力import numpy as np matrix np.array([[3, 2, 9], [7, 6, 1]]) print(np.min(matrix)) # 输出整个矩阵的最小值1 print(np.min(matrix, axis0)) # 沿列方向求最小值[3 2 1]关键理解min只关心结果值的大小不关心这个值来自哪个位置。就像在电商比价时我们首先关注的是最低价格本身。1.2 argmin定位最小值的坐标argmin则专注于寻找最小值所在的位置索引。在NumPy中np.argmin()返回的是扁平化后的索引位置vector np.array([3, 1, 9, 8]) min_index np.argmin(vector) print(f最小值位置{min_index}) # 输出最小值位置1 # 矩阵中定位最小值位置 row, col np.unravel_index(np.argmin(matrix), matrix.shape) print(f矩阵最小值位置第{row1}行第{col1}列) # 输出矩阵最小值位置第2行第3列实际应用场景在推荐系统中我们可能需要找到用户评分最低的电影索引以便改进推荐策略。这时argmin就能精确定位到需要优化的具体项目。2. 函数优化中的双生子理论与代码对照2.1 数学函数的最小化问题考虑二次函数$f(x) x^2 x 1$我们可以在定义域[-1, 1]内寻找其最小值def f(x): return x**2 x 1 x_values np.linspace(-1, 1, 100) y_values f(x_values) min_y np.min(y_values) # 最小值 min_x x_values[np.argmin(y_values)] # 使函数取最小值的x print(f函数最小值{min_y:.4f}) # 输出函数最小值0.7500 print(f最小值点x坐标{min_x:.4f}) # 输出最小值点x坐标-0.5051注意理论上最小值出现在x-0.5这里由于离散采样存在微小误差。实际优化算法中这种精度通常已足够。2.2 多维度优化案例在三维空间寻找函数$g(x,y) x^2 y^2 - xy$的最小值def g(x, y): return x**2 y**2 - x*y x np.linspace(-2, 2, 100) y np.linspace(-2, 2, 100) X, Y np.meshgrid(x, y) Z g(X, Y) min_z np.min(Z) min_idx np.unravel_index(np.argmin(Z), Z.shape) min_x, min_y X[min_idx], Y[min_idx] print(f全局最小值{min_z:.2f} at ({min_x:.2f}, {min_y:.2f})) # 输出全局最小值0.00 at (0.00, 0.00)3. 机器学习中的实战应用3.1 损失函数优化在训练线性回归模型时我们需要最小化均方误差(MSE)# 模拟数据集 X np.array([[1, 2], [1, 3], [1, 4]]) # 添加偏置项 y np.array([3, 5, 7]) theta np.array([0, 0]) # 初始参数 def compute_cost(X, y, theta): predictions X.dot(theta) return np.mean((predictions - y)**2) # 在参数空间采样 theta0_vals np.linspace(-1, 3, 100) theta1_vals np.linspace(-1, 3, 100) J_vals np.zeros((len(theta0_vals), len(theta1_vals))) for i in range(len(theta0_vals)): for j in range(len(theta1_vals)): J_vals[i,j] compute_cost(X, y, [theta0_vals[i], theta1_vals[j]]) # 寻找最优参数 min_cost np.min(J_vals) theta0_min, theta1_min theta0_vals[np.argmin(J_vals, axis0)[0]], theta1_vals[np.argmin(J_vals, axis1)[0]] print(f最小损失值{min_cost:.4f}) print(f最优参数θ0{theta0_min:.2f}, θ1{theta1_min:.2f})3.2 KNN算法中的最近邻查找在K近邻算法中argmin用于找到距离最近的样本# 样本数据 X_train np.array([[1, 2], [3, 4], [5, 6]]) y_train np.array([0, 1, 0]) x_test np.array([2, 3]) # 计算欧式距离 distances np.sqrt(np.sum((X_train - x_test)**2, axis1)) nearest_idx np.argmin(distances) predicted_class y_train[nearest_idx] print(f测试样本的最近邻索引{nearest_idx}) print(f预测类别{predicted_class})4. 高级应用与性能优化4.1 批量处理与向量化计算对于大规模数据理解min和argmin的轴参数至关重要# 生成随机数据矩阵 (10000样本 x 100特征) data np.random.randn(10000, 100) # 沿特征轴求每个样本的最小值 sample_mins np.min(data, axis1) # 找出每个样本最小特征的位置 sample_min_indices np.argmin(data, axis1) # 全局统计 global_min np.min(data) global_min_location np.unravel_index(np.argmin(data), data.shape)4.2 结合Pandas的实际数据分析在数据分析中这两个操作经常用于数据清洗和特征工程import pandas as pd df pd.DataFrame({ 产品A: [10, 20, 30, 40], 产品B: [15, 25, 35, 45], 产品C: [12, 22, 32, 42] }) # 找出每行的最低价格 df[最低价] df.min(axis1) # 找出每行最低价对应的产品 df[最低价产品] df.iloc[:, :3].idxmin(axis1) # 找出全表最低价的位置 min_price df.iloc[:, :3].min().min() min_product, min_row df.iloc[:, :3].stack().idxmin()在完成这些代码实验后我发现最有效的学习方法其实是故意制造错误——尝试用min代替argmin观察程序如何失败然后仔细阅读错误信息。这种主动探索比被动记忆要深刻得多。

Cadence OrCAD Capture CIS原理图画布设置保姆级指南：A4纸大小、毫米单位、网格显示与暗色主题

Cadence OrCAD Capture CIS原理图画布设置保姆级指南：A4纸大小、毫米单位、网格显示与暗色主题第一次打开OrCAD Capture CIS时，许多工程师都会对默认的英制单位和亮色界面感到不适应。本文将手把手带你完成画布环境的初始化配置，让软件界面更…...

2026/5/27 20:00:57 阅读更多 →

Starlette 框架 BadHost 漏洞威胁全球数百万 AI 代理，或致敏感数据被盗

BadHost 漏洞：威胁数百万 AI 代理的安全危机一位安全研究员发出警告，全球数百万个 AI 代理和工具正面临严重威胁。黑客可利用存在于开源框架 Starlette 中的漏洞，入侵运行这些代理和工具的服务器，窃取敏感数据和第三方账户凭证。该…...

2026/5/27 19:46:56 阅读更多 →

别再只懂最小二乘法了！用Python+NumPy手把手实现一个简易卡尔曼滤波器（附GPS定位小例子）

从最小二乘法到卡尔曼滤波：用Python实现动态系统状态估计在数据处理和信号处理领域，我们经常需要从带有噪声的观测数据中估计系统的真实状态。最小二乘法作为经典的参数估计方法，虽然简单有效，但在处理时序数据时存在明显局限。本…...

2026/5/27 19:45:50 阅读更多 →

【限时解密】Claude 3.5 Sonnet专属编程模式：仅开放给前500家企业的上下文感知补全协议

更多请点击： https://kaifayun.com 第一章：Claude 3.5 Sonnet编程辅助的核心能力边界与适用场景 Claude 3.5 Sonnet 在编程辅助领域展现出显著的推理深度与上下文理解能力，但其本质仍是基于大规模语言模型的生成式系统，不具备实时…...

2026/5/27 12:43:11 阅读更多 →

RMAN 增量备份（Incremental Backup）

1、概念RMAN 增量备份是指 RMAN 只备份自上次备份以来发生过更改的数据块，而不是备份整个数据库的所有数据块。它是 Oracle 为解决大型数据库全量备份时间长、占用空间大的问题而设计的核心特性，也是现代企业级备份策略的基础。简单类比：全库…...

2026/5/27 0:57:50 阅读更多 →

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧【免费下载链接】ProperTree Cross platform GUI plist editor written in python. 项目地址: https://gitcode.com/gh_mirrors/pr/ProperTree 想要轻松编辑macOS和iOS的配置文件却苦于复杂的XML语法…...

2026/5/27 16:46:38 阅读更多 →

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件【免费下载链接】ScriptHookV An open source hook into GTAV for loading offline mods 项目地址: https://gitcode.com/gh_mirrors/sc/ScriptHookV ScriptHookV是一个专为《侠盗猎车手V》&…...

2026/5/27 17:17:05 阅读更多 →