核心代码编程-多模态版本的最优调度-200分

张

张建站

2026/5/23 1:18:06

10分钟阅读

在大语言模型推理服务中有多个不同大小的模型版本可供选择。每个模型版本有不同的准确率和推理延迟。给定查询次数N和总时间预算T为每个查询选择一个模型版本使得在不超过时间预算的前提下总准确率最大。输入查询次数N总时间预算T模型准确率 accuracy[i]模型延迟 latency[i]输出最大总准确率同一个模型可以被多次选择0查询数量N100总时间预算T1000准确率 accuracy[i]100表示多个百分点0延迟 latency[i]200模型版本数量10可以考虑采用递归方法完成必须查满N次补充说明示例1输入2,4,[80,90, 95],[1,2,3]输出 180说明最优选择为选取两个准确率为90的模型总耗时为4总准确率为180。示例2输入 2,2,[80, 90, 95],[2,2,3]输出0说明无法有效选到要求的2个模型因此总准确率为0以下是针对您提出的问题使用不同编程语言实现的解决方案。问题描述为给定查询次数 (N)、总时间预算 (T)、模型准确率数组accuracy和模型延迟数组latency需要为每个查询选择一个模型版本可重复选择在不超过时间预算 (T) 的前提下最大化总准确率。如果无法满足条件则返回 0。C 语言实现#include stdlib.h #include limits.h int maxAccuracy(int N, int T, int* accuracy, int* latency, int M) { int** dp (int**)malloc((N 1) * sizeof(int*)); for (int i 0; i N; i) { dp[i] (int*)malloc((T 1) * sizeof(int)); for (int j 0; j T; j) { dp[i][j] -1; } } for (int t 0; t T; t) { dp[0][t] 0; } for (int k 1; k N; k) { for (int t 0; t T; t) { int bestVal -1; for (int m 0; m M; m) { int l latency[m]; int a accuracy[m]; if (t l) { int prevT t - l; if (dp[k - 1][prevT] ! -1) { int candidate dp[k - 1][prevT] a; if (candidate bestVal) { bestVal candidate; } } } } dp[k][t] bestVal; } } int maxAcc -1; for (int t 0; t T; t) { if (dp[N][t] maxAcc) { maxAcc dp[N][t]; } } for (int i 0; i N; i) { free(dp[i]); } free(dp); return (maxAcc -1) ? 0 : maxAcc; }C 语言实现#include vector #include algorithm #include climits int maxAccuracy(int N, int T, std::vectorint accuracy, std::vectorint latency) { int M accuracy.size(); std::vectorstd::vectorint dp(N 1, std::vectorint(T 1, -1)); for (int t 0; t T; t) { dp[0][t] 0; } for (int k 1; k N; k) { for (int t 0; t T; t) { int bestVal -1; for (int m 0; m M; m) { int l latency[m]; int a accuracy[m]; if (t l) { int prevT t - l; if (dp[k - 1][prevT] ! -1) { int candidate dp[k - 1][prevT] a; if (candidate bestVal) { bestVal candidate; } } } } dp[k][t] bestVal; } } int maxAcc -1; for (int t 0; t T; t) { if (dp[N][t] maxAcc) { maxAcc dp[N][t]; } } return (maxAcc -1) ? 0 : maxAcc; }JavaScript 语言实现function maxAccuracy(N, T, accuracy, latency) { const M accuracy.length; const dp Array.from({ length: N 1 }, () Array(T 1).fill(-1)); for (let t 0; t T; t) { dp[0][t] 0; } for (let k 1; k N; k) { for (let t 0; t T; t) { let bestVal -1; for (let m 0; m M; m) { const l latency[m]; const a accuracy[m]; if (t l) { const prevT t - l; if (dp[k - 1][prevT] ! -1) { const candidate dp[k - 1][prevT] a; if (candidate bestVal) { bestVal candidate; } } } } dp[k][t] bestVal; } } let maxAcc -1; for (let t 0; t T; t) { if (dp[N][t] maxAcc) { maxAcc dp[N][t]; } } return maxAcc -1 ? 0 : maxAcc; }Java 语言实现public class ModelSelector { public static int maxAccuracy(int N, int T, int[] accuracy, int[] latency) { int M accuracy.length; int[][] dp new int[N 1][T 1]; for (int k 0; k N; k) { for (int t 0; t T; t) { dp[k][t] -1; } } for (int t 0; t T; t) { dp[0][t] 0; } for (int k 1; k N; k) { for (int t 0; t T; t) { int bestVal -1; for (int m 0; m M; m) { int l latency[m]; int a accuracy[m]; if (t l) { int prevT t - l; if (dp[k - 1][prevT] ! -1) { int candidate dp[k - 1][prevT] a; if (candidate bestVal) { bestVal candidate; } } } } dp[k][t] bestVal; } } int maxAcc -1; for (int t 0; t T; t) { if (dp[N][t] maxAcc) { maxAcc dp[N][t]; } } return (maxAcc -1) ? 0 : maxAcc; } }Go 语言实现package main func maxAccuracy(N int, T int, accuracy []int, latency []int) int { M : len(accuracy) dp : make([][]int, N1) for i : range dp { dp[i] make([]int, T1) for j : range dp[i] { dp[i][j] -1 } } for t : 0; t T; t { dp[0][t] 0 } for k : 1; k N; k { for t : 0; t T; t { bestVal : -1 for m : 0; m M; m { l : latency[m] a : accuracy[m] if t l { prevT : t - l if dp[k-1][prevT] ! -1 { candidate : dp[k-1][prevT] a if candidate bestVal { bestVal candidate } } } } dp[k][t] bestVal } } maxAcc : -1 for t : 0; t T; t { if dp[N][t] maxAcc { maxAcc dp[N][t] } } if maxAcc -1 { return 0 } return maxAcc }Python 语言实现def max_accuracy(N, T, accuracy, latency): M len(accuracy) dp [[-1] * (T 1) for _ in range(N 1)] for t in range(T 1): dp[0][t] 0 for k in range(1, N 1): for t in range(T 1): best_val -1 for m in range(M): l latency[m] a accuracy[m] if t l: prev_t t - l if dp[k - 1][prev_t] ! -1: candidate dp[k - 1][prev_t] a if candidate best_val: best_val candidate dp[k][t] best_val max_acc -1 for t in range(T 1): if dp[N][t] max_acc: max_acc dp[N][t] return 0 if max_acc -1 else max_acc算法说明以上代码均使用动态规划解决该问题创建一个二维数组dp[k][t]表示选择k个查询且总时间不超过t时的最大总准确率。初始化dp[0][t] 00 个查询时准确率为 0。对于每个查询数量k从 1 到 (N)每个时间t从 0 到 (T)遍历所有模型版本如果当前时间t大于等于模型延迟latency[m]且前一个状态dp[k-1][t - latency[m]]有效不为 -1则计算候选值dp[k-1][t - latency[m]] accuracy[m]。更新dp[k][t]为所有候选值中的最大值。最终在dp[N][t](t \leq T)) 中寻找最大值如果所有值均为 -1不可能则返回 0。该算法时间复杂度为 (O(N \times T \times M))空间复杂度为 (O(N \times T))符合问题约束(N \leq 100), (T 1000), (M \leq 10)。

AI Agent开发工具大爆发：Claude、OpenAI、Google三强争霸

一、开篇：一夜之间，AI Agent开发工具"卷"起来了说实话，作为一个每天泡在代码里的开发者，我原以为AI代码助手的发展速度已经够快了。但看了过去24小时的AI圈动态，我直呼"好家伙"——Claude Code、…...

2026/5/23 1:09:37 阅读更多 →

昇腾NPU上的FlashAttention藏在哪？ops-transformer仓库全景图

刚接触昇腾CANN生态的时候，光是找FlashAttention算子在哪就花了不少时间。官方文档按功能模块划分，仓库按层级划分，两套逻辑对不上号——文档里写的是"大模型算子优化"，仓库里是一个叫ops-transformer的目录。这种对应关…...

2026/5/23 1:07:42 阅读更多 →

CANN 视觉模型部署：ResNet、YOLO 等经典模型的 NPU 落地

一、视觉模型分类 1.1 模型类型视觉模型三大类:分类模型 (Classification)ResNet, VGG, EfficientNet, ViT输入: 图像 → 输出: 类别概率检测模型 (Detection)YOLO, SSD, Faster R-CNN, DETR输入: 图像 → 输出: 边界框类别分割模型 (Segmentation)U-Net, DeepLab, Mask R-C…...

2026/5/23 1:07:09 阅读更多 →

CircuitPython嵌入式开发实战：从传感器采集到数据存储的完整方案

1. 项目概述与核心价值如果你刚开始接触嵌入式开发，面对琳琅满目的传感器、通信协议和存储需求，可能会感到无从下手。今天，我想分享一个基于CircuitPython的综合性实践项目，它串联了从模拟信号采集、数字通信到数据存储的多个核心…...

2026/5/22 17:23:01 阅读更多 →

3PEAK思瑞浦 TPA2644-TS2R TSSOP14 运算放大器

特性供电电压:3V至36V 偏移电压:2mV(最大值) 差分输入电压范围至电源轨，可作为比较器工作带宽:1.5MHz，斜率:0.5V/us 输入轨至-Vs，无内部ESD二极管至Vs 低1/f噪声:在10Hz时为50nV/Hz 高PSRR:100kHz时60dB 开关电源时无显著输出抖动工作温度…...

2026/5/21 21:54:05 阅读更多 →

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率【免费下载链接】Wu.CommTool 基于C#、WPF、Prism、MaterialDesign、HandyControl开发的通讯调试工具。支持Modbus Rtu调试、Mqtt调试、TCP调试、串口调试、UDP调试项目地址: https://gitcode.com/gh_mirrors/wu/W…...

2026/5/22 17:49:20 阅读更多 →