两行命令,MiniMax 给 Agent 安了五条腿
我上个月折腾了一个自动化短视频流水线——搜资料用一个 API出图调 Midjourney配音找 ElevenLabs剪辑又得开另一个服务。光胶水代码就写了两天中间还踩了三个接口超时的坑。当时就一个念头这破玩意就不能打包成一个命令吗今天 MiniMax 发了 MMX-CLI算是把这个想法落地了。不是又一个命令行工具——这东西从设计之初就是给 Agent 用的不是给你在终端里敲着玩的。装完你就知道什么叫一行命令干完以前半天的事安装就两行npminstall-gmmx-cli mmx auth login --api-key sk-xxxxx完事了。不需要配 MCP Server不需要读五份不同格式的 API 文档不需要你写一个 try-catch 套一个 try-catch。装完之后你的 Agent 可以直接这样用mmx text chat--message帮我写个短视频脚本mmx image赛博朋克风格的城市夜景mmx speech synthesize--text旁白文案--outvoice.mp3 mmx video generate--prompt镜头从天际线推到街巷mmx music generate--prompt电子风格BGM--outbgm.mp3看到没文本、出图、配音、视频、配乐——五个环节一条命令一个。Agent 不需要知道你背后调的是哪家的模型它只管mmx xxx就行。还有个我特别喜欢的mmx search MiniMax AI 最新动态直接搜网Agent 不用再自己封装搜索接口了。这玩意跟普通 CLI 有什么不一样讲真一开始我看到命令行工具四个字是没什么感觉的——CLI 不都那样吗装上、敲命令、看输出。但 MMX-CLI 不一样的地方在于它解决了 Agent 用命令行时那些让人崩溃的小问题。你让 Agent 跑一个普通 CLI 工具会遇到什么输出里混着彩色进度条和 ANSI 转义字符Agent 解析直接炸。报错信息是一大段英文Agent 得先读懂才能决定怎么办。参数没传全程序就挂在那等交互式输入整个任务卡死。MMX-CLI 的处理方式让我觉得这团队确实用过 Agentstdout 只吐干净数据——文件路径或者 JSON进度条全扔 stderrAgent 拿到直接就能用。错误不跟你废话直接给退出码。鉴权失败是 1参数错误是 2超时是 3——Agent 看一眼数字就知道该重试还是该报错。还有更省心的参数不全直接退出不傻等。长任务比如视频生成加个--async就转后台了Agent 可以并行干别的事。说白了吧这就是一个为 Agent 而生的 CLI。传统 CLI 是给人用的这个是给 Agent 用的——区别就在这些细节里。完整工作流长什么样假设你想让 Agent 自动做一条科普短视频前半段先搜资料和写脚本mmx search量子计算最新进展mmx text chat--system你是科普编剧\--message写个60秒短视频脚本mmx image量子计算机概念图蓝紫色调后半段配音、配乐、生成视频一条龙mmx speech synthesize--text旁白内容\--voiceChinese_gentle_woman--outvoice.mp3 mmx music generate--prompt科技感轻音乐\--instrumental--outbgm.mp3 mmx video generate--prompt量子比特可视化动画以前这套流程你得对接四五家服务商每家的鉴权方式、返回格式、错误处理都不一样。现在一个mmx全搞定额度统一走 Token Planmmx quota看一眼就知道还剩多少。价格嘛官网有 Token Plan29 块的 Starter 够试水几百次。别问我 899 的极速版谁买——等你业务跑起来了再说。顺带提一嘴语音合成有 30 多种音色从磁性大叔到甜妹都有你 Agent 的配音终于不用再机器人味了。视频生成目前还是异步模式得--async提交再轮询状态这块后续应该会优化。我的看法说实话MMX-CLI 算不上什么大杀器但它做了一件很实在的事——把 Agent 调多模态 API 这件事从造轮子降到了装个包。如果你是 Agent 开发者经常需要对接多模态能力29 块钱试试不亏。如果你只是偶尔生成张图、配个音直接用 MiniMax 的网页端也够了没必要上 CLI。有一点要注意这工具刚发布还在早期阶段视频生成和音乐生成的稳定性还需要时间验证。别拿它直接上生产环境先在测试环境跑跑看。还有个信号——MMX-CLI 是 MiniMax 在 Agent 基础设施这条线上的第一件工具。结合他们之前发布的 M2.7 模型和 Token Plan能看出 MiniMax 在搭一套完整的 Agent 开发栈。后面大概率还有动作。你让 Agent 调多模态 API最崩溃的是哪步评论区聊聊。