语音转文字Buzz的安装与使用 inAI(index: AI, win, mklink, whisper, 22h2, 1.4.4)

张

张建站

2026/7/24 2:47:50

10分钟阅读

语音转文字Buzz的安装与使用 inAI(index: AI, win, mklink, whisper, 22h2, 1.4.4)

Buzz可以将语音转成文字。默认使用的是 OpenAI推出的语音识别AI模型whisper。配置与环境OSWindows 10需要 1809以上CPUi5-8250UGPUHD4600无独显内存条8GWin10版本22H2Buzz版本1.4.4升级win10到22H2https://www.microsoft.com/zh-cn/software-download/windows10下载链接https://github.com/chidiwilliams/buzz/releasesWindows版需要exe、1.bin、2.bin都下载了。将它们放到同一个目录下执行exe文件就能完成安装了。界面介绍安装好后界面中会有“文件”和“帮助” 两个选项。“文件” 选项就是选定输入源的。“帮助”选项“帮助”选项里有一项 “偏好设置”由于本人的电脑是集显所以这里选择了禁用。这一项在使用 whisper.cpp的模型时容易报错。但就算勾上了从运行结果来看也没能运行成功。选择“模型”选项则会有三个选择Whisper原生python。Whisper.cppC效率更高内存占用更低。在我的机子上更多报错Faster WhisperGPU上比原版快。在更下面的那个框是 whisper的模型占用空间大小随着变化精度也会随之变化。在这里只下载了 TinyTiny-en。追求准确性的话越往后越准确。在“组”这个设置中选择不同的选项都时要重新下载这些“Tiny”之类的模型的。Whisper 下载下来的是 .pt后缀文件Whisper.cpp 下载下来的是 .bin后缀文件这些文件在不同系统中OS、Win、Linux中应该是通用的。未经测试点击“查看文件位置”能看到下载下来的模型所在路径。我的路径在C:\Users\用户名\AppData\Local\Buzz\Buzz\Cache\models\whisper想要迁移的话可以用管理员权限打开cmd使用 mklink命令move C:\Users\用户名\AppData\Local\Buzz\Buzz D:\BuzzCacheIncludeModels mklink C:\Users\用户名\AppData\Local\Buzz\Buzz D:\BuzzCacheIncludeModels使用这种创建“快捷方式”的方法不用修改系统别的设置。下载好模型后就可以在“文件”选项中选择要内容进行识别了。“文件”选项如果选择的是“导入文件”则会显示如下画面TXT、SRT和VTT是输出的文件格式如果只勾了一项完成识别以后还有“导出”选项可以转为别的文件格式。逐词识别本来是一句一句识别的勾选该选项准确性会提高但速度会下降。提取语音如果是音频文件不用勾如果是视频文件则要勾上。内存问题在我的实操中20多M的音频文件是可以识别成功的。但20多M的视频文件勾上“提取声音”选项就会失败了。大概率是内存问题。如果遇到同样情况可以先把文件转成音频文件再进行识别。200M的音频文件会因内存原因失败。别的文件大小就不知道了。

Live Avatar数字人效果展示：真人级口型同步与表情生成案例

Live Avatar数字人效果展示：真人级口型同步与表情生成案例 1. 一张照片一段录音，就能生成会说话的“数字分身” 想象一下，你只需要一张普通的正面照片，加上一段自己说话的录音，就能生成一个表情自然、口型精准、动作…...

2026/5/25 7:09:52 阅读更多 →

如何使用PptxGenJS在JavaScript中快速生成专业PowerPoint演示文稿

如何使用PptxGenJS在JavaScript中快速生成专业PowerPoint演示文稿【免费下载链接】PptxGenJS Build PowerPoint presentations with JavaScript. Works with Node, React, web browsers, and more. 项目地址: https://gitcode.com/gh_mirrors/pp/PptxGenJS 如果你正在寻…...

2026/5/25 7:11:42 阅读更多 →

芯片热到冒烟？AI算力爆发下的液冷散热技术全解析 | 工程师必读

🎓作者简介：科技自媒体优质创作者 🌐个人主页：莱歌数字-CSDN博客 💌公众号：莱歌数字（B站同名） 📱个人微信：yanshanYH 211、985硕士，从业16年从…...

2026/5/25 7:58:31 阅读更多 →

【AI问数】多智能体协同架构：行业首创的AI问数大脑

鲲溟智能 AI智能问数系列第15篇 | 2026-07-12 10 大智能体 Multi-Agent 协同架构端到端自动化 99.97% 可用性鲲溟智能首创10大智能体协同架构，是AI问数的大脑。每个Agent专精一个领域，通过Orchestrator智能编排，实现复杂任务的端到…...

2026/7/22 19:10:55 阅读更多 →

Kimi LeetCode 3621. 位计数深度为 K 的整数数目 I Python3实现

LeetCode 3621. 位计数深度为 K 的整数数目 I Python3 实现python from functools import lru_cacheclass Solution:def popcountDepth(self, n: int, k: int) -> int:# k0：只有 1 的深度为 0if k 0:return 1 if n > 1 else 0# 预处理 1~60 的 popcount-dept…...

2026/7/22 8:01:32 阅读更多 →

向量检索加速：ANN 索引选型和查询参数调优实战

向量检索加速：ANN 索引选型和查询参数调优实战基础设施不需要漂亮话。一个 100 万向量的知识库从"勉强能用"到"丝滑检索"，差距不在算法，在工程参数的调优。一、两个向量检索系统，性能差 20 倍团队内两套知…...

2026/7/22 8:01:25 阅读更多 →

鸿蒙 ArkTS 实战：Menu Nutrition Advice 从智能助手到保存闭环完整解析

鸿蒙 ArkTS 实战：Menu Nutrition Advice 从智能助手到保存闭环完整解析前言 Menu Nutrition Advice 是一个面向菜单营养建议的鸿蒙 ArkTS 单页工具。它把主题输入、数量统计、辅助开关、备注和保存状态组织到一个移动端工作台中。项目服务于根据餐单生成营养…...

2026/7/22 8:01:58 阅读更多 →