视频链接处理 + 提取字幕

张

张建站

2026/5/22 13:13:27

10分钟阅读

视频链接处理提取字幕背景有一些需要处理的视频想把他们的字幕提取出来得到完整的内容进行参考。技术数据处理说明Excel视频链接 - 下载先提取字幕不行则下载音频 - 转写使用Whisper-音频转文字模型得到内容核心组件yt-dlp—— 万能视频下载器是 youtube-dl 的活跃 fork支持 1700 站点B站、抖音、小红书、油管…命令行原理访问页面 → 解析平台特定的 JSON 接口 → 拿到真实媒体 URL → 下载关键参数–write-subs / --write-auto-subs抓平台已有的字幕最省事-x --audio-format mp3只要音频不要视频更小更快–cookies-from-browser chrome带浏览器登录态绕过登录墙–sleep-requests / --sleep-interval降低请求频率反风控FFmpeg —— 多媒体瑞士军刀yt-dlp 底层依赖它做转码、抽音轨视频→音频抽取、格式转换都是它干的Whisper / faster-whisper —— OpenAI 开源的 ASR 模型ASR Automatic Speech Recognition自动语音识别原理简化版Encoder-Decoder Transformer音频 → 切成 30 秒片段 → 转 mel-spectrogram(频谱图) → Encoder 编码Decoder 像写作文一样逐词预测下一个 token输出文字时间戳faster-whisper 用 CTranslate2 做推理优化比官方版快 4 倍、显存少模型尺寸tiny / base / small / medium / large-v3越大越准但越慢中文场景一般用 base够用或 medium更准SRT 字幕格式就是这种东西00:00:01,200 -- 00:00:03,500 你好世界序号时间戳文字。要变纯文本只需正则去掉前两行再合并即可。注意点仅供学习交流使用。优先官方字幕优先质量高不出错注意串行处理或者有多个账号来回切换防止被封控有些视频网站需要登陆如某站、某书–cookies-from-browser 直接复用浏览器里的 Cookie使用Whisper处理时由于是跑模型GPU/CPU密集型串行即可。

终极指南：3步掌握Layerdivider，让单图变分层PSD效率提升300%

终极指南：3步掌握Layerdivider，让单图变分层PSD效率提升300% 【免费下载链接】layerdivider A tool to divide a single illustration into a layered structure. 项目地址: https://gitcode.com/gh_mirrors/la/layerdivider 你是否曾面对一张精美…...

2026/5/22 13:10:25 阅读更多 →

FineReport网络报表bug

做帆软报表需要父表弹窗网络报表到子表时,需要注意一个bug 这么久了就遇到了这一次,还没办法百分百复现出来.... 父报表需要通过点击某个单元格,进行详情信息弹窗,所以我做了网络报表因为不止一列数据需要这个功能,但是他们最终的详情字段都是一致的并且来自同一张表所以我…...

2026/5/22 13:10:05 阅读更多 →

MySQL主从复制与高可用架构

摘要：主从复制是 MySQL 实现读写分离和数据冗余的基础，高可用架构则是保障业务连续性的关键。本文从 Binlog 的三种格式讲起，深入解析主从复制的核心原理与三种复制模式（异步/半同步/组复制），对比 MHA、MGR…...

2026/5/22 13:10:04 阅读更多 →

CircuitPython嵌入式开发实战：从传感器采集到数据存储的完整方案

1. 项目概述与核心价值如果你刚开始接触嵌入式开发，面对琳琅满目的传感器、通信协议和存储需求，可能会感到无从下手。今天，我想分享一个基于CircuitPython的综合性实践项目，它串联了从模拟信号采集、数字通信到数据存储的多个核心…...

2026/5/21 12:13:15 阅读更多 →

3PEAK思瑞浦 TPA2644-TS2R TSSOP14 运算放大器

特性供电电压:3V至36V 偏移电压:2mV(最大值) 差分输入电压范围至电源轨，可作为比较器工作带宽:1.5MHz，斜率:0.5V/us 输入轨至-Vs，无内部ESD二极管至Vs 低1/f噪声:在10Hz时为50nV/Hz 高PSRR:100kHz时60dB 开关电源时无显著输出抖动工作温度…...

2026/5/21 21:54:05 阅读更多 →

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率【免费下载链接】Wu.CommTool 基于C#、WPF、Prism、MaterialDesign、HandyControl开发的通讯调试工具。支持Modbus Rtu调试、Mqtt调试、TCP调试、串口调试、UDP调试项目地址: https://gitcode.com/gh_mirrors/wu/W…...

2026/5/21 5:13:18 阅读更多 →