📦 Video Insight — 视频字幕提取

v1.0.0

跨平台视频字幕提取工具,支持 YouTube 和 Bilibili 视频的转录及可选 AI 摘要。GPU 自动检测,默认仅提取字幕,可选启用 LLM 摘要。输出结构化 JSON。适用于 macOS、Linux、WSL、Windows VM。

0· 32·0 当前·0 累计
huuuwnnn-droid 头像by @huuuwnnn-droid·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/15
0
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
可疑
medium confidence
该技能基本实现其声称的功能(下载/转录 YouTube 和 Bilibili 并可选调用 LLM),但它访问了元数据中未声明的环境变量和本地资源,并且存在一些可能暴露敏感数据的行为(永久本地缓存、可选外部 LLM 调用、yt-dlp cookie 回退),如果用户不注意可能会造成风险。
评估建议
安装前需考虑的事项: - 隐私:字幕永久缓存在 ~/.cache/video-insight 中。如果字幕可能包含敏感内容,请清除或移动缓存,并检查 Cache.put/get 行为。 - 外部 LLM:摘要是可选功能,但如果您设置了 LLM_API_URL + LLM_API_KEY(或 OPENCLAW_GATEWAY_TOKEN),该工具会将整个字幕 POST 到该端点(不截断)。仅为您信任且有适当隐私政策的端点设置这些环境变量。 - 浏览器 cookie:下载失败时工具会使用 yt-dlp --cookies-from-browser chrome 重试。这会导致 yt-dlp 访问您的浏览器 cookie 存储(可能暴露已验证内容)。如果您不想访问本地浏览器 cookie,请避免允许该回退或在隔离环境中运行。 - 安装:setup.sh 从 PyPI 安装 Python 包,可能会修改您的 Python 环境或创建 venv。运行前请检查脚本;建议在隔离的虚拟环境或容器中安装。 - 如果需要更高保障:请求发布者/来源,验证包签名或哈希,或在隔离的 VM/容器中运行该工具。如果...
详细分析 ▾
用途与能力
代码和设置与声明的用途一致:yt-dlp、faster-whisper 用于下载、音频提取和转录,CLI 封装了 YouTube/Bilibili 处理。然而,代码还调用了 yt-dlp 的 --cookies-from-browser 回退(通过 yt-dlp 读取浏览器 cookie),并支持将完整字幕发送到任意 LLM 端点——这些行为未在顶层元数据中声明,可能会让用户感到意外。
指令范围
SKILL.md 说默认仅转录,但运行时指令和代码:(1) 永久缓存完整字幕到 ~/.cache/video-insight,(2) 可能提取关键帧,(3) 下载失败时尝试 yt-dlp --cookies-from-browser(读取本地浏览器 cookie),以及 (4) 当使用 --summarize 时,如果设置了 LLM 环境变量,会将整个字幕(不截断)发布到外部 LLM API。这些是范围扩展操作(读取浏览器 cookie、持久本地存储、大型字幕网络传输),未在元数据中声明为必需。
安装机制
注册表中没有安装规范(仅指令),但提供的 setup.sh 将 Python 依赖(yt-dlp、youtube-transcript-api、innertube、requests、faster-whisper)安装到 venv 或系统 Python 中。对于此类工具来说这是正常方法;安装使用 PyPI(标准)。安装程序中没有远程任意二进制下载或可疑 URL。
凭证需求
注册表声明没有必需的环境变量,但代码读取许多环境变量:WHISPER_DEVICE、WHISPER_MODEL、FRAME_TIME_OFFSET、FRAME_INTERVAL、MAX_FRAMES、LLM_API_URL、LLM_API_KEY、LLM_MODEL、OPENCLAW_GATEWAY_TOKEN 等。特别地,如果设置了 LLM_API_URL + LLM_API_KEY(或 OPENCLAW_GATEWAY_TOKEN),该技能会将完整字幕发送到该外部端点——这是一个高敏感性操作,应该被声明并明确同意。字幕的缓存存储默认是永久的(也未被列为必需的配置项)。
持久化与权限
always:false 且该技能不修改其他技能。然而它会将永久缓存的字幕文件写入 ~/.cache/video-insight,并在 setup.sh 期间创建 venv 和缓存目录。临时文件被管理和清理,但缓存故意设为永久性,除非手动删除。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/15

v1.0.0

可疑

安装命令

点击复制
官方npx clawhub@latest install video-insight
镜像加速npx clawhub@latest install video-insight --registry https://cn.longxiaskill.com

技能文档

跨平台视频字幕提取和可选 AI 摘要工具,支持 YouTube 和 Bilibili。

描述

从 YouTube 和 Bilibili 视频中提取字幕、元数据和可选的关键帧。输出结构化 JSON 到 stdout。默认情况下,不执行 LLM 摘要——代理接收完整字幕并使用其自己的 LLM 上下文窗口进行摘要。支持:macOS、Linux、WSL、Windows VM。

用法

# 单个视频 — 仅字幕(默认,推荐)
video-insight --url "https://www.youtube.com/watch?v=VIDEO_ID"

# Bilibili 视频 video-insight --url "https://www.bilibili.com/video/BV1xxxxx"

# 带 LLM 摘要(可选) video-insight --url "https://..." --summarize

# 频道扫描(最近视频) video-insight --channel "UC_x5XG1OV2P6uZZ5FSM9Ttw" --hours 24

# 安静模式(无 stderr 进度) video-insight --url "https://..." --quiet

# 强制刷新(忽略缓存) video-insight --url "https://..." --no-cache

# 同时提取关键帧 video-insight --url "https://..." --frames

触发词

总结视频、提取字幕、YouTube 摘要、Bilibili 字幕、视频字幕、视频摘要、视频总结、B站视频、YouTube视频

输出模式

{
  "ok": true,
  "data": {
    "video_id": "dQw4w9WgXcQ",
    "platform": "youtube",
    "title": "Video Title",
    "channel": "Channel Name",
    "duration_seconds": 212,
    "transcript": "Full transcript text without truncation...",
    "transcript_with_timestamps": "[0.0-3.2] First segment\n[3.2-6.5] Second...",
    "frames": [{"file": "/tmp/.../frame_001.jpg", "time_sec": 30}],
    "cached": false
  },
  "error": null
}

缓存

字幕永久缓存在 ~/.cache/video-insight/{platform}_{video_id}.json。JSON 格式将元数据和字幕存储在一起,以获得更丰富的缓存命中(标题、频道、时长、时间戳)。使用 --no-cache 强制重新获取。

代理集成指南

  • 默认工作流:调用 video-insight --url ,接收包含完整字幕的 JSON。使用您自己的 LLM 上下文进行摘要——您有 128K+ token,不需要脚本截断。
  • 对于关键帧:添加 --frames 标志。仅在用户明确要求视觉/图像审查时才需要。
  • 长视频(2小时+):字幕可能非常大。使用 map-reduce 或分块摘要。
  • Bilibili 视频需要 ffmpegfaster-whisper(通过 setup.sh 安装)。YouTube 视频通常有字幕,速度更快。
  • Cron/无头模式:为自动化管道使用 --summarize --quiet

设置

cd ~/.openclaw/skills/video-insight && bash setup.sh

依赖

必需yt-dlpyoutube-transcript-apiinnertubeffmpeg(系统) 可选faster-whisper(用于 Bilibili/无字幕视频)、requests(用于 --summarize)

数据来源ClawHub ↗ · 中文优化:龙虾技能库