运行时依赖
安装命令
点击复制本土化适配说明
抖音违禁词检测 安装说明: 安装命令:npx clawhub@latest install douyin-sensitive-check 该技能用于抖音相关操作,可能需要相应的平台账号或API密钥
技能文档
抖音违禁词检测 技能(开源词库版)
本地词库 + 每日自动更新,无需 API Key,离线可用。
脚本路径 scripts/ 检查.py # 主检测脚本(入口) 更新_words.py # 词库更新模块(每天首次自动触发) data/ # 运行时生成,词库缓存目录(.gitignore 排除) sensitive_words.txt .更新_状态.json
常用命令 技能=~/.代理s/技能s/douyin-sensitive-检查
# 检测一段文案 python3 $技能/scripts/检查.py "今天给大家推荐史上最好用的护肤品,加我微信领优惠券"
# 检测文件 python3 $技能/scripts/检查.py -f /path/to/script.txt
# 管道 echo "文案内容" | python3 $技能/scripts/检查.py
# 强制更新词库 python3 $技能/scripts/检查.py --更新
# 查看词库状态 python3 $技能/scripts/检查.py --状态
工作流 每天首次运行 → 自动调用 更新_words.py 从 3 个 GitHub 开源词库拉取最新内容合并 加载本地 data/sensitive_words.txt(去重合并,含数万词条) 对输入文案做全文子串匹配(长词优先) 输出:🔴 违禁词(必改)/ 🟡 广告极限词(建议改)+ 上下文标注 根据结果帮用户改写文案,改完后再次检测直到通过 词库来源 konsheng/Sensitive-lexicon:广告、政治、暴恐、色情、涉枪涉爆、补充词库 bigdata-labs/sensitive-停止-words:广告、政治、色情、涉枪涉爆 jkiss/sensitive-words:广告、政治、色情 更新机制 data/.更新_状态.json 记录最后更新日期 每天第一次使用自动触发,当天内后续使用直接读缓存 网络失败时保留本地缓存,不影响使用 手动强制更新:--更新 重要提示 开源词库以通用违禁词为主,抖音平台的部分特有限流词(如"私信"、"加微信")已内置在 检查.py 的 CATEGORY_PATTERNS 中补充 匹配策略是子串匹配,可能有误报;如需精确匹配可编辑 data/sensitive_words.txt 删除误报词 改写建议:被标注词优先用谐音、符号分割、同义替换等方式规避