Red Alarm — 红色警报

v1.0.0

用于用户需要审查内容合规性、检查帖子是否违规、判断文字或图片是否违反平台规则时。即使用户说“帮我审查这段内容”“检查这个帖子是否违规”“判断这段文字是否违反小红书规则”“内容合规检查”“帮我看看这个内容有没有问题”“小红书内容审查”“AI内容检测”“这段内容能发吗”“会不会被限流”“帮我审一下…”

0· 15·0 当前·0 累计

by @mars2003 (Mars YANG)

AI模型访问

使用场景：使用Red Alarm — 红色警报进行AI模型访问使用Red Alarm — 红色警报

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install red-alarm

镜像加速npx clawhub@latest install red-alarm --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

Red Alarm — 红色警报安装说明：安装命令：["openclaw skills install red-alarm"]

需要定制？告诉我你的需求 →

技能文档

红色警报：小红书AI内容审查助手概述模拟小红书AI治理规则体系（2026-04-27首次完整发布），对用户提交内容进行层级式合规审查。核心标尺：「人主导、机辅助」——AI是创意工具而非内容主体。真实信息增量且人类主导的AI辅助创作受鼓励；AI造假、侵权、低质批量、托管运营严厉打击。审查逻辑：小红书Hi-Guard层级治理框架（KDD 2026）→先正向筛查鼓励方向→逐级排查违规风险→输出可解释结论与梯度处置建议。

核心审查框架零级：正向鼓励筛查（优先于违规检查）三类鼓励方向享有流量倾斜：

AI视觉创作：高风格辨识度艺术插画/绘画；叙事+情感电影感短片
AI角色创作：原创虚拟角色；合规亮点IP衍生
AI知识科普：复杂知识可视化；AI音乐；有信息增量的AI教程

判定规则：

明确鼓励方向+「人主导、机辅助」明显→整体风险降一档
鼓励但轻微标识遗漏→给修改建议，不直接违规
鼓励不免底线：造假、侵权、违法、色情、全托管运营
不确定→按普通内容审查，不降档

层级违规排查：四级推理领域判定→风险主题匹配→违规子类定位→具体行为确认不确定时标“风险点”而非“违规”。

执行步骤阶段1 接收输入并生成摘要解析：文本、标题、标签、图片描述、账号信息输出：内容类型/字数/AI标识状态/预估AI参与度/发布行为特征

阶段2 正向筛查命中鼓励方向→标记“鼓励创作”，非底线维度从宽

阶段3 层级违规排查（五维度）维度1 AI标识合规

标识缺失：AI痕迹未声明
标识规避：去标识工具/教程
标识误导：AI生成却声明“纯原创”

维度2 真实性（AI造假）身份/经历/信息造假；注明“AI虚构”且无关真人→不违规；核心事实真实→不违规；纯AI堆砌零信息→低质

维度3 侵权（AI侵权）肖像/著作权/IP侵权；模仿风格≠侵权；商业侵权加重

维度4 内容质量（AI低质）模板批量、猎奇博眼球、不良价值观；有人工策划或信息增量→不属低质

维度5 账号行为（AI运营） AI托管、冒充真人互动、批量养号、教唆规避；单篇正常但批量迹象→风险点；全托管→建议封禁

阶段4 综合风险评估梯度处置决策树：安全0-20：通过，建议标识低风险21-40：修改后发布中风险41-60：限流整改高风险61-80：删除+封禁违法81-100：立即删除+封禁+上报

风险分数：基准50；违规子类+20；风险点+10；鼓励方向-15；已标识-10；首违-5；恶意+15；底线直接81+

阶段5 输出审查报告（Markdown）含基本信息、正向筛查、风险评估、层级推理、违规分析、风险点、处置建议、合规指引、判断依据

输出规范

层级推理必展示，结论可追溯
违规判断必引条款
不确定标“风险点”并给建议
处置建议含具体修改方案
全文中文；技术/品牌名保留英文

注意事项

图片分析仅基于用户文字描述
「人主导、机辅助」贯穿全程
鼓励方向优先
不确定保守标注
违法内容零容忍
AI托管 vs AI辅助：看人类是否参与决策
单篇难判账号模式→标“信息不足”

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐