SenseNova-Skills – 商汤科技开源的办公场景AI工具库

125 00

SenseNova-Skills是商汤科技(SenseTime)开源的一套面向高频办公场景的AI技能工具库。

简单来说，如果把大模型(LLM)比作一个聪明的“大脑”，那么SenseNova-Skills就是专门为这个大脑配备的一套“专业手脚”和“工作手册”。它将复杂的办公任务拆解成了标准化的技能模块，让AI能够真正上手干活，而不仅仅是陪聊。

PPT 生成（sn-ppt-entry）：
- 支持标准模式和创意模式。
- 具备完整的工作流：从生成大纲、逐页制作 HTML、视觉语言模型（VLM）自动评审（不合格自动重写），到最后导出为可编辑的 PPTX 文件。
数据分析（sn-da-excel-workflow）：
- 能够处理多表读取、海量数据（超过1万行自动触发 Parquet 优化）。
- 包含专门处理图片表格的 OCR 技能（sn-da-image-caption），实现从数据清洗、聚合到可视化导出的全流程编排。
深度研究（sn-deep-research）：
- 包含规划、取证、综合、成稿、格式发现等 6 个子技能。
- 支持中间产物持久化，即使任务中断也可以断点续传，适合长链路的调研任务。
全网搜索（Search）：
- 聚合了学术、开发者社区（GitHub, Stack Overflow）、中英文社交媒体（知乎、B站、抖音、Twitter、Reddit）等全网资源，提供全方位的资料检索能力。

此外，它还能调用 SenseNova U1 模型，完成包含自动提示词扩写和质检的高密度信息图（Infographics）生成。

开箱即用，生成即交付：
它产出的不是简单的文本建议，而是可以直接使用的“交付物”。例如，生成的 PPT 配色排版完整，打开就能编辑；数据分析能直接给出包含图表和决策建议的报告。
跨平台与高度兼容：
这套 Skills 不挑模型，不仅适配商汤自家的日日新（SenseNova）模型，还可以拖进ChatGPT、Claude Code、OpenClaw、Hermes Agent等主流Agent框架中直接使用。
智能编排，自动化执行：
每个 Skill 都有独立的声明文件（SKILL.md），Agent 会根据用户的指令自动选择、编排和调用对应的技能，无需人工手动指定，实现了真正的“全自动办公”。
开源免费，成本极低：
项目基于MIT协议在GitHub 开源，开发者可以自由魔改。配合商汤推出的Token Plan，个人和中小团队可以零成本上手体验。

自动化商业报告与 PPT 制作：
例如，输入“城市新能源汽车充电基础设施布局方案”，它能自动生成包含行业背景、选址模型、投资测算等内容的 20 多页完整 PPT。
海量销售数据分析与决策：
面对几十万行的企业销售流水，它能自动进行数据审计、多维探寻，并输出包含可视化图表和具体优化建议的决策支持报告。
垂直行业深度调研：
例如制作一份“具身智能行业调研报告”，它能自主定义核心判断、检索对比国内外主流厂商（如 Tesla、Unitree）的数据、抗噪提取关键逻辑，并自动生成产业链结构图和饼图。
适老化/特定人群服务指南：
能够快速产出如“医院就诊全流程指引”等 PPT，不仅生成清晰的流程文字，还能针对每个环节自动匹配高度一致的视觉插画，降低特定人群的理解门槛。