SenseNova-Skills是商汤科技(SenseTime)开源的一套面向高频办公场景的AI技能工具库。
简单来说,如果把大模型(LLM)比作一个聪明的“大脑”,那么SenseNova-Skills就是专门为这个大脑配备的一套“专业手脚”和“工作手册”。它将复杂的办公任务拆解成了标准化的技能模块,让AI能够真正上手干活,而不仅仅是陪聊。

SenseNova-Skills核心功能
- PPT 生成(sn-ppt-entry):
- 支持标准模式和创意模式。
- 具备完整的工作流:从生成大纲、逐页制作 HTML、视觉语言模型(VLM)自动评审(不合格自动重写),到最后导出为可编辑的 PPTX 文件。
- 数据分析(sn-da-excel-workflow):
- 能够处理多表读取、海量数据(超过1万行自动触发 Parquet 优化)。
- 包含专门处理图片表格的 OCR 技能(sn-da-image-caption),实现从数据清洗、聚合到可视化导出的全流程编排。
- 深度研究(sn-deep-research):
- 包含规划、取证、综合、成稿、格式发现等 6 个子技能。
- 支持中间产物持久化,即使任务中断也可以断点续传,适合长链路的调研任务。
- 全网搜索(Search):
- 聚合了学术、开发者社区(GitHub, Stack Overflow)、中英文社交媒体(知乎、B站、抖音、Twitter、Reddit)等全网资源,提供全方位的资料检索能力。
此外,它还能调用 SenseNova U1 模型,完成包含自动提示词扩写和质检的高密度信息图(Infographics)生成。
SenseNova-Skills核心优势
- 开箱即用,生成即交付:
它产出的不是简单的文本建议,而是可以直接使用的“交付物”。例如,生成的 PPT 配色排版完整,打开就能编辑;数据分析能直接给出包含图表和决策建议的报告。 - 跨平台与高度兼容:
这套 Skills 不挑模型,不仅适配商汤自家的日日新(SenseNova)模型,还可以拖进ChatGPT、Claude Code、OpenClaw、Hermes Agent等主流Agent框架中直接使用。 - 智能编排,自动化执行:
每个 Skill 都有独立的声明文件(SKILL.md),Agent 会根据用户的指令自动选择、编排和调用对应的技能,无需人工手动指定,实现了真正的“全自动办公”。 - 开源免费,成本极低:
项目基于MIT协议在GitHub 开源,开发者可以自由魔改。配合商汤推出的Token Plan,个人和中小团队可以零成本上手体验。
SenseNova-Skills应用场景
- 自动化商业报告与 PPT 制作:
例如,输入“城市新能源汽车充电基础设施布局方案”,它能自动生成包含行业背景、选址模型、投资测算等内容的 20 多页完整 PPT。 - 海量销售数据分析与决策:
面对几十万行的企业销售流水,它能自动进行数据审计、多维探寻,并输出包含可视化图表和具体优化建议的决策支持报告。 - 垂直行业深度调研:
例如制作一份“具身智能行业调研报告”,它能自主定义核心判断、检索对比国内外主流厂商(如 Tesla、Unitree)的数据、抗噪提取关键逻辑,并自动生成产业链结构图和饼图。 - 适老化/特定人群服务指南:
能够快速产出如“医院就诊全流程指引”等 PPT,不仅生成清晰的流程文字,还能针对每个环节自动匹配高度一致的视觉插画,降低特定人群的理解门槛。
SenseNova-Skills的项目地址
GitHub仓库:https://github.com/OpenSenseNova/SenseNova-Skills
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



