文明旁观者的头像

文明旁观者

帅气的我简直无法用语言描述!
SenseNova-Skills – 商汤科技开源的办公场景AI工具库

SenseNova-Skills – 商汤科技开源的办公场景AI工具库

SenseNova-Skills是商汤科技(SenseTime)开源的一套面向高频办公场景的AI技能工具库。 简单来说,如果把大模型(LLM)比作一个聪明的“大脑”,那么SenseNova-Skill...
文明旁观者的头像1个月前
0680
LLM Council – Karpathy推出的开源多模型协作框架

LLM Council – Karpathy推出的开源多模型协作框架

LLM Council 是由Andrej Karpathy推出的开源多模型协作框架,核心是让多个大模型像 “委员会” 一样并行回答→互相评审→最终合议,输出比单模型更可靠、更低幻觉的答案。 LLM C...
文明旁观者的头像1个月前
0540
陪读蛙 – 一款开源的AI驱动浏览器翻译扩展

陪读蛙 – 一款开源的AI驱动浏览器翻译扩展

陪读蛙(Read Frog)是一款开源的AI驱动浏览器翻译扩展,核心定位是通过沉浸式双语对照与深度语言解析,帮助用户高效阅读外文内容并提升语言能力。 陪读蛙并非简单翻译工具,而是结合AI技术提供语法分...
文明旁观者的头像1个月前
0500
GPT3参数量

GPT3参数量

GPT-3的最大版本(通常称为“davinci”)参数量为1750亿,这是其最广泛使用的标准配置。 GPT-3核心参数规模 1. 多版本配置 GPT-3实际包含8种不同规模的变体,参数量从最小的1.2...
文明旁观者的头像1个月前
0770
AI人脸识别原理

AI人脸识别原理

人脸识别技术的核心原理是通过深度学习模型将人脸图像转化为高维特征向量,并通过数学比对判断身份。 其本质并非直接比对人脸照片,而是将面部关键特征(如眼距、鼻梁轮廓等)转化为唯一的数字编码,再通过计算特征...
文明旁观者的头像1个月前
0860
GLM-5.1-highspeed – 智谱推出的旗舰级大模型高速版API

GLM-5.1-highspeed – 智谱推出的旗舰级大模型高速版API

GLM-5.1-highspeed是智谱(Zhipu AI)于2026年5月22日推出的旗舰级大模型高速版API,其输出速度达到400 tokens/s,刷新全球大模型厂商API的速度上限,并首次在国...
文明旁观者的头像1个月前
0530
Confucius4 – 网易有道推出的“子曰”大模型4.0版本

Confucius4 – 网易有道推出的“子曰”大模型4.0版本

Confucius4是网易有道推出的“子曰”大模型4.0版本,核心为面向教育场景的27B参数多模态模型与支持14种语言的零样本语音合成(TTS)模型,已于2026年5月22日面向全球全量开源。其技术亮...
文明旁观者的头像1个月前
0670
autoresearch – Andrej Karpathy开源的AI自主研究框架

autoresearch – Andrej Karpathy开源的AI自主研究框架

autoresearch是Andrej Karpathy开源的AI自主研究框架,核心目标是让AI智能体完全替代人类执行模型训练实验的循环优化过程。其设计极为精简,通过固定5分钟实验时长、单一评估指标...
文明旁观者的头像1个月前
01060
LongCat-Video-Avatar 1.5 – 美团开源的虚拟人视频生成模型

LongCat-Video-Avatar 1.5 – 美团开源的虚拟人视频生成模型

LongCat-Video-Avatar 1.5是美团龙猫团队开源的商用级虚拟人视频生成模型升级版本,在动作拟真度、长视频稳定性与身份一致性三大核心维度实现突破性升级,首次在多项关键指标上全面超越主流...
文明旁观者的头像1个月前
0650
Stable Audio3 – Stability AI正式发布的音频生成模型系列

Stable Audio3 – Stability AI正式发布的音频生成模型系列

Stable Audio3.0是Stability AI正式发布的音频生成模型系列,最大突破是将专业级音乐生成时长提升至 6 分 20 秒,首次实现AI生成结构完整、旋律连贯的歌曲级内容,标志着 AI...
文明旁观者的头像1个月前
0730