知识图谱(Knowledge Graph,简称 KG)是一种结构化的语义知识库。
简单来说,它不是像传统数据库那样把数据存在表格(行和列)里,而是把数据组织成一张巨大的“网”。在这张网中,实体(如人、地点、事物)是节点,关系(如“位于”、“主演”、“发明”)是连接节点的边。
它的核心逻辑可以用一个三元组来表示:
(头实体,关系,尾实体)
例如:(姚明,出生于,上海)或(北京,是首都,中国)
1. 核心构成要素
知识图谱主要由以下三个部分组成:
- 实体(Entity):现实世界中的对象,如“爱因斯坦”、“相对论”、“普林斯顿大学”。
- 关系(Relation):实体之间的连接方式,如“提出”、“就读于”、“位于”。
- 属性(Attribute):实体的具体特征,如爱因斯坦的“出生日期”是“1879年3月14日”。
通过这些要素,知识图谱将碎片化的信息连接成一个有逻辑的网络,让计算机不仅能“存储”数据,还能“理解”数据之间的关联。
2. 知识图谱 vs. 传统数据库
表格
| 特性 | 传统关系型数据库 (RDBMS) | 知识图谱 (Knowledge Graph) |
|---|---|---|
| 数据结构 | 二维表(行/列),结构固定 | 图结构(节点/边),灵活多变 |
| 查询重点 | 精确匹配,统计汇总 | 关联挖掘,路径发现,推理 |
| 扩展性 | 增加新字段需修改表结构 | 随时添加新节点和新关系,无需重构 |
| 擅长场景 | 交易记录、库存管理 | 社交网络、推荐系统、复杂问答 |
| 比喻 | 像Excel表格,整齐但死板 | 像思维导图或人际网络,灵活且互联 |
3. 主要应用场景
知识图谱是人工智能从“感知智能”(看、听)走向“认知智能”(理解、推理)的关键技术:
- 智能搜索与问答(如谷歌搜索)
- 当你搜索“马斯克的老婆”时,搜索引擎不是返回一堆包含这几个字的网页,而是直接从知识图谱中提取答案:“格蕾姆斯”或“娜塔莎·巴塞特”(取决于时间点),并在右侧直接显示卡片。这是因为图谱里存了
(马斯克, 配偶, 某某)的关系。
- 当你搜索“马斯克的老婆”时,搜索引擎不是返回一堆包含这几个字的网页,而是直接从知识图谱中提取答案:“格蕾姆斯”或“娜塔莎·巴塞特”(取决于时间点),并在右侧直接显示卡片。这是因为图谱里存了
- 推荐系统
- 电商或视频平台利用图谱发现深层兴趣。如果你买了“相机”,传统推荐可能推“镜头”;但知识图谱知道“相机”属于“摄影”,而“摄影”关联“三脚架”和“修图软件”,甚至关联到“旅行”,从而给你更跨界的精准推荐。
- 金融风控
- 通过构建企业、个人、电话、地址之间的复杂关系网,快速识别欺诈团伙。例如,发现多个看似无关的贷款申请人共用同一个紧急联系人或设备ID,从而预警风险。
- 医疗诊断辅助
- 将症状、疾病、药物、基因等建立关联。医生输入症状,系统通过图谱推理出可能的疾病及禁忌药物,辅助决策。
- 大语言模型(LLM)的增强(RAG)
- 大模型容易产生“幻觉”(胡说八道)。将知识图谱与大模型结合,可以让模型在回答事实性问题时,先查询图谱中的确切关系,提高回答的准确性和可解释性。
4. 知识图谱与向量嵌入的关系
你刚才问的向量嵌入和知识图谱经常一起使用,它们互补性很强:
- 知识图谱:擅长处理精确的逻辑关系和事实推理(比如 A 是 B 的父亲,B 是 C 的父亲,所以 A 是 C 的爷爷)。它是“白盒”,逻辑清晰。
- 向量嵌入:擅长处理模糊的语义相似性(比如“开心”和“快乐”很像)。它是“黑盒”,靠距离判断。
趋势:现在的先进系统(如 Graph RAG)会将知识图谱的结构信息也转化为向量,或者用大模型来构建知识图谱,结合两者的优势:既有逻辑推理能力,又有语义泛化能力。
5. 著名的知识图谱
- Google Knowledge Graph:谷歌在2012年推出,极大地改变了搜索体验。
- 维基百科(Wikidata):全球最大的开源知识图谱之一。
- 行业图谱:各大公司建立的金融图谱、医疗图谱、法律图谱等。

© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



