知识图谱是什么

知识图谱(Knowledge Graph,简称 KG)是一种结构化的语义知识库

简单来说,它不是像传统数据库那样把数据存在表格(行和列)里,而是把数据组织成一张巨大的“网”。在这张网中,实体(如人、地点、事物)是节点,关系(如“位于”、“主演”、“发明”)是连接节点的边。

它的核心逻辑可以用一个三元组来表示:

(头实体,关系,尾实体)
例如:(姚明,出生于,上海) 或 (北京,是首都,中国)

1. 核心构成要素

知识图谱主要由以下三个部分组成:
  • 实体(Entity):现实世界中的对象,如“爱因斯坦”、“相对论”、“普林斯顿大学”。
  • 关系(Relation):实体之间的连接方式,如“提出”、“就读于”、“位于”。
  • 属性(Attribute):实体的具体特征,如爱因斯坦的“出生日期”是“1879年3月14日”。

通过这些要素,知识图谱将碎片化的信息连接成一个有逻辑的网络,让计算机不仅能“存储”数据,还能“理解”数据之间的关联。

2. 知识图谱 vs. 传统数据库

表格

特性传统关系型数据库 (RDBMS)知识图谱 (Knowledge Graph)
数据结构二维表(行/列),结构固定图结构(节点/边),灵活多变
查询重点精确匹配,统计汇总关联挖掘,路径发现,推理
扩展性增加新字段需修改表结构随时添加新节点和新关系,无需重构
擅长场景交易记录、库存管理社交网络、推荐系统、复杂问答
比喻Excel表格,整齐但死板思维导图人际网络,灵活且互联

3. 主要应用场景

知识图谱是人工智能从“感知智能”(看、听)走向“认知智能”(理解、推理)的关键技术:
  • 智能搜索与问答(如谷歌搜索)
    • 当你搜索“马斯克的老婆”时,搜索引擎不是返回一堆包含这几个字的网页,而是直接从知识图谱中提取答案:“格蕾姆斯”或“娜塔莎·巴塞特”(取决于时间点),并在右侧直接显示卡片。这是因为图谱里存了 (马斯克, 配偶, 某某) 的关系。
  • 推荐系统
    • 电商或视频平台利用图谱发现深层兴趣。如果你买了“相机”,传统推荐可能推“镜头”;但知识图谱知道“相机”属于“摄影”,而“摄影”关联“三脚架”和“修图软件”,甚至关联到“旅行”,从而给你更跨界的精准推荐。
  • 金融风控
    • 通过构建企业、个人、电话、地址之间的复杂关系网,快速识别欺诈团伙。例如,发现多个看似无关的贷款申请人共用同一个紧急联系人或设备ID,从而预警风险。
  • 医疗诊断辅助
    • 将症状、疾病、药物、基因等建立关联。医生输入症状,系统通过图谱推理出可能的疾病及禁忌药物,辅助决策。
  • 大语言模型(LLM)的增强(RAG)
    • 大模型容易产生“幻觉”(胡说八道)。将知识图谱与大模型结合,可以让模型在回答事实性问题时,先查询图谱中的确切关系,提高回答的准确性和可解释性。

4. 知识图谱与向量嵌入的关系

你刚才问的向量嵌入知识图谱经常一起使用,它们互补性很强:
  • 知识图谱:擅长处理精确的逻辑关系事实推理(比如 A 是 B 的父亲,B 是 C 的父亲,所以 A 是 C 的爷爷)。它是“白盒”,逻辑清晰。
  • 向量嵌入:擅长处理模糊的语义相似性(比如“开心”和“快乐”很像)。它是“黑盒”,靠距离判断。

趋势:现在的先进系统(如 Graph RAG)会将知识图谱的结构信息也转化为向量,或者用大模型来构建知识图谱,结合两者的优势:既有逻辑推理能力,又有语义泛化能力。

5. 著名的知识图谱

  • Google Knowledge Graph:谷歌在2012年推出,极大地改变了搜索体验。
  • 维基百科(Wikidata):全球最大的开源知识图谱之一。
  • 行业图谱:各大公司建立的金融图谱、医疗图谱、法律图谱等。
知识图谱是什么
© 版权声明

相关文章

暂无评论

none
暂无评论...