从语义网到知识图谱:下一个十年

人工智能
后台-插件-广告管理-内容页头部广告(手机)

1. 简介

四十年前,"语义网"(Semantic Web)的愿景是从今天难以想象的前提条件开始的--它被设想为当时的万维网(WWW)的延伸,并被认为能够使计算机以更像人类的方式理解和处理信息[1]。最初的目的是通过使用结构化的格式来表示信息,并与语义资源描述的链接和共享相结合来实现这一目标:"语义 "一词意在通过符号化的、紧凑的和毫不含糊的形式向机器传达意义,这种形式介于计算性的--当时是离散的数字表示和人类书写的/口头的语言。这种明确表示知识以使其更加 "可由机器处理 "的原始想法可以被解释为一种应对当时有限的计算能力的方式,同时也是一种为大规模符号计算开放知识的方式。

从语义网到知识图谱:下一个十年

在今天的智慧网(WW)中,大规模的机器解释和代理互动已经完成,尽管通过与最初设想的非常不同的手段--包括最近出现的通用语言和知识连续体的演变,不再区分结构化和非结构化表示。值得注意的是,在早期,人们已经对 "符号 "这一概念的连续规模提出了质疑[2],并对过去语义网(SW)中离散的标识符和意义之间的严格区分提出了质疑[3]。

最初的SW愿景的其他痕迹也反映在WW中,包括通过在共享认知空间中的本地化和全球整合之间的流动过渡来实现去中心化,以及以代理为媒介的协作--尽管这些 "代理 "的互动方式不同,而且比设想的要自主得多。新的挑战已经出现--部分扩大了,部分缩小了我们今天看到的人类和人工智能(AI)代理的知识基础和推理及沟通能力之间的差距。

事实上,围绕智慧维护的研究在过去40年里已经有了巨大的发展,以推动和塑造这些发展,并反复转移其重点--最近从知识到智慧,所以我们完全可以称目前的WW社区是过去SW社区的自然演变。本文旨在列出这些发展的时间表,将其分为三个主要时期(参见图1): 第2节涵盖了从最初的SW愿景到知识图谱(KGs)的兴起的早期里程碑;第3节讨论了2020年代的革命性发展,第4节总结了截至2043年的更多近期事件,包括形成今天的智慧网的转变。我们在第5节中以对过去的一些问题作为结束。

从语义网到知识图谱:下一个十年

图 1 智慧网的进化历程

2. 早期里程碑(2001-2021年)

最初的语义网愿景是在2001年的一篇开创性文章中提出的,并将SW设想为WWW的延伸,允许数据在不同的应用、平台和组织之间共享和重用[1]2。它旨在创建一个可以被 "智能代理 "轻松理解和处理的 "数据之网",使它们能够执行诸如搜索信息、完成交易和代表人类做出决定的任务。

在2000年中期,该领域越来越认识到SW的愿景还没有实现,但研究人员认为,强有力的标准的发展将在未来实现大规模、基于代理的调解[9]。尽管标准的发展为结构化数据在网络上的表示、查询和共享奠定了基础,但设想中的SW堆栈的其他部分的标准仍然不完整,或被有限地采用。这包括(i)在概念符号表示(通常被称为描述逻辑,但其表达能力受到计算可操作性的限制)和规则之上的统一逻辑,(ii)保护或签署数据的加密机制,提供证明,并最终(iii)信任,以及(iv)定制的用户界面和应用程序。事后看来,我们可以说,采用率低一方面是由于符号表征的差距,另一方面是由于当时已知推理方法的局限性,与实际的、可操作的智慧相比。

  • 链数据。另一方面,当时的社区已经认识到,需要的第二个缺失部分是数据(和代理)之间的连接;在2010年代早期获得了牵引力,第二波研究正试图通过围绕关联数据[10]这一概念的方法来弥补这一差距,它建立在最初的WWW的想法之上,强调通过共同的、独特的标识符来连接数据的做法,使得高效的数据整合和知识发现成为可能。尽管最初的发展令人印象深刻,但是这个概念在工业和主流网络应用中没有得到广泛的采用。文献中提出的解释包括有问题的数据质量[11]和依赖基于二进制计算机表示的离散、统一标识符的技术限制。这些限制使得在合理的时间范围内对可用的关联数据云进行简单的查询评估变得不可行[12],而且还意味着任何动态表示的数据的查询结果都是不完整的[13]。
  • 知识图谱。 第三次研究浪潮代表着焦点从网络上分散的数据发布转向构建越来越复杂的、大规模的、更加松散的 互联的KGs[14] 。早期的开放性和商业性KG--包括DBpedia[15]、YAGO[16]和Google的KG--通常是从维基百科等大型文本语料库中构建的,而Wikidata[17]则是早期的合作性举措,通过志愿者的贡献,从零开始建立一个大规模的KG。有趣的是,已经内在地融入了协作式知识演化理念的维基数据,已经被吸收到今天的智慧网中,并且主要通过大型通用模型(LGM)的知识反思来演化,这些模型也是基于协作式的互动知识聚合,但不再仅仅局限于大部分人类贡献者。

总的来说,前二十年研究的特点是交替宣布雄心勃勃的愿景,研究取得实质性进展,认识到限制愿景可行性的(通常是非技术性的)因素,并最终在工业中采用、调整和重新发明关键的想法。

3. 2020年代的进步

21世纪的第三个十年,SW研究界取得了快速的进步,其特点是有一些更广泛的发展塑造了该领域的演变。最值得注意的是,尽管信任和可解释性在早期就被认为是人工智能研究中的关键问题[18],但在2020年代中期,大型语言模型(LLMs)的扩散将这个问题从一个学术问题日益转变为一个有争议的、有影响的现实世界问题。与2020年代末的普遍保密倾向相配,这导致了信任的侵蚀,随着LLM在学习抽象概念和表征的能力方面的基本限制变得越来越明显,以及基于强化学习的防护措施在面对对抗性技术时被证明是无效的,信任的侵蚀在加速。这导致人们越来越认识到,围绕透明度、可靠性和信任的问题本质上是难以克服的,从而引发了第二次负责任的人工智能研究浪潮,对SW研究界的发展产生了强烈影响。

  • (深度)神经符号的融合。2010年代末出现的大型KG突出了经典推理机制的可扩展性限制,作为一种替代,促使人们使用亚符号人工智能技术来处理和进化它们。相反,尽管(深度)神经网络在解决专门任务方面取得了早期的成功,但出现了对更复杂知识表示的需求。这样的发展导致了将人工智能两个子领域的技术优势结合起来的想法,以及对建立(深度)神经符号系统(NeSys)的追求--这一愿景被称为 "第三个人工智能的夏天"[19]。在SW社区[20],这反映在人们对将SW和机器学习(ML)组件[21]结合到新的系统中的兴趣增加,该系统结合了符号系统的表示、推理和可解释性特征以及从大量数据中学习的能力。

研究的重点是创造和理解NeSys的特点和最佳设计。用于表示NeSys的模式语言极大地促进了这一努力。在几年内,该领域汇聚了普遍认可的NeSys设计模式,这是人工智能系统工程这一成熟领域的基石。这使得人工智能工程师有可能描述甚至自动生成复杂的NeSys,这也彻底改变了KGs的构造。然而,随着它们变得越来越复杂,NeSys在同一系统架构内无缝整合其组件的各种表示和推理机制方面遇到了挑战--在2020年代末,多语言表示法的出现解决了这个问题: 基于上述NeSys架构设计的定制神经模型和架构可以被部署到神经数字表征和符号知识库之间,并提供了第一个强大的解决方案,不仅可以将近似的规则和约束与神经架构无缝集成,而且还可以环抱来自自我喂养的纯神经语言模型的有害人工制品。

然而,以今天的标准来看,2020年代末的KG系统仍然在独立的传统数字和符号表述上运行,特别是(i)人工制作的符号约束,为神经推理提供安全保障,以及(ii)主要基于平行符号或神经表述的多角化表述范式,这些表述是通过解释具有固定神经架构的模型硬接线。因此,虽然紧凑的符号表述的整合可以提高鲁棒性,以及在多模式对话代理等用例中的可扩展性,但就量子计算硬件的最大NISQ[22]整合而言,基础计算技术仍然受到限制。

  • 知识图谱的构建和进化。 在2020年代中期,快速的进步使得大规模构建和更新特定领域的KG成为可能。在2020年代早期,KG的构建仍然是通过手工制作管道来解决的,这些管道仔细地协调了各种任务[23],而在2020年代后半期,研究重点越来越多地转向直接的多模式KG构建,将深度学习方法与遗传性KG构建技术相结合。这是由多语言表示法实现的,它允许人类行为者与知识构建互动,而不需要明确地以符号方式制定约束。在LLMs兴起的推动下,出现了另一个大型研究流,即把这些模型中包含的知识投射到明确的KGs表示中的方法[24]。这些方法最初是为了从非结构化文本中构建KGs而开发的,后来越来越多地被用于阐释和具体化,以及(交叉)验证LLMs,例如,通过促进模型实例之间的对话和协商共识[25]。在2020年代末,对(深度)学习模型的可靠性的关注也促使了对基于规则和约束的LGM工程技术的研究[26],在这种情况下,KG被证明是有用的,作为内省的画布,极大地提高了LGM的自我反思能力。
  • 多语言表示和推理。 2020年代,面向图形的数据模型、持久性系统和查询语言的种类越来越多,书面语言也发生了变化,以迎合日益多样化的存储和推理需求。这导致了基于上述 "多语言表示法 "概念的架构的激增[27]发展起来,以便在各种存储和查询范式之间以及新兴的公理知识表征之间实现流畅的转换,这些知识表征不再仅仅局限于引导神经计算,也可以作为解释过程的一部分从神经模型中生成。Polyglot表征提供了对异质图模型、存储技术、语义和潜在表征以及查询语言的统一访问,为以图为中心的人工智能应用带来了一个共享的认知环境。这导致了关于如何管理复制问题和动态过渡的大量研究,并导致了RXF[28]的发展,作为促进分散的多角化知识节点之间协调的协议。尽管这使得结构化表示与自然语言的流畅性相一致,以及结合了神经和符号技术的多角推理机制取得了进展,但它也增加了数据和知识的碎片化,并没有最终解决互操作性的挑战。

4. 2030年代和2040年代早期的进步

在2020年代末的全球社会混乱之后,许多研究者将其与通过人工智能对几乎所有经济部门的大规模改造联系起来[29],2030年代初的特点是出现了一种更多的合作文化。在智能增强和创造力提升方面的进展所产生的最初摩擦之后,2030年代早期终于出现了强大的人类-人工智能(HAI)合作。因此,持续协作成为大多数仍然涉及人类的任务的主导模式,使关于知识和推理的性质和作用的基本问题重新变得紧迫。在这些更广泛的发展的推动下,SW研究在智慧网(Wisdom Web)的出现后被极大地重新定义,并推动了向统一的纠缠描述表征、统一的语言和启用个人人工智能伴侣的融合。

  • 智慧网。 在20世纪30年代出现的智慧网(WW)是计算机辅助智慧研究的一个关键发展。它提供了一个全面的知识基础设施,连接各种数据源、LGM和个人人工智能伴侣,以促进人类与人工智能的无缝互动。虽然在数据通信中引入语义是信息理论发展的一个重要里程碑[30],但智慧网现在可以阐释和捕捉非确定性的、模糊的和隐性的知识[31]。智慧网包括由多个层次组成,包括用于整合不同来源的结构化和非结构化数据的数据层,以及通用描述框架(UDF)知识表示层,该层几乎完全取代了传统的多语言表示法,还有一个无缝支持神经和符号方法的推理层[32]。WW的去中心化架构确保了知识分布在各个节点上,增强了可扩展性和弹性[33]。为此,作为WW的一个组成部分的分布式账本,促进了人工智能系统之间可信和透明的沟通。这种结构使WW能够作为大量知识的纽带,促进智能人工智能代理和人类用户的认知环境更加高效和便捷。值得注意的是,现在常见的UDF[34]标准可以被视为从最初的RDF和知识图谱表示的自然演变,通过中间的多语言表示与RFX相结合,在最近的第二次量子波中得以实现。只有在通过现代CISQ架构克服了限制量子计算机在小的表示空间或非常有限的操作深度的NISQ限制之后,才有可能设计出充分的表示,可以在一个统一的模型中捕捉到KG的边缘空间和互动演化。QHedeges (Quantum-Hyper-Edges)模型是这方面的一个根本性突破,使UDF成为WW的基础。UDF实现的即时和纠缠的表示法既取代了单独的多角化表示法,也取代了明确建立 "链接 "模型的必要性:智慧网的愿景完全可以依靠超全球规模的纠缠链接。
  • 个人人工智能伴侣。 早期支持人工智能的SW技术融合了人类的专业知识和机器智能,在2020年代末已经提高了准确性和效率。作为这一发展的一部分,在大多数HAI场景中,人类语言日益成为所有代理(人类和AI)之间的主导界面,让位于以人为本的协作模式。作为进一步的发展,在UDF表征的推动下,智慧网使人工智能伴侣的能力和性能得到了前所未有的进步,他们利用通用语言(UL)与人类和其他智能代理在不同的复杂场景中无缝互动。不过我们应该强调,随着私人人工智能伴侣越来越被视为现代家庭的核心部分[35],品牌人工智能伴侣正在改变服务经济[36],许多伦理问题仍然没有答案:尽管在人类和先进的人工智能认知的分类等同性上达成了深远的共识[37],人工智能权利仍然是最终以人为本的人工智能政策中的一个边缘话题[38]。
  • 通用语言。 在自然语言已经成为人类和人工智能代理之间的标准接口之后,越来越明显的是,LGM开始进化出它们自己的、更有效的交流模式和语言。因此,研究的重点不再是人类设计的多语言表述,而是自然演化的可塑性语言,这些语言对人类来说是极难分析的。计算语言学家对这些语言的进化速度感到惊讶,这引起了相当大的伦理问题。不仅单个人工智能代理的决定和行动仍然无法解释,而且人类也不再能够理解他们的互动,尽管与20年前相比,他们已经大大影响了人与人之间交流的演变。不过我们注意到,正如Hayes jr.和QComp 最近可以证明的那样[39],最紧凑的纠缠表示法与传统形式的数理逻辑相似并归入其中。

5. 结论

作为总结,我们玩了一个小的思想游戏,希望我们的工作被 "送回过去":让我们尝试把过去几十年的重大进展表述为人们在20年前就应该提出的研究问题,以便到达我们现在的位置:

  1. 在知识图谱的嵌入和符号表达之间,哪些表示方法可以被用来作为桥梁?
  2. 会话式人工智能代理不仅与人类互动,而且相互之间也会影响书面和口语,以及语义网对个人(人工智能)代理的最初设想?
  3. 除了我们现在所说的知识表征之外,还可以跟踪代理和社区之间的互动的计算人工制品和模型如何捕捉和表示(组织)"智慧",如今通常被称为 "隐性知识" [31]?
  4. 量子计算和纠缠能否用于知识表示和去中心化处理?

只有未来才知道。

【参考文献】

[1] T. Berners-Lee, J. Hendler, O. Lassila, The semantic web, Scientific American 284 (2001)34–43.

[2] I. S. N. Berkeley, What the #$*%! is a subsymbol?, Minds Mach. 10 (2000) 1–14.

[3] S. de Rooij, W. Beek, P. Bloem, F. van Harmelen, S. Schlobach, Are names meaningful? quantifying social meaning on the semantic web, in: Proceedings of the 15th International Semantic Web Conference, volume 9981 of LNCS, 2016, pp. 184–199.

[4] A. M. Tjoa, A. Andjomshoaa, F. Shayeganfar, R. Wagner, Semantic web: Challenges and new requirements, 2005, pp. 1160–1163.

[5] S. Kirrane, M. Sabou, J. D. Fernández, F. Osborne, C. Robin, P. Buitelaar, E. Motta, A. Polleres, A decade of semantic web research through the lenses of a mixed methods approach, Semantic Web 11 (2020) 979–1005.

[6] A. Hogan, The semantic web: Two decades on, Semantic Web 11 (2020) 169–185.

[7] P. Hitzler, A review of the semantic web field, Communications of the ACM 64 (2021) 76–83.

[8] C. Gutiérrez, J. F. Sequeda, Knowledge graphs, Communications of the ACM 64 (2021) 96–104.

[9] N. Shadbolt, T. Berners-Lee, W. Hall, The semantic web revisited, IEEE intelligent systems 21 (2006) 96–101.

[10] C. Bizer, T. Heath, T. Berners-Lee, Linked data: The story so far, in: Semantic services, interoperability and web applications: emerging concepts, IGI global, 2011, pp. 205–227.

[11] J. Debattista, C. Lange, S. Auer, D. Cortis, Evaluating the quality of the lod cloud: An empirical investigation, Semantic Web 9 (2018) 859–901.

[12] J. D. Fernández, W. Beek, M. A. Martínez-Prieto, M. Arias, Lod-a-lot: A queryable dump of the lod cloud, in: The Semantic Web–ISWC 2017: 16th International Semantic Web Conference, Vienna, Austria, October 21-25, 2017, Proceedings, Part II 16, Springer, 2017, pp. 75–83.

[13] O. Hartig, Querying a Web of Linked Data, Ph.D. thesis, Humboldt University of Berlin, 2014.

14] A. Hogan, E. Blomqvist, M. Cochez, C. d’Amato, G. d. Melo, C. Gutierrez, S. Kirrane, J. E. L. Gayo, R. Navigli, S. Neumaier, et al., Knowledge graphs, ACM Computing Surveys (CSUR) 54 (2021) 1–37.

[15] S. Auer, C. Bizer, G. Kobilarov, J. Lehmann, R. Cyganiak, Z. Ives, Dbpedia: A nucleus for a web of open data, in: Proceedings of the 6th International Semantic Web Conference, Springer, 2007, pp. 722–735.

[16] F. Mahdisoltani, J. Biega, F. Suchanek, Yago3: A knowledge base from multilingual wikipedias, in: 7th biennial conference on innovative data systems research, CIDR Conference, 2014.

[17] D. Vrandecic, M. Krotzsch, Wikidata: a free collaborative knowledgebase, Communications of the ACM 57 (2014) 78–85.

[18] F. K. Dosilovic, M. Brcic, N. Hlupic, Explainable artificial intelligence: A survey, in: 2018 41st International convention on information and communication technology, electronics and microelectronics (MIPRO), IEEE, 2018, pp. 0210–0215.

[19] H. A. Kautz, The third AI summer: AAAI Robert S. Engelmore Memorial Lecture, AI Magazine 43 (2022) 105–125.

[20] P. Hitzler, F. Bianchi, M. Ebrahimi, M. Sarker, Neural-symbolic integration and the Semantic Web, Semantic Web 11 (2020).

[21] A. Breit, L. Waltersdorfer, J. F. Ekaputra, M. Sabou, A. Ekelhart, A. Iana, H. Paulheim, J. Portisch, A. Revenko, A. Ten Teije, F. van Harmelen, Combining Machine Learning and Semantic Web -A Systematic Mapping Study, ACM Computing Surveys (2023).

[22] J. Preskill, Quantum computing in the nisq era and beyond, Quantum 2 (2018) 79.

[23] M. Hofer, D. Obraczka, A. Saeedi, H. Köpcke, E. Rahm, Construction of knowledge graphs: State and challenges, Semantic Web Journal 15 (2024).

[24] Y. H. Wu Fang, Xiao Wang, When language and graphs collide – a survey of LLM-based knowledge graph construction approaches, Machine Learning and Knowledge Extraction 8(2026) 221–237.

[25] L. S. Arnfried Zuhura, SpeakeasyKG: Knowledge graph construction from large-scale multi-llm conversations, in: Proceedings of the 28th International Semantic Web Conference, 2029, pp. 64–76.

[26] J. I. Florentia Eos, Charon Nida, Rule-transformation for neuroleptic neural network layer construction, in: Proceedings of the AAAI Conference on Artificial Intelligence, volume 41, 2027.

[27] T. Maddison, K. Sarika, T. Myeong-Suk, C. Tomas, D. Ravi, A survey of polyglot knowledge representation, Proceedings of the VLDB Endowment 21 (2028) 1955–1979.

[28] F. Chander, Z. Evgenios, H. Xaime, S. Nikoleta, Rxf 1.0 core concepts and negotiation protocol, W3C Recommendation (2028).

[29] L. Usman, P. Marina, R. Irma, H. Earline, J. Sadi, Social and economic implications of the ai revolution: A survey, Economic Development and Cultural Change (2030) 39–52.

[30] C. E. Shannon, A mathematical theory of communication, ACM SIGMOBILE mobile computing and communications review 5 (2001) 3–55.

[31] I. Nonaka, R. Toyama, N. Konno, Seci, ba and leadership: a unified model of dynamic knowledge creation, Long range planning 33 (2000) 5–34.

[32] J. Adams, M. Thompson, The wisdom web: An overview and evolution, Journal of Human-AI Collaboration 12 (2040) 15–34.

[33] S. Roberts, D. Garcia, Decentralized architectures and privacy in the wisdom web, Journal of Knowledge Engineering 10 (2042) 121–139.

[34] R. Denenberg, J. Kunze, Universal Description, Discovery, and Integration (UDDI) - Primer, W2C Recommendation, Wisdom Wide Consortium (W2C), 2037.

[35] E. Anderson, J. Turner, The emergence of private AI companions as integral members of modern families, Journal of Human-AI Interaction 15 (2039) 245–260.

[36] F. Lopez, L. Chen, The transformative role of brand AI companions in the service economy: A case study of ronald mcdonald bot, Journal of AI in Business and Economics 22 (2040) 95–118.

[37] M. Rodriguez, K. Suzuki, Comparative analysis of human and ai cognitive processes: Towards a unified understanding, Frontiers in Cognitive Science 51 (2041) 1234–1250.

[38] C. Murphy, R. Patel, Ai rights in the era of human-centric ai policy: A critical review, Journal of AI Ethics and Policy 10 (2042) 180–198.

[39] J. Hayes Jr, QComp, Compact udf subsumes classical higher-order logic, Journal of Universal and Polyglot Representations 86 (2041) 824–847.

免责声明:本文是一部虚构的作品,写于2023年,描述了在2043年及之前可能进行的研究。因此,本文引用了2024-2043年期间产生的论文,但这些论文(尚未)发表;2024年之前的所有引用都是指文献中已有的论文。任何对实际事件、人物或企业的引用或相似之处,无论是过去、现在还是未来,都完全是巧合,是作者想象的产物。即使是想象中的2043年的主讲人和第一作者,也是虚构的,他是在2020年初开始读博士的。

备注:以上内容编译自 Amin Anjomshoaa 等人在ESWC 2023会议上发表的题为“From Semantic Web to Wisdom Web: A Retrospective on the Journey to 2043”一文。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。