来源:CreateAMind
走向最小统一意识模型的步骤:基于自由能原理的意识模型的整合
Maxwell j . d . Ramstead * 1,2,A,Mahault Albarracin1,3,A,Alex Kiefer1,4,Kenneth Williford5,Adam Safron6,7,Chris Fields8,Mark Solms9和Karl Friston1,2
美国加利福尼亚州洛杉矶市1VERSES研究实验室,邮编:90016
2Wellcome人类神经影像中心,伦敦大学学院,伦敦WC1N 3AR,英国
蒙特利尔魁北克大学信息学系,地址:蒙特利尔肯尼迪总统大道201号,邮编:H2X 3Y7
4澳大利亚克莱顿维克3800威灵顿路莫纳什大学认知与哲学实验室5美国德克萨斯州阿灵顿市阿灵顿德克萨斯大学哲学与人文系6约翰霍普金斯大学精神病学与行为科学系
美国马里兰州巴尔的摩医学院
7美国加利福尼亚州圣莫尼卡高级意识研究所8美国马萨诸塞州梅德福德塔夫茨大学艾伦探索中心9南非开普敦开普敦大学
a这些作者做出了同等贡献。
2023年7月6日
摘要
本文旨在评估最近提出的遵循自由能原理(FEP)的意识“内屏模型”能否被视为意识的最小统一模型(MUM ),从而为意识研究提供一个通用的基础模型,并整合基于FEP的意识研究方法。我们首先介绍内屏模型,它是通过将FEP的量子信息理论版本应用于已知的稀疏(嵌套和分层)大脑神经解剖学而得出的。然后我们回顾以FEP为前提的意识模型。具体来说,我们回顾了贝叶斯版本的全局工作空间和注意力图式理论,以世界模型和自我模型为前提的理论,以及形式化时间意识的计算结构和属性的模型。然后我们讨论现存的FEP理论的意识模型如何与候选的MUM相关联
1介绍
从历史和跨学科的角度来看,理论的发展往往是由理论整合和分化的交替时期形成的:在共同原则下的包容是最重要的时期,而在理论扩散(有时是疯狂的)以捕捉目标现象的特质的时期。这种二分法在文献中呈现出不同的形式:在人工智能领域,人们谈论“neats”和“scruffies”(这两个术语是由尚克和艾贝尔森创造的;见(Lehnert,2013))至少可以追溯到20世纪80年代;但早在19世纪,达尔文就谈到了所谓的“粗人”和“头发分裂者”之间的健康辩证关系,这一区别后来被(辛普森,1945年)推广到生物学中;"狐狸"和"刺猬"也有类似的区别,用希腊诗人阿奇洛库斯的话说,"狐狸知道很多事情,但刺猬知道一件大事"(柏林,2013年)。
研究思想和大脑的科学(认知科学、计算神经科学等)。)在这方面可以说正处于一个转折点。过去几十年,随着基于神经科学和生物学中“大规模模块化”方法的广泛流行,“邋遢”、“分裂”型思维无疑占据了主导地位,这种思维可以说在20世纪90年代和21世纪初达到了顶峰(卡鲁泽斯,2006;科斯米德斯和图比,1997年;Pinker,2003)。现在,理论整合的趋势似乎又在上升。这一转变的一个核心见证是认知和生命研究的数学方法越来越受欢迎,这些方法利用了物理学和信息论的形式原则,例如自由能原理(FEP)(弗里斯顿,2019年)和综合信息论(IIT)(托诺尼,2012年)。
尤其是意识研究,仍然是一个相当“邋遢”的学科,充斥着许多模型和理论。(Seth & Bayne,2022)最近对意识理论的评论指出了近24种当代理论,每一种都附有文献;这篇综述是有选择性的,排除了不以神经实现或相关为特征的理论。在认知科学和神经科学中,有超过12种不同的意识模型,其直接前提是意识是,或者可以被建模为,或者以其他方式可能本质上涉及贝叶斯推理的过程(Rorot,2021)。意识理论的目的和目标是非常不同的。一些意识理论旨在解决所谓的意识“难题”(Chalmers,1996)——即大脑的功能为什么以及如何伴随着意识体验——而另一些理论则提供了更有限的努力,旨在模拟特定类型的体验内容通过神经结构和动力学实现或实现的方式。意识理论也针对不同的目标:它们差异很大,从关注所有有意识的生物被赋予的那种基本意识,到人类表现出的那种意识,涵盖“更高级”的认知过程,如内感知、自我、第一人称视角和读心术能力或“心理理论”。在这篇论文中,我们将有兴趣为后一种类型的理论提供一个统一的框架:解决类人意识的神经实现的理论,特别是将符合已知的神经科学作为成功标准的理论。
最近,意识研究领域出现了一种走向“整洁”的趋势。特别是,最近有人提出,为了在意识研究的核心问题上取得进展,我们应该开发意识的“最小统一模型”(Wiese,2020)。也就是说,我们不应该追求多种意识理论的扩散,而应该致力于理论的统一。根据(Wiese,2020),一个MUM必须符合三个标准。首先,一个MUM必须只指定(某些形式的)意识经验的必要属性——这意味着一个MUM是最小的,因为它不旨在(至少在一开始)为所有的意识经验指定更强的、充分的条件。第二,模型必须包括对意识体验的定义明确、确定的描述,这些描述可以在进一步的分析中变得更具体,并且可以扩展到更复杂、更集中的模型中。最后,MUM是统一的,因为它应该通过突出它们共同的假设来整合现有的意识理论解释,这需要找到对应于必要属性的重叠区域。鉴于意识研究目前是一个如此“邋遢”的学科,寻找MUM的项目对意识研究领域尤为重要。因此,根据(Wiese,2020)提出的标准,本文旨在评估最近提出的来自FEP的意识“内部屏幕模型”(Ramstead等人,2023)是否可以被视为意识的MUM。目前基于FEP的意识研究方法各有侧重,提供了意识的特定方面或过程的地图(Rorot,2021)。在这篇论文中,我们的主要任务将是展示当前以FEP为前提的意识模型是如何以一种非同寻常的方式结合在一起的。提议的MUM可以显示这些现存的模型如何相互定位,以及这样做为意识研究提供了坚实的基础。
我们在结束介绍性发言时警告说,从两个方面来看,这篇论文是庞大的。首先,这是一篇相当长的论文。这在很大程度上是由于需要审查的文献的范围;无论是FEP还是基于FEP的意识研究。我们没有试图全面详细地回顾所有这些理论,而是选择根据它们共同的核心假设和承诺对它们进行分类。我们也是有选择性的,因为我们不考虑不以FEP为前提的意识模式;特别是,我们(几乎唯一地)考虑已经在数学上发展的或者已经在计算研究中实现的理论。我们选择主要关注计算研究有几个原因。首先,FEP方法概括了最神经现实和支持意识的方法。这意味着它们为理解意识提供了一个全面的、有科学依据的框架,这与我们提供一个严谨的、基于证据的文献综述的目标是一致的。
其次,计算研究提供了独特的优势,能够证明理论与计算。这在意识研究领域尤其重要,因为理论模型通常需要通过经验证据来验证。计算研究允许我们模拟这些模型并观察它们的预测,提供了一种测试和验证理论的具体方法。
第三,计算研究本质上是跨学科的,借鉴了神经科学、心理学、计算机科学和数学。这种跨学科的性质与意识作为一种现象的复杂性相一致,这种复杂性不能从单一学科的角度得到充分理解。
我们论文的第二个意义是盲人摸象的比喻意义。也就是说,我们试图找出核心结构来解释为什么现有的意识研究方法在某种程度上是正确的。换句话说,我们提出了一个正式的解释,我们希望它能容纳现有的意识解释中最有希望的东西,并阐明它们为什么解释它们做了什么。打个比喻来说,我们试图去识别那头大象,它支撑着对意识现象的不同观点。
我们承认,在我们将在下面讨论的“内部屏幕”模型之前的几个意识理论,实际上也为基于FEP的意识研究提供了一个框架。例子包括整合世界建模理论(IWMT) (Safron,2020a,2022b)、“获胜假说”(Hohwy,2022aParr,Corcoran等人,2019年b)和预测性全局神经元工作区模型(威特和史密斯,2021年),这些模型也涉及从FEP理论的角度最低限度地解释多条收敛的证据线。与此相关的是,(Rorot,2021)最近回顾了现有的以FEP为前提的意识理论,看看是否有任何人有资格成为MUM。我们的分析集中在一个与罗罗特相似的结论上,即精确性和复杂性的最优化在大多数以FEP为基础的意识理论中起着关键作用。然而,罗洛的工作没有提出MUM。我们阅读我们的论文,作为这项工作的后续,提出了一个特殊的建议,试图表明这些不同的理论如何在反映意识的不同方面表现出深刻的趋同性,然而所有这些都可以从FEP加上独立的合理假设中推导出来,如下所述。
2内部屏幕假说
FEP描述了可以被分解成称为“粒子”的组件的系统,每个组件都充当另一个组件的“环境”。让我们称这样一个系统U = AB,其中A和B是分量。我们认为U包含了感兴趣的“一切”,因此是孤立的;在这种情况下,A和B只相互作用,B可以被视为“除A之外的一切”或简单地视为“非A”,反之亦然。在这种情况下,FEP指出,如果A和B彼此不同,因此可以被视为具有相互条件独立的状态,那么在给定分离和耦合两个系统的状态的情况下,它们都可以被视为以保持其条件独立性的方式运行(我们接下来讨论的“马尔可夫毯”)(Fields等人,2022;Fields,glaze brook & Levin,2022)。因为只有当每个组件都能够对另一个组件的动作做出适应性反应时,独立性才能得以保持,所以人们更熟悉的FEP公式——即认为每个系统都会以最大化其预测其交互伙伴下一步将做什么的能力的方式运行——又出现了。因为贝叶斯推理最大化了预测能力,所以FEP支持后一种公式
联合系统U的“贝叶斯力学”(Ramstead等人,2023)。
FEP有两种主要的解释:经典公式和量子信息理论公式。如果U的状态空间是经典描述的,那么可以得出这样的结论,如果U的动态可以用有向无环图来表示(并因此作为贝叶斯因果网络),那么A可以被认为是通过一组“边界”状态与B分开的,这些状态形成马尔可夫毯;这个马尔可夫毯就是A的状态集,A和B之间的所有因果联系都流经这个状态集。显然,在这种情况下,B也具有马尔科夫毯,包括与A的马尔科夫毯直接因果相邻的B的状态。这些马尔科夫毯(任一个)的存在使得A和B的“内部”(即,非毯)状态有条件地独立。如(Fris- ton,2019年),(Ramstead等人,2023年)所示,如果系统U实现或需要编码这种马尔可夫毯的生成模型,那么它将看起来好像U(比如A)的组件的内部状态“跟踪”其交互伙伴(比如B)的统计数据。更专业地说,如果一个系统U接受一个特定的划分(划分成具有马尔可夫覆盖层的粒子),那么这些粒子的内部状态看起来就好像它们编码了关于B的可观察行为的一个变化密度的参数(一个概率的“最佳猜测”),即实现了B在马尔可夫覆盖层上的行为的一个概率模型,反之亦然。
如果使用量子理论描述U的状态空间,即,作为希尔伯特空间U,则得出结论,如果U的动力学(即,自相互作用)HU使得联合状态是可分离的,即,不是纠缠的(形式上,使用狄拉克符号,U = AB= A B),则A可以被认为是通过充当全息屏幕的分解边界B与B分离(Fields等人,2022)。这个屏幕的状态不在希尔伯特空间U中;它们可以被视为定义了辅助希尔伯特空间B。可分性要求在B处定义的相互作用HAB比自相互作用HA和HB弱。这又要求维数dim( B) dim(),dim(),只有当B是有限的,即对于某个有限的N,dim( B) = N时才能满足该条件。在这种情况下,相互作用HAB具有2N个特征值,其中一个可以被视为在任何给定时间编码为B上的比特阵列。然后,特定组件A和B可以被视为交替地向B写入和读取位串,这起到马尔可夫毯的作用,并保证状态A和B的条件独立性。内部动态HA和HB可以,如在经典情况下,被视为分别实现B和A的B上的动作的生成模型,表现为最大化贝叶斯预测能力。该量子公式与经典公式的详细比较见(Fields等人,2023)。
在FEP的经典公式中,所有的状态和状态转换,因此所有的编码信息都是经典的,而在量子公式中,唯一的经典信息是作为比特阵列写在边界上,然后从边界读取的信息
B.这有两个直接后果:
1.经典信息仅相对于将其写入B的组件来定义(Fields,Glazebrook,& Marcianò,2022)。在联合系统U中没有“客观的”经典信息,原则上它可以被分解成任意的数
各种方式。
2.果特定分量A本身具有分量,即,如果A = A1A2,并且分量A1和A2经典地通信,那么状态A必定是可分的,如A=A1A2 =A1 A2,A1和A2中的每一个必定具有充当全息屏幕的边界,并且它们交换的任何经典信息必定在它们的共享边界B12上被编码,边界B12充当全息屏幕,因此充当马尔可夫毯。
分隔传统通信的组件的内部边界是“内部屏幕”;(Fields,Glazebrook和Levin,2021)提出了一个假设,即任何编码内部记忆(即内部经典信息)的系统都有这样一个内部屏幕,并在(Ramstead等人,2023)中进行了详细阐述。现在已经知道,每当一个(量子)系统能够部署测量或行动,而这些测量或行动由于原则或实际(如能量)原因不能同时部署时,就需要这样的内层屏蔽(Fields,Glazebrook,& Marcianò,2022);关于形式细节和证明,见(Fields,Glazebrook,& Marcianò,2023)。有趣的是,使用这种“不可共同部署”的资源进行的测量或操作会导致内在的或“量子的”上下文依赖性,因此原则上可能会产生不可预测的副作用(Fields & Glazebrook,2022,2023)。对于使用经典神经科学和经典FEP描述的系统,当测量(即感知)和动作只能串行执行时,它们实际上是不可协同部署的。在这种情况下,内部屏幕假设是所有这样的系统都有不可约的内部马尔可夫毯的假设。我们之前已经表明,不可约的内部马尔可夫毯的假设,通过经典的FEP,导致了一个分层处理的模型,该模型允许我们理解在复杂的神经系统中意识在哪里以及(在功能上)为什么会产生;示意图见图1(Ramstead等人,2023年)。简而言之,该模型预测,在从细胞间信号转导系统到全脑架构的每一个尺度上,组件都具有马尔科夫毯,这使得它们在相同尺度上有条件地独立于其他组件。在中间的组织尺度上,这些组件既有来自小尺度系统的足够输入,又有来自大尺度系统的调节约束,以编码意识的连贯内容。我们将在下文中看到,这个模型提供了一个基础,在这个基础上整合了多种现有的,符合FEP的意识理论,即它提供了一个MUM。
3基于FEP的意识模型述评
许多研究意识的方法已经发展出来,这些方法明显地或隐含地利用了(经典的)FEP公式。这些方法的前提是基于一个共同的假设,即意识本质上涉及一个推理过程,FEP可以应用于模型。在这一节中,我们回顾这一现存的工作。
这篇综述并不打算是详尽的或全面的(并且并不是所有的都是被广泛接受的理论:它们只是可以被有效地形式化的范例方法
图1:内部屏幕模型预测的嵌套层次结构的示意图。大脑重复嵌套马尔可夫覆盖结构的表示。这里,相同的稀疏耦合模式(和隐含的条件独立性)——即马尔科夫毯——在每个感兴趣的尺度上重复;从神经元区室到神经细胞体,再到微电路、大脑区域和全脑网络。图形灵感来自(Park & Friston,2013)中的图1。
集成在一个μm下)。读者可以参考(Rorot,2021年)和(Seth & Bayne,2022年)对该文献的更全面的综述,前者侧重于贝叶斯认知科学方法中的意识理论(特别是那些以FEP为前提的理论),后者提供了对神经科学中的意识理论的更全面的综述。
3.1贝叶斯全球工作空间理论
我们将回顾的第一组理论包括全球工作空间理论的贝叶斯版本,它们都广泛基于通过贝叶斯(或明确的FEP理论)透镜重铸全球工作空间理论的想法。这些理论包括贝叶斯理论
图2:全息屏幕及其环境。(A)任何两个可相互分离的系统A和B之间的边界B是全息屏幕,它将耦合A和B的相互作用(即哈密顿算符)的特征值编码为经典数据(Fields等人,2022)。a对B的行为是B的感知,等等。三角形分别代表A和B实现的计算过程(量子参考系)。
(B)双组分系统(A1,A2)与环境B相互作用。该相互作用由A1和A2之间的内部边界介导,该内部边界充当马尔可夫毯,并因此充当内部经典记忆结构。地图f和g通过A2实现了对B的“感知”,通过A1实现了对B的“动作”。图形改编自(Fields,glaze brook & Levin,2021)的图3,并受到其启发。(C)联合系统的马尔可夫链包括暴露于其共同环境的组成系统的马尔可夫链的“面”。组合系统AB的环境AB小于任何一个环境
(A或B)的组成部分(A或B)。
全球工作空间理论(Hohwy,2013,2016,2022b2022年马奇&霍威;威特和史密斯,2021)和贝叶斯版本的注意图式理论(多乐加和杜赫斯特,2019;弗莱明,2020)。(请注意,尽管我们回顾了IWMT以及关注自我和世界建模的理论(由于其强调意识的世界建模的中心地位),但IWMT也可以被视为如何在哺乳动物神经系统中实现贝叶斯全局工作空间和注意力模式的建议,并且也可能是如何实现或实施具有类似计算特征的人工智能的建议(Safron,2020a,2021a,2022b))。
3.1.1全球工作空间理论
全局工作空间理论(GWT)最初是由(Baars & Newman,1994)提出的。这个基本建议后来发展成为一系列基于生物学的模型;即全球神经元工作空间理论(GNWT),作者(Dehaene,Kerszberg & Changeux,1998);
以及动态核心假说(Edelman & Tononi,2001;托诺尼和埃德尔曼,1998年)。这个家族可能是那些被回顾的家族中最古老和最确定的——不出所料,GWT是目前意识神经科学中最受欢迎的框架之一。事实上,与GWT的一致性经常被认为是支持某一特定理论或意识模型的证据。
GWT,以及以GWT为前提的意识模型,专注于注意过程及其与意识的关系。他们根据大脑内信息的可用性和可获得性来理解意识(Newman,Baars,& Cho,1997)——在概念上与哲学中意识的“大脑中的名声”或“多重草稿”观点密切相关(Dennett,1991;Dennett & Akins,2008)。专注于信息获取的理论有时被描述为只涉及“获取意识”(与“现象意识”或主观意识相对),但我们注意到,这个术语已经引起了高阶思维理论(例如,下面回顾的注意力图式理论)和结构主义理论(例如,IIT)的支持者的争议,这些理论要么质疑现象/获取的区别本身,要么认为经验总是单一的,而“有意识的获取”将是一个更合适的术语,用于描述意识感知、操纵和报告经验的能力。在经典GWT中,意识与大脑中“全球工作空间”内的信息可用性相关联,允许各种网络相互广播信息,从而使连贯活动和跨模态信息的整合成为可能。根据经验,GWT提出了一个与意识密切相关的大脑活动的特定尺度。这就是所谓的“全局工作空间”,它是用包含四个递归连接的层次的神经网络架构建模的(Raffone & Pantani,2010)。根据GWT的说法,一系列并发和竞争的过程聚集在这个工作空间中,通过这个工作空间,本地、区域性的大脑过程能够自我组织成一个更大规模的网络。因此,GWT为大脑内部的信息投射提供了一个科学的解释,即把局部信息广播到全球,从而允许大脑形成整合的多模态表征
外部世界的事物(巴尔斯&纽曼,1994)。
GWT还被用于开发意识的神经科学模型,在该模型中,认知神经科学中研究的现象通过诉诸大脑组织成一种“工作空间架构”来解释:这被称为“全球神经工作空间理论”(GNWT) (Dehaene,Kerszberg,& Changeux,1998)。例如,(Volzhenin,Changeux和Dumas,2022年)提出了一个大脑如何处理信息的模型,从而产生意识体验。这个模型基于信息处理的三个层次:感觉运动层次、认知层次和意识层次。根据这一观点,意识层次是这样一个层次,即使没有外部感官输入,信息也在其中得到处理和保持,并被认为以中间神经元的参与和保持表象的自发活动为特征。该模型结合了Hebbian和强化学习机制,并在各种认知任务中表现良好。该模型的意识水平的最佳参数似乎与人类大脑的已知特征非常吻合,例如
抑制性神经元和阿尔法节律的存在。
根据GNWT的说法,意识产生于“点火事件”,其中信息通过全球工作区聚集并传播到分布在大脑中的一组更广泛的网络(这也可能涉及竞争过程的抑制)(Baars,Geld和Kozma,2021)。GNWT的支持者将前额叶和顶叶区域确定为这种点火事件的位置;特别是,GNWT将全球工作区确定为连接前额叶和顶叶皮质的兴奋性神经元网络(Mashour等人,2020)。GNWT预测,当一个刺激被注意时,这些区域的晚期(受刺激约束的)激活导致意识体验,并且其知觉特征被选择用于点燃;而无意识刺激被定义为那些未能获得这种全局影响,低于点燃阈值的刺激。
GNWT的经验预测得到了各种形式的各种神经影像学研究的支持,如fMRI、EEG、MEG和癫痫患者的颅内记录。这些结果表明,在有意识的感知过程中,额叶和顶叶区域被广泛激活,而无意识感知的相关性似乎仅限于枕叶和颞叶区域:例如,见(威特和史密斯,2021)。这种大规模的点燃将大脑中与高阶概念表达相关的部分连接到感觉皮层,因此使这些信息在这些系统之间更广泛地可用,提供功能协同。潜意识刺激未能到达全局工作空间,但仍在点燃阈值以下被处理。
3.1.2获胜假设模型和贝叶斯全球工作空间理论
下一个模型家族包括流行的意识“获胜假说”模型(见(Rorot,2021))并扩展到贝叶斯全球工作空间理论。根据获胜的假设解释,主动推理提供的框架为我们提供了抑制事件的机制,从而整合——甚至可能取代——经典的GWT模型,并导致对意识的综合解释(Hohwy,2013,2022b2022年马奇&霍威;赛峰,2020a,2021a,2022b)。获胜的假设方法利用政策选择以及元认知水平的推理来解释意识体验的内容是如何产生的。
如上所述,在预测编码中,大脑有效地评估关于其当前感觉状态的最可能原因的竞争假说。贝叶斯全球工作空间理论表明,有意识的经验符合这种推理。更准确地说,它假设经验的当前内容由具有最高总体后验概率的假设决定,给定当前数据和先验信念,即,它对应于大脑对“那里有什么”的最佳猜测(Marvan & Havlík,2021;帕尔、科克兰等人,2019年a)。这种方法认为注意力和感知是同一预测误差最小化过程的两个不同但相关的方面,并认为意识内容的流动是由关于转移概率的信念驱动的(Hohwy,Paton和Palmer,2016)。知觉假设的准确性和预期精度形成了“有意识知觉的统计维度”:准确的假设是好的,因为它们以一种节俭的方式最小化预测误差;虽然精确
假设是忽略噪声和挑选出相关输入的最佳方法(Hohwy,2012,2013)。
在这个框架中,注意力在将预测带入意识中起着双重作用,它既能调整精确度权重,又能作为一种控制机制,使假说之间的竞争产生偏差。然而,根据这一观点,有意识的感知并不意味着认知水平的准确性和精确性:在某些情况下,精确但不准确的假设可能决定有意识的感知,反之亦然(Clark,2015;Hohwy,2012,2013;Hohwy & Michael,2017;Hohwy,佩顿&帕尔默,2016;Hohwy & Seth,2020)。这种假设的变体有时强调预测误差的精确加权的变化是有意识经验所必需的,这与自我建模的公式非常一致:参见(Sandved-Smith等人,2021)和下文。行动也起到了至关重要的作用:GNWT中所谓的点火事件被认为反映了从感知推理中的证据积累到通过行动产生证据的转换中发生的事情——因此,在主动推理公式中,有意识的感知与政策选择特别相关(见(Hohwy,2013),esp。第213—219页)。
虽然核心获胜假设模型独立于GWT,但GWT方法的最新扩展特别利用了获胜假设模型所构建的主动推理工具。预测性全球工作空间理论是GWT的贝叶斯版本(威特,2019;威特,霍威&史密斯,2022年;威特&史密斯,2021),它使用预测编码来实现。它基于这样一种想法,即大脑产生关于环境的预测,并将这些预测与传入的感官信息进行比较。产生的差异被测量为贝叶斯预测误差。最令人惊讶的预测,或那些与预期结果偏差最大的预测,然后被广播到全球工作区,在那里它们可以用来更新内部模型和影响行为。
预测GWT认为,意识产生于这个全球工作空间,它整合并处理来自大脑多个区域的预测和预测错误,并允许信息通过分布式网络传播。预测性全球工作空间理论提出,意识是大脑将感官信息与其内部模型生成的预测相协调的能力的一种功能。需要点燃的神经元动力学依赖于被赋予足够时间深度的推理形式,以提供输入线索的上下文。然后,这些动态可以在全球工作空间内协调,实现面向目标的行为(这需要规划)。
3.1.3注意图式理论的贝叶斯版本
注意力图式理论(Graziano,2017年)——其中存在贝叶斯版本(Dolega和杜赫斯特,2019年)——提出意识源于大脑创建注意力模型或图式的能力,这使它能够理解和预测自己的行动和行为,以及其他人的行动和行为。“节俭理论”以此为基础,认为意识是作为保存认知资源的一种方式而产生的。
普通注意图式理论认为,意识是一种主观意识的形式,产生于主体对给定刺激的注意(Graziano,2017)。
根据这种观点,“注意力模式”是一个简化的模型,大脑用它来表示自己的注意力过程,并通知和指导这些注意力过程。根据注意图式理论,每当我们声称意识到某事时,我们实际上正在部署高阶认知过程来内省我们的注意图式并报告它所包含的信息(参见意识的高阶表征方法,如下一节所讨论的(R. Brown,Lau,& LeDoux,2019))。注意力模式必须是稀疏的,以便提供控制更复杂过程的有效手段。根据注意图式理论,注意图式的展开导致现象意识的“错觉”。更具体地说,注意力图式理论的支持者认为,意识体验的空灵和似乎非物质(和流动)的本质是虚幻的,对这些现象的简约解释可以作为支持注意力图式理论的证据(Guterstam等人,2019;Schurger & Graziano,2022年)。
最近,有人提出了贝叶斯版本的注意图式理论(Dolega & De- whurst,2019),其中也纳入了“多草稿”观点的元素。这种贝叶斯版本的注意力图式理论建立在上述贝叶斯全球工作空间理论的基础上,其支持者认为,目前特定假设具有最高后验概率这一事实本身不足以解释有意识知觉的内容。相反,有必要首先减少一个人的感觉的可能原因的空间,并让注意力过程实际上探索这些假设。这将“大脑中的名声”的解释与注意力图式理论联系起来,提供了一个意识的紧缩理论,根据该理论,现象意识的明显本质特征是由反射性接近产生的幻觉。(我们注意到,先验地,注意图式理论的核心思想(即对世界的意识体验是由大脑对其自身注意过程的(稀疏)表示来调节的)很大程度上独立于意识错觉论,正如在心灵哲学文献中所讨论的那样。)
3.1.4与内部屏幕模型的关系
GWT和GNWT的原则是,较低层次的加工不太可能被有意识地体验到,因为它们编码的信念结构展开得太快,以至于无法以必要的方式表现出来(Mashour et al .,2020)。因此,我们可以从推理的层次或嵌套神经解剖学的形式考虑中恢复GNWT公式的核心方面。在提出的MUM的说法中,全局工作空间——或动态核心(Safron,2020a,2021a,2022 b)——包含不可约(最小)马尔可夫毯,该马尔可夫毯接收来自层级较低级别的上升消息(即,内部屏幕的感觉扇区上的经典信息)。
以GWT为前提的意识理论允许我们模拟意识整合、选择和优先处理来自大脑较低层次的传入信息的方式(参见,由内部屏幕的活跃部分介导的心理活动)。根据GWT及其贝叶斯理论,意识的这个进入维度是通过点燃和同时抑制竞争过程来实现的
预测编码的FEP公式的术语需要对预测和预测误差进行精确加权。接下来的提升信息的选择对于从上面建立的视角解决注意力是至关重要的。请参见(Friston,Breaks- pear,& Deco,2012年)对分层生成模型下作为贝叶斯力学(即自由能最小化)的一个涌现属性的点火现象的数学和数值分析,以及(Clark,Friston,& Wilkinson,2019年;Safron,2021a)对感受性的叙述性解释突出了贝叶斯大脑中注意力选择的作用。
意识内容的尺度直接来自马尔可夫链的层次或嵌套结构,在这种结构中,内部屏幕的活动状态因果性地干预较低层次的处理(即心理活动)。从这个角度来看,很明显,中间水平的处理对于实现心理活动(例如,例示注意集)是至关重要的,这是现存意识模型的一个经验支持的方面:例如,“注意的中间表征”理论(Marchi & Hohwy,2022;普林茨,2012)。在这些中间层次中,由更高层次选择的信息被优先化,作为分层生成模型下贝叶斯机制的自然部分。注意,GNWT经常强调皮层等级在意识体验发生中的作用:重要的是注意到GNWT的观点经常(但不一定)假设意识需要一个拥有新皮层或功能同源物的大脑;即高级表型的特征。最后,注意力模式的稀疏性可以直接根据FEP来激发,该是在复杂性和准确性之间找到最佳平衡的产物。
3.2自我模型和世界模型
我们在这里归类的模型都有一个共同的想法,那就是,对于一个有意识的事物来说,这个事物必须能够塑造它自己和它的世界:换句话说,有意识就是成为那种参与情境自我塑造的事物。这组理论包括综合世界建模理论(Safron,2020a,2020b,2021a,2022a,2022bSafron,atal,& Tim,2022),自我建模理论(Metzinger,2007),beast ma- chine方法(Seth & Tsakiris,2018),生成纠缠模型(Clark,2019),感觉不确定性理论(Solms,2013),以及投射意识模型(Rudrauf等人,2017;威利福德等人,2018)。基于高阶表征的意识理论,如高阶思维(HOT) (R. Brown,Lau,& LeDoux,2019;Rosenthal,2005)和高阶知觉(Lycan,1996)理论,以及各种自我表征主义(Kriegel & Williford,2006),阐明了基于自我建模的意识观点的重要概念基础和动机。
3.2.1整合世界建模理论
在最近关于内部屏幕模型的工作之前(Ramstead等人,2023年),集成世界建模理论(IWMT) (Safron,2020a,2020b,2021a,2022a,2022bSafron,atal和Tim,2022)可能是最全面的尝试,以确定现存意识理论下的“大象”。IWMT可以说是提供MUM的第一次尝试
对于以FEP为前提的意识理论来说,尽管这个术语是由(Wiese,2020)引入的。因此,所提出的MUM可以被视为生成类似IWMT的模型的尝试,尽管该模型具有更少的理论假设集,专注于意识体验所必需的核心组件,并进一步描述如何从其他理论中找到趋同支持。
根据IWMT的观点,意识是一个整合世界模型的过程。更确切地说,意识将对应于正在进行的关于被体现的主体的可能感觉状态的推论或预测的产生;这些推论是以因果世界模型为条件的,而因果世界模型又是从生态位内的目标追求历史中训练出来的。这一理论的前提是认知系统被赋予了特定的世界建模能力。这些世界模型具有空间、时间和因果的一致性。更具体地说,IWMT声称意识依赖于经验的组织,根据康德的空间(或局部性,因此提供关于特定属性的组合性)、时间(或空间中的比例变化,因此提供预测)和原因(或这些变化中足以提供建模/结构学习的规律性)。这些形成一致性的特性可能进一步需要依赖于(并允许)学习和部署以自我为中心的、前瞻性的参考框架以及对反事实可能性的评估的各种形式的代理,从而提供作为“生活世界”上的“观点”的主观性。根据IWMT的观点,意识是一个能够产生身体和世界的整合的、连贯的表示的过程,其中世界建模的过程协同地整合了给定主体可用的和相关的各种信息源。这些综合表征允许智能体以足够的速度生成对智能体世界配置的一致估计,使得智能体能够在形成的时间尺度上通过行动-感知循环来通知和被通知。就IWMT而言,这使得适应性行动选择成为可能——广义地解释为包括关于精神行为的政策部署(Safron,2021 a)——以及这些政策和世界模型的迭代改进(参见终身学习)。
IWMT提出,信息整合或压缩/预测(Safron,2022a)是通过一种机制来促进的,这种机制涉及被称为“自组织谐波模式”(SOHMs)的动态吸引子的形成和失效。SOHMs代表了赛仑·阿塔索伊的“连接体谐波”方法的概括,通过识别谐波函数或粗粒化来模拟神经成像数据(阿塔索伊、唐纳利和皮尔森,2016年)
动力学的驻波描述——关于在大脑白质拓扑的拉普拉斯图上传播活动的模拟,特定的精神状态被表征为这些进化基函数的各种组合。(SOHMs的结构有效性不依赖于任何给定分析技术的有效性;SOHMs同样与利用总体几何(Pang et al .,2023)而非大脑连接特征的方法兼容。作为同步流形的功能,SOHMs被建议为它们形成的子网生成联合信念,信念传播——参见边际消息传递(Parr,Markovic等人,2019)——通过一致性通信原理(Fries,2005)来促进。也就是说,
通过允许神经元群在其各自的整合窗口内交换信息,同步被建议提供更复杂的相干神经信号模式。此外,每个SOHM都被建议作为一种工作空间(在GWT建议的计算意义上),允许跨尺度的信息集成。这些嵌套的谐波模式进一步被建议为具有不同程度的时间深度的生成模型的部署提供基础,具有分层相关(感觉解耦)的SOHMs提供反事实观察和信念的生成(取决于特定的行动过程)。
sohm被认为是以显示可分解性(或组合性)程度的方式分层(或异质)构造的,较小规模的sohm模拟更快速演变的事件,但是可以组合成越来越大的sohm,用于越来越复杂形式的自我和世界模拟。因此,SOHMs依赖于耦合神经集成展现共振的能力(参见Hopfield网络和restricted Boltzmann machines),这是指耦合系统通过调整其动态以收敛于共享同步流形来最小化其自由能的现象(Friston & Frith,2015;卡奇曼,欧文&英格兰,2017;Palacios等人,2019年)。抽象地说,SOHMs也可以理解为多分辨率小波分析的一种形式,用于灵活地建模(从而能够管理)多尺度过程,例如代理和他们追求有价值目标的各种环境。
根据IWMT的说法,如果足够复杂和连贯的建模可以通过以自我为中心的参考框架的多模态集成来实现——被认为是由后内侧皮质和他们接收的头部方向信息部分实现的——那么代理人可能能够迭代地估计他们感觉状态的最可能原因,从而实现根据“生活世界”的观点组织的经验流。根据IWMT的解释,这些共振的活动模式产生了一个组合的自我和世界模型,当下降的预测与上升的期望相协调时,能够产生适应性的推理模式。更复杂的自我模型和各种形式的“有意识的接触”被提出来要求与额叶皮质耦合,以便这些估计以具有更大时间深度和反事实丰富性的因果世界模型为条件,特别是被引导到公开和隐蔽行动的轨迹中(Safron,2021a萨夫龙,阿塔尔和蒂姆,2022年)。
IWMT可以理解为G(N)WT的贝叶斯版本。然而,IWMT与GNWT的不同之处在于,它致力于具有不同范围和功能的多种工作空间的概念,包括由SOHMs实现的次个人的、无意识的本地模型。IWMT提出了两种主要的工作空间形式(两者都以中间层次的表征为中心):一种工作空间被假设为由后皮层实现,因此允许对公开和隐蔽动作选择进行迭代状态估计;另一个工作空间包括更广泛的(例如,额叶相关的)整合区域,因此允许这些系统世界估计以具有有意(内源性)注意力选择和各种形式的有意识进入的能力的高级策略为条件,包括关于通过预测和预测进行想象力规划的“精神时间旅行”(Safron,2020b,2021a萨夫龙,阿塔尔和蒂姆,2022年)。
IWMT为GNWT提供了一个关键的视角,表明后皮质可能具有足够的能力来整合自我和世界建模的信息,因此它们可以被认为是现象意识的充分实现者和相当“全球性”的工作空间。此外,根据注意图式和意识的高阶理论,IWMT认为主观体验(即“感觉是什么样的”)对应于一种关于个人感觉原因的特定信念,这种信念将受到通过公开和隐蔽行动的各种形式的有意识和无意识访问的严重影响(Safron,2020a,2021a,2022b)。也就是说,虽然IWMT保持了现象意识和有意识接近之间的分离,但它也承认这些现象之间存在广泛的相互作用,使得它们难以单独分析和概念化(无论是在实践中还是在原则上)。
此外,IWMT将GWT点火事件中涉及的相变比作“波函数坍缩”(Safron,2022b),此时临界质量的(相对)密集相互作用的元素形成了一个连贯运行的动态核心。由于这个核心之外的神经集合缺乏对这个更具包容性(和丰富整合性)的SOHM的密集和相互作用元素的访问,通过自我强化和自我组织模式建立SOHM支持的工作空间可以被认为是压缩或粗粒化网络内的信息。这样,促成点火事件的非线性渗透活动可以被比作信息“奇点”的形成,其中每个SOHM范围内的元素对于外部观察者(即,其他sohm)可能变得难以辨认。因此,后者必须根据可以跨越这些子系统的边界传输的任何信息,推断出其他SOHMS中“主体”的(压缩)内容。
像下面回顾的几个理论(特别是野兽机器方法和感觉不确定性理论),IWMT与具身心智理论密切相关(Safron,2021a瓦雷拉、汤普森和罗什,2017年)。IWMT的支持者认为,IWMT所包含的那种世界建模只可能存在于具体化的主体中——也就是说,主体被赋予了物理身体的物理和几何形状,并受其约束。因此,世界建模所需的整合包括控制,提供了将感觉系统导向世界的方法。与我们目前的建议一致,IWMT声称,身体和本体感受生成模型的面向动作的表示可能构成工作空间动力学的“支柱”,根据相关的启示构建所有感知,并通过隐蔽的动作提供有意控制注意力选择的来源(Safron,2021a)。在整合体现、自上而下的注意和意志、有意的控制,并致力于建立一种易于解释各种形式的意识进入和自我意识的理论时,IWMT旨在提供一种协同的和包容的(尽管在易于理解方面可能过于包容)解释,说明意识是如何从这些过程的动态相互作用中产生的,并旨在提供一种关于意识体验和自我意识的本质的统一观点。
3.2.2自我建模理论
自我建模理论(SMT)由(Metzinger,2007年)提出,后来由(Limanowski,2014年)在主动推理下发展,专注于自我概念和自我体验如何从大脑工作中产生。该理论将自我定义为控制中心,它将来自身体的(内部感受)感觉与个人外部空间的(本体感受)运动联系起来。由于这个原因,自我从一个时间上延伸的过程中出现,这个过程将来自多个来源(包括外部感受的来源)的感觉信息整合到一个生成模型中,这个模型包括作为那些感觉的原因的自我的表征。SMT中的自我模型是以自我为中心的,这意味着它以个人的视角和经验为中心,包括第一人称(主观)的经验和第三人称的自我经验(作为与他人同等的对象)——一个在空间和时间上被(透明地)体验为守恒的自我。
根据SMT,自我不是一个静态的对象,而是一个关于主体感觉状态的最可能原因的动态推理过程的结果。积极的自我模型是一种功能状态,在有意识的意识水平下运作,并具有特定的因果作用。这种过程的运作产生了一种以自我为中心的、前瞻性的体验,这种体验是针对对象的,并允许与外部世界进行交互。自我建模理论还处理了“透明”和“不透明”心理状态或过程之间的区别(Metzinger,2003),这一点后来被(Sandved-Smith等人,2021)使用主动推理正式化。这个公式的一个关键贡献是在深度生成模型的连续更高级别上的潜在状态的精度条件。这就引出了一个关键的概念,即“存在状态”的表征是为识别知觉倾向的不同状态服务的,同时,也是通过将较低层次的信念更新过程的精确性联系起来部署注意力集合所必需的。
术语“透明”和“不透明”来自于透过窗户看东西的隐喻:窗户本身的透明性使外面的东西能够被看到,但窗户本身并没有被体验到,除非在它变得不透明的情况下。因此,自我的体验通常是透明的,这意味着拥有这种体验的主体只能访问他们体验的内容,而不能访问使这种体验成为可能的过程(即,精神活动)。然而,在一些特殊的情况下,当主体直接关注自身的经验时,自我的经验会变得不透明(并且经验过程的各个方面因此进入其内容)。从这个意义上说,自我最终是一个关于是什么导致了一个人的感官体验的特别适应性的假设。
3.2.3野兽机器接近了
野兽机器方法(Seth & Tsakiris,2018)表明,推理从根本上与具体化的过程相关,并基于通过预测编码实现的变构控制(Ainley等人,2016;Ainley等人,2012年;Apps & Tsakiris,2014;巴雷特、奎格利&汉密尔顿,2016;巴雷特&西蒙斯,2015;Fotopoulou & Tsakiris,2017;赛斯,2015;塞思
& Friston,2016;塞思、铃木和克里切利,2012年)。根据这一观点,意识体验是由一系列对身体的多模态输入构成的(特别强调内部感受和本体感受传入)。根据获胜的假设模型,代理人对导致这些感官输入的原因的最佳猜测被用来控制身体,实现意图和有目的的行动。
在这种方法中,就像获胜的假设模型一样,大脑利用一个生成模型,该模型具有一组关于什么可能导致内感受性感觉信号的先验信念。野兽机器方法突出了对具体化行动的意识体验的贡献,即有意地移动身体。在这个模型中,对自我的有意识体验是由对行动的预测产生的,而对所有权的有意识体验与对大脑内感受和外感受中心发出的预测错误的管理有关(Seth,2013)。其基本思想是,在神经系统的不同层次上的不同种类的输入产生预测误差,并且有意识的处理与一种特殊类型的预测误差的消除有关。更具体地说,根据这一观点,有意识的感知来自于在行动中最小化本体感受预测误差。基于对特定行动过程或政策的信念,本体感受信号首先被预测,然后通过行动实现或挫败。通过确定是否执行操作(当精度较低时)或是否更新模型(如果精度较高),精度称重也是这种方法的一个因素。这种精确称重与感觉衰减密切相关;即,削弱自制动作的感官后果(的精确度)(H. Brown等人,2013;Limanowski,2017,2022)。在野兽机器方法中,我们的具身自我意识的稳定性与运动行为和生理稳态之间的时间尺度和稳定性的差异有关。运动动作是可变的,根据情况的需求而产生,并且可能随着时间而改变;而生理体内平衡从根本上讲是关于保持稳定,即保持基本变量在可行的范围内。内感受性需求编码了强烈的先验,随着时间的推移,这使得稳定的自我意识能够出现。鉴于这种稳定性,作为身体的体验是透明的(在上文关于自我建模理论讨论的意义上):身体通常不被视为单纯的物体——不像对物体的视觉体验,在视觉体验中,由于大脑对物体相关的感官信号将如何随着特定动作而变化做出预测,事物被视为物体。
因此,身体和自我在大多数情况下被体验为透明的,只有当注意力指向特定的过程时,它们才变成体验本身的对象。
3.2.4生成纠缠
生成纠缠是一种试图通过诉诸大脑构建生成模型来解释意识的理论,该模型混合了关于世界状态、身体状态和我们反应性倾向的预测(Clark,2019;克拉克、弗里斯顿和威尔金森,2019年)。这种生成模型用于预测感觉流,包括来自外部环境(外部感受)、内部身体感觉(内部感受)和动作指定(本体感受)感觉流的信息(Clark,2019)。
根据生成纠缠模型,我们所体验的感受性是在-
捕捉和预测感觉流中有用模式的首选潜在变量;也就是说,一个quale的体验是一个“我是这样感觉的”的假设它们源于深层的生成纠缠,这种纠缠将关于世界客观特征的信息与关于我们自己的生理状态、我们的行动准备状态以及我们自己的长期反应倾向的信息结合起来。世界原因的生成模型的深度和广度,那些基于生成模型的预测通过一系列内感受和本体感受信息的持续变化,以及高级认知者模拟他们自己和他们自己的反应倾向的能力,都在意识的构成中起着关键作用。这表明了意识体验的核心决定因素的分级三维图像,只有在所有三个维度上都得分很高的生物才会对自己定性体验的性质和起源感到困惑(“意识体验的元难题”)。
3.2.5感觉不确定性理论
根据感觉不确定性理论(Solms,2013,2021a,2021bSolms & Friston,2018),有意识的感觉只是“它是什么样子的”,一种在给定一组稳态设定点的情况下使自由能最小化的东西,弗洛伊德称之为“驱动力”(Solms,2021a)。因此,大脑中基本意识状态的轨迹或关联(可以认为与罗森塔尔所谓的“生物意识”相对应,而不是“状态意识”(罗森塔尔,2005))是一组上部脑干结构(索姆斯,2021b)。感觉本身来源于脑干活动,特别是导水管周围灰质(PAG)和网状激活系统(Solms,2013)的脑干上部结构。感觉不确定性理论可以被解读为试图扭转以皮质为中心的意识研究方法的主导趋势,这表明皮质对意识的贡献被夸大了。在感觉不确定性理论中,意识体验的知觉内容,或“心理固体”,来自皮层结构对脑干活动的自上而下的约束作用;但是有意识的感觉本身的主要位置是在大脑皮层下。在这个观点上,意识包含了这样的关系:“我对那个有这样的感觉。”
感觉不确定性理论与野兽机器方法和IWMT相吻合——尽管在情感意识的神经解剖学基础上有一些潜在的差异(Safron,2021bSeth,2021)——因为它假设大脑包含内部身体的表征(即稳态需求或驱动以及稳态错误信号的表征)和外部身体的表征(作为行动和感知的对象)(Solms,2013)。个人被赋予了空间分布的感觉感受器,这使他们能够将自己延伸的身体作为“金属实体”形成一幅地图内在身体的情感表征对应于需求探测系统,它映射到弗洛伊德所说的本我。通过体内平衡影响调节身体的功能。身体对情感暗示作出反应,并且必须对外部世界作出非稳态的反应,以满足其稳态需求。稳态身体图主要由下丘脑周围的脑结构实现,包括分布在下丘脑复合体中的各个部分。身体的外部第三人称表示对应于表示外部对象的创成式模型的特殊部分。
根据感觉不确定性理论,外部环境的维持伴随或依赖于内部环境的维持,因为稳态感知和控制是非稳态感知和控制的先决条件。为了建立外部身体表征和大多数认知,个体利用过去事件的痕迹或记忆,这些痕迹或记忆被重新用于对未来的反事实和想象的投射。根据这一观点,大脑的相同部分参与这两个过程,即通过丘脑-皮质-丘脑回路。注视一个人的身体实现了与注视被认为是世界中的物体的其他身体相同的功能:参见,镜像神经元公式(Gallese & Goldman,1998;基尔纳、弗里斯顿和弗里斯,2007年;Rizzolatti和Craighero,2004年)。这个外部身体地图也消耗由身体感觉和运动皮层产生的运动地图。
该理论的关键方面是:( 1)在每个动作/感知周期之后,剩余稳态误差信号会聚在PAG上,其中它们的精度由当前显著性先验决定;(2)感觉到需求的优先类别(即质量);和
(3)其波动价随后被上行网状激活神经元利用,以在随后的动作/感知循环中调节代理的预期精度,从而使其成为自愿的;而(4)响应非优先化需求的并行动作/感知策略被分配固定的精度值,因此被自动执行。因此,给这一理论命名的“感觉到的不确定性”指的是一个主体对其当前优先努力自愿维持体内平衡的波动信心。
3.2.6投射意识模型
除了少数例外,自我和世界模型理论并不试图解释观点是如何产生的,或者为什么它会以这种方式显现出来。投射意识模型(PCM) (Rudrauf等人,2017;威利福德等人,2018;Williford,Bennequin和Rudrauf,2022)将意识体验的各个方面形式化,不同于基于自我建模的其他理论中的形式化;通过这样做,它捕捉到了意识体验的一些更难以捉摸的特征。具体地说,PCM将意识的透视特征和知觉的明显“零点”以及意识经验的普遍的、与“我”相关的方面(在现象学传统中有时被称为“显现的数据”)形式化。PCM的支持者建议使用3D射影几何的数学,特别是射影变换组,来提供第一人称经验的透视特征和我们对明显欧几里得三维世界的经验之间迄今缺失的联系。根据PCM,观点中介的感觉取样是在认知价值或预期信息的基础上进行的,这些信息是通过相对于给定的一组目标采用一个观点而不是另一个观点或通过看这个而不是那个而获得的。PCM解释了涉及认知、感知、想象和行动计划的注意力捕捉方面的视角中介。按照FEP的说法,PCM解释了支持隐蔽行动的认知值的视角调制(Friston et al .,2015;Pezzulo等人,2016年)。
像IWMT (Safron,2021a)一样,PCM也包含G(N)WT的一些核心方面
(Rudrauf等人,2017;Williford等人,2018年),但根据具体化代理的前提条件对它们进行了重铸。根据PCM的说法,投影几何对于定义全球工作空间的“形状”或几何形状至关重要,因为所有感知模式都被集成到一个以“原点”为中心的透视框架中(例如,正如(胡塞尔,1997,2019)所说,一个人从“这里”或“零点”看到和听到狗叫),所有行动的规划都考虑到了这种透视调解(例如,一个人想象汽车发动机的故障从汽车下面比从上面更容易察觉)
根据PCM,意识的透视本质基本上与化身的经验和一个有意识的主体的“活的”空间性有关。PCM扩展了刚刚讨论过的理论,它以数学的方式将意识体验的透视方面和在欧几里得世界模型上操作的透视过程正式化。空间性被带到了前台,射影几何被用来解释一个有意识的代理人的活的化身如何与环境的结构相关联。PCM也解释了“活的起源”的不确定性——世界对一个“主体”显现,而这个“主体”本身在可感知的世界中不是一个完全可定位的对象。PCM的支持者也认为类似于自建模的东西(即前反射自我意识,自我表现或自我认识的最小形式)可以从PCM (Williford,Bennequin,& Rudrauf,2022)中导出,因此PCM提供了自我和主观性的一些主要方面的形式模型。
3.2.7与内部屏幕模型的关系
根据内部屏幕模型,与深度嵌套的马尔可夫毯相关联的隐蔽行动的种类允许代理有选择地关注各种存在状态(例如,感觉和知觉)的内部和外部证据来源,以足够粗粒度、抽象和灵活的格式来表示,以实现计划和控制。这种注意力分配的过程实现了一种内感受性自我建模的形式,呼应了野兽机器、自我(和世界)建模以及感觉不确定性理论的观点,其中自我的第一人称外观的这些基本方面通过我们自己的心理状态的内部表征而被积极地构建。因此,根据提出的MUM,自我建模和(自我在)世界建模可以说是意识的核心组成部分。
自我可以从第一人称视角建模(如在自我建模中:自我是各种内感受感官状态的恒定场所),也可以从第三人称视角建模(如当自我在世界建模中被表示为许多对象中的一个对象时)。自我在物理上位于世界中,因为它被具体化了,因此意识系统也必须模拟他们居住的世界。自我模型和世界模型有一个(深层的)时间结构,它利用了内部过程和外部事件状态之间的因果依赖关系。通过这种因果结构,意识获得了一种视角,指导事件在空间和时间中的因果流动,并允许有意识的主体在超越当前时刻的时间尺度上进行规划(Chouraqui,2011;埃德尔曼,2001年;弗里斯顿,2018)。
在我们一直在讨论的候选MUM中,内部马尔科夫毯(或量子公式中的内部屏蔽)代表了一个边界,系统内的“粒子”可以在该边界上读取和写入信息,从而创建一个统计结构,该结构基于那些粒子和它们的(共享)环境之间的相互作用而不断更新。这个过程包括在野兽机器方法中生成关于行动的预测(Seth & Tsakiris,2018年),其中大脑利用一个生成模型,该模型具有一组关于什么可能导致内感受性感觉信号的先验信念。管理内部屏幕上的信息流与管理beast machine方法和IWMT扩展(Safron,2021a)中的预测误差的过程完全相同,其中有意识的感知来自于最小化行动期间的本体感受预测误差。
此外,对具身动作的关注——也就是有意移动身体——与提出的MUM自然吻合,其中内部屏幕的活动状态因果地干预较低水平的处理,导致可以被视为一种精神行为的东西。这种由注意力集合实例化的精神活动,很可能是身体有意运动的一种情况,正如野兽机器理论和相关方法中所讨论的那样。
内部屏幕模型还为理解我们的自我感觉在波动的感觉运动过程中的稳定性提供了理论基础,因为内部马尔科夫毯本身(内部屏幕)保持稳定,而毯的统计结构的持续更新反映了运动行为的更短暂的性质。因此,在beast机器中强调的生理动态平衡,感觉到了不确定性,而类似的方法可能与MUM中内在屏幕的持久性有关。由MUM放置的内部屏幕可以进一步被视为一个透明的边界,只有当信息被写入它时,它的存在才变得明显——类似于beast machine方法中将注意力引向特定身体过程的过程。
感觉不确定性理论专注于大脑中央深处协调皮层和皮层下动态的皮层下系统。这可以在内部屏幕模型中理解为由皮层表征(“心理固体”)规定的一种精确称重形式的实现。感觉的不确定性突出了精神活动的执行方面和皮层下结构在对皮层动力学的因果干预中的关键作用,这对于感觉的不确定性来说可能是必要的,也可能不是必要的。这种强调是基于神经心理学的经验证据,这表明对非常小的皮质下区域的损害会损害意识。有一个例子可以证明,与此相反,意识——临床评估——可以在没有大面积皮层的情况下保持基本完整(参见,例如,Merker,2007;Solms,2013年)。(然而,请注意,对这些发现的解释表明意识有足够的脑干基础,这一点存在争议(Safron,2021b)。)
最后,PCM提供了一个主观性和观点的正式帐户,作为投射媒介的世界建模。这种建模允许代理有选择地查询外部世界的特定方面,并对该世界构建主观视角。这种询问是基于通过朝这个方向而不是那个方向看,或者从这个或那个角度看,解决了多少不确定性——允许代理专注于感觉中枢的特定方面,
表现物体或事件——更重要的是,通过不突出它们来主动忽略其他人。对世界进行采样是由人们可能由此收集的信息的预期价值来指导的这一想法,当然是FEP在基层所采纳的不证自明的一个关键方面。PCM中描述的超个人世界模型是主体建立自我意识的基础之一,也是取样发生的参照系。
内部屏幕模型中呼吁的那种隐蔽(心理)行为是PCM账户的组成部分。事实上,一种自我证明是对世界的扫视取样,这是一种公开的(认知的)行为。在部署PCM进行(隐蔽的)透视拍摄时,同样的机制是隐含的。因此,MUM恢复了PCM账户的核心原则;通过在内部屏幕上主动读写来实现。因此,全局工作空间中编码的“实时”数据被推理系统解释为欧几里德世界模型的投影表面。这个过程实现认知行为或觅食,基于其认知价值,从新的视角获得信息的分数。提出的MUM可能很少直接涉及PCM提出的意识的具体投影几何结构,但只是稍微更一般地,类似于感知的康德式处理(将欧几里得空间和时间视为强加于“原始”感官数据的类别)的东西可以直接从激发内部屏幕模型的全息原理中恢复(Fields,Glazebrook,& Marcianò,2023)。然而,如果投射群确实以欧几里德群所不能的方式促进认知觅食(见(Sergeant-Perthuis等人,2023)),并因此有助于最小化自由能,那么意识的投射结构就可以被推导出来
更直接地来自这里提出的MUM。
3.3时间意识的计算现象学
时间的概念可以从主观和客观两方面来理解。主观时间是指个体对时间性的个人体验,它因人而异,并受情绪、注意力、大脑功能和精神药理学等因素的影响。相比之下,客观时间,虽然仍然是观察者相对的,但根据明确的主体间标准是可测量的(Mensch,2010)。
自从20世纪初的开创性工作以来——特别是胡塞尔(胡塞尔,2019)、詹姆斯(詹姆斯,1892)和柏格森(柏格森,2014)——主观时间的一个方面已经被前景化。这就是“似是而非的当下”,指的是个人对时间的意识体验的时间“厚度”。这一概念表明,当前时刻不是一个离散的时间点,而是一个被视为连续流动的持续时间(相比之下,客观时间最终仍可被划分为离散的可测量单位,如秒和分)。在现象学的说法中,最重要的是描述经验对象(包括自我,只要它能被经验)被揭示给意识的方式,或者在第一人称经验的时间流动中“构成”的方式。在早期的现象学作品(胡塞尔,2019)中,似是而非的现在已经与“原始印象”、“保留”和“保护”的概念联系起来,这些概念指的是个体的即时和未解释的感官体验,以及它们隐含的,
分别在线回忆过去和未来。这些主题在哲学诠释学的后期作品中被采用(伽达默尔,2013;海德格尔,2010),认为我们对世界的现象学体验是解释过程的结果。根据这种观点,有意识的体验总是包含一种对未来的预期或“投射”(德语:Entwurf),以及一种“关心”或“关心”(德语:Sorge)——人们可能会称之为“给予一个该死的东西”。因此,我们体验的内容是由我们期望体验世界的方式,以及对我们作为有意识的代理人来说重要的事情来塑造的。最近,有人提出,似是而非的现在可以被理解为一个马尔科夫毯结构,过去和现在之间的因果耦合通过马尔科夫毯的连续性被整合(Albarracin等人,2022;波哥大和杰布巴拉,2023年)。在这个交叉点上的初步概念工作已经探索了这样一种想法,即可以使用主动推理的深层生成模型来探索解释学所描述的关注或关怀(Ramstead等人,2020)。进一步的工作探索了这样一种观点,即现象学家所描述的构成或解释的过程,可以用生成模型的技术来描述,作为一种(主动)推理的形式(拉姆斯泰德
等人,2022)。
3.3.1与内部屏幕模型的关系
这里提出的MUM的发生方面与最近关于时间意识的工作联系在一起。事实上,这个模型与我们是“选择机器”的想法是一致的,我们能够“预测自己的存在”。根据这种观点,某些类型的大脑能够根据对未来结果的预测来选择行动路线。这就要求系统将未来的感觉视为随机变量,并对未来抱有信念以指导其行动。总的来说,意识体验的层次结构和时间结构反映了马尔科夫毯系统对未来事件的预测和准备,帮助我们导航世界并理解我们的经历。
当我们做计划时,我们会将我们的信念延伸到未来——或远或近——以便最大化预期的信息增益或最小化预期的自由能(至少,从外面看起来是这样的)。这与显著性的概念很好地联系在一起,在预期信息增益方面兑现,这支持了主动感知(Ferro等人,2010;弗里斯顿等人,2015;Parr & Friston,2017,2019a,2019b)。因此,如果这种有意识的处理依赖于行动,那么就必须有一个生成模型来规定这种行动;这意味着代理必须有一个未来的生成模型;反过来,这意味着时间和暂时性已经融入了作为一个代理人的定义中。
时间的主观体验与记忆密切相关,因为我们对过去、现在和未来的感知是由我们存储在记忆中的事件形成的(Parr & Friston,2017)。事实上,时间、感知和记忆之间的联系直接来自FEP形式主义的量子信息理论版本中物理相互作用的对称性(Fields等人,2022;Fields,glaze brook & marcianò,2022年)。这种对时间意识的理解对我们的理解有着重要的意义
个人如何感知和体验世界,以及他们如何根据他们对时间和记忆的理解来做决定。它也有实际的应用,如在技术设计或活动规划中,在塑造个人体验时考虑时间和记忆之间的关系是至关重要的。见下文和(Fountas等人,2022年)。
我们进一步建议,任何MUM都应该(并且很可能必须)解决意识的时间方面。虽然有些人认为存在精神状态,如迷幻药和先进的冥想练习诱导的精神状态,没有时间特性,但这种说法也有可能将一个(潜在的非常)薄的当前时刻与持续时间的完全缺失混为一谈(Deane,2021;Fountas等人,2022年)。在任何情况下,时间的经验显然是人类意识模式的一个基本特征。当然,时间性也存在于其他意识理论中:例如,IWMT假定时间一致性是意识的先决条件(Safron,2022b),并提出了通过时间导航的神经计算基底(Safron,atal,& Tim,2022)。然而,为了解决这些有争议的意识经验的本质属性,可能需要关注时间意识的更丰富的现象学(例如,胡塞尔)解释。
表1:基于FEP的意识模型
意识模型 |
描述 |
全球工作空间理论(GWT) |
意识是大脑向全球处理资源网络传播信息的能力的结果 |
投射意识模型 |
意识涉及到一种射影几何,它基于大脑对世界的生成模型,支持感官取样 |
贝叶斯注意图式理论 |
有意识的感知是由部署稀疏注意力图式的能力形成的,该图式代表传入的感觉信息,并涉及概率推理过程 |
贝叶斯全球工作空间理论 |
意识是一个动态过程的结果,在这个过程中,大脑为当前的感觉输入选择最可能的假设,允许它预测和预期未来需要的感觉输入,并允许相关信息选择性地传播到全球工作空间 |
野兽机器接近 |
意识来自大脑的预测处理,包括生成世界模型,并根据传入的感官信息不断更新它们 |
生成纠缠 |
大脑构建了一个与自身的生理状态、反应倾向和行动准备状态纠缠在一起的世界生成模型,这是意识体验形成的一个重要方面 |
整合世界建模理论(IWMT) |
意识产生于创造和更新时空和因果连贯的世界模型的能力,包括自我和他们与发现/创造自我的环境的关系 |
自我建模理论 |
意识产生于大脑模拟和表现具体自我的能力,包括它的情感、欲望和意图 |
感觉不确定性理论 |
意识是大脑需要最小化其内部世界模型中的自由能或不确定性的结果,并与支持自愿行动的情感体验相关联 |
时间意识的计算现象学 |
经验是由大脑对知识和过去经验的深层分级收集形成的,可以理解为过去和现在之间具有因果路径的马尔可夫毯结构。 |
3.4摘要
总之,我们已经论证了意识的“内屏”模型(Fields,Glaze- brook,& Levin,2021;Ramstead et al .,2023)貌似是意识研究的MUM。虽然我们的综述特别关注了明确基于自由能原理的意识研究方法,但这些方法包括非常普遍且被广泛接受的意识理论化范式的变体(如自我建模和GWT),其中许多通用特征也包含在我们提出的MUM中。1作为该MUM的基本架构提出的嵌套信念更新或自我证明(Hohwy,2016)具有四个关键特征:
•时间厚度:作为推理的隐含计划需要一个行动结果的生成模型。因为结果晚于原因,这意味着未来的生成模型;即超越现在并获得时间深度或厚度的生成模型(Albarracin等人,2022;舒拉奎,2011年;Kirchhoff等人,2018)。从这个角度来看,意识是一个信念更新的过程,发生在一个物理实现的环境中,比如大脑。这种认识必须概括或反映感知世界的因果结构。这个要求只是FEP的一个陈述,并暗示着对着意识加工的马尔可夫链系统在本质上必须是有层次的。
•行动选择:计划意味着从一系列可能的未来路径中选择一个最有可能的(公开的或隐蔽的)行动过程。这意味着在反事实的未来中有一个隐含的选择,所有这一切都取决于代理人的信念(Corcoran,Pezzulo,& Hohwy,2020;Limanowski & Friston,2018;帕尔,佩祖洛和弗里斯顿,2022年;Seth,2015)。
•代理:根据定义,拥有时间厚度和行动选择特征的事物可以被解释为代理,因为它们具有特征行为;也就是说,他们选择具有明确认知需求和偏好的行动路线(Friston et al .,2015;赛义德等人,2021年)。
•Qualia:行动是上下文敏感的,因为它必须以隐含生成模型中的“精神状态”为条件。换句话说,计划建立在一个推断的基础上
还有一个论点是,任何与物理主义相一致的意识理论也应该与FEP相一致——尽管推进这个论点很可能是对唱诗班说教。
语境。这种情境是一种信念状态,易于将行动情境化;例如注意力集合。这可以用“Bayesing qualia”(Clark,Friston和Wilkinson,2019年)来解释。也就是说,拥有定性体验的想法本身就是一个假设,它能最好地解释一个人的马尔科夫毯上的感官印象——一个解释为什么“我关注这个或那个”的推论。然而,即使不与对定性特征的强有力的表征主义的承诺配对,内屏模型也有解释第一人称体验的不寻常特征的资源,这些特征激发了质的概念。也就是说,它根据写在内部屏幕上的经典信息来兑现主观经验,这些信息不需要(并且为了限制复杂性,通常不会——参见(Weisberg,2023))对关于其内在物理构造或其与其他物理状态的关系的详细信息进行编码,这些信息通常与成功指导行动的目的无关。
3.5最小统一模型和经验预测
虽然科学理论需要经验验证,但还不清楚这是否是建立内部筛选模型作为MUM的必要条件。事实上,MUM可以理解为一个综合框架,其解释力在于它的简约。目前的综合是通过结合先前存在的意识模型发展起来的,因此,利用了这些理论的证据基础。因此,我们的提案的内部一致性以及与其他得到良好支持的模型/框架的协调程度可以被视为对我们框架的(趋同)有效性的测试。
当然,为了避免事后解释,需要新的假设。我们认为,我们的MUM需要一些关键的经验预测,这些预测在(Ramstead等人,2023年)中有更详细的讨论。其中最主要的是存在一个不可约的内部马尔科夫毯,在我们看来,这是意识的必要前提。为一种“笛卡尔剧院”确定一个神经生理位点,在那里形成认知再现——或者整合并广泛“传播”——对许多(但不是所有)理论家和实验家来说确实是既新颖又令人惊讶的。
3.6投射和意识
被提议的意识MUM整合了“投射”一词的四种意义:
1.投影在某种意义上类似于其通常使用的投影到屏幕上(参见“笛卡儿剧院”)
2.投影作为投影变换群的运算(一种数学群作用)
3.投射是信息在大脑中的传播(全球工作空间)
4.作为对未来的反事实或想象的投射(主动推理)。
投影的第一个概念唤起了屏幕的概念,正如FEP的全息信息论版本下的马尔可夫链公式所描述的那样。从这个意义上说,任何马尔科夫毯都是信息“投射”的边界,就像隐喻的电影屏幕或剧院舞台一样。当然,投影隐喻并不需要引导我们假设一个与屏幕本身不同的内在“观察者”的存在——一种经典的人类文化,或机器中的“小人”。在这里,“观察”应该从“物理相互作用”的量子意义上来理解,即信息从一组嵌套的相互作用的屏幕中流出或流入。
投影的第二个意义调用了投影变换组,它描述了保持投影空间结构的数学变换,这种几何结构捕捉了意识和主观性的透视方面。
第三种投射感是信息在大脑中“投射”的想法,正如全球工作空间理论所阐述的那样。从这个意义上说,马尔可夫毯充当了一种机制,使信息可用于大脑的不同部分,允许它在证据积累和(贝叶斯)信念更新的意义上进行整合。
第四种投射感是海德格尔的“投射”思想(Entwurf),指的是意识的预期动态在不同的时间尺度上展开(海德格尔,2010),从最近的(参见胡塞尔的“保护”);参见(Albarracin等人,2022))至最远端(参见Sartrean“项目”);(萨特、里士满和莫兰,2022年)。从这个意义上说,定义马尔可夫链的条件依赖作为一种结构,使我们能够预测未来的事件并为其做准备,帮助我们在世界中导航,并对我们的经历进行时间和叙事意义上的理解。
3.7结论
简而言之,我们所考虑的意识沉默表明,马尔科夫毯在我们感知世界和与世界互动的方式中发挥着核心作用,使我们能够构建现实的连贯模型。目前的综合建立在(或多或少)意识模型的基础上,因此,利用了这些理论的证据基础。在前文中,我们对以FEP为前提的意识模型的文献进行了选择性的回顾,并在此过程中考虑了现存的意识理论如何被解读为所提出的模型的重要方面。
最后,我们讨论了“投射”的多种意义如何与有意识的处理过程相结合。我们认为,这种多义性反映的不仅仅是令人愉快的语义巧合。更确切地说,它反映了内部屏幕模型可以允许一种整合的方式,这种整合能够处理关于核心功能的统一的意识现象,以及它们复杂的表现形式。我们相信,这正是MUM所需要的,作为一个框架,它能够以允许跨个人的意义融合的方式汇集多种观点
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”
原文链接:https://blog.csdn.net/cf2SudS8x8F0v/article/details/134024975?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522169900313816800182720168%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fblog.%2522%257D&request_id=169900313816800182720168&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~first_rank_ecpm_v1~times_rank-10-134024975-null-null.nonecase&utm_term=%E6%BE%B3%E6%B4%B22023