前端状态管理设计——优雅与妥协的艺术

on 2020-05-22 | by frustigor 关注作者

如果我仍然去解释什么是状态管理器，为什么我们需要它，这篇文章将会索然无味。我的想法是，我们原本不需要状态管理器，但我们确实需要状态管理。

前端状态管理

非要去深究“状态”这个词，从后端服务的角度去解释更加能让我们理解。一言概之，我自以为是地总结，“状态”的意思就是：现在的样子。一个服务现在的样子主要是由运行时所产生的内存和运算决定的，而且，它有终极的时间观念，理论上任何时刻的状态都不同，因为它内部必然会有即使细微的变化。

前端状态管理这个概念出现之前，就已经有状态管理的实践了。我在2010年开始使用jquery，这是一个非常了不起的库，它将复杂的DOM操作，通过简化和封装，成为实质上的行业标准。HTML5标准发布后，采用了querySelector这个接口，可以说它完全是基于开发者对jquery的认可度的考虑。那这和状态管理有什么关系呢？我想说的是，在jquery的年代，虽然“前端状态管理”这个概念还没有产生，但是状态管理确真实存在。我们用一段基于jquery的伪代码来看看。

我们在实践中，使用dataset的特性，直接在被操作的DOM节点上对一个模态框的隐现状态进行管理。而在其他地方，我们可能会读出这个状态值，用来判断是否要执行某些操作。

你看到的这种操作，在我们将“前端状态管理”的概念抽象化之前，几乎随处可见。当然，这是一种原始的状态管理，它只能处理单一的、分散的、临时的状态，无法对复杂的、耦合（依赖）的、持久的状态进行深度处理，或者说处理起来很麻烦。其中的典型案例就是我多次提及的表单业务，在一个表单业务中使用jquery进行开发，所有的表单数据，必须分散的、随意的，提交的时候，必须从很多个地方把这些数据找出来，甚至还比较难找。

我们不禁要问：状态管理的本质是什么？起码，在这一阶段，我们已经知道一个事实：

# 某一状态能够被有效记录。

我大学本科和硕士所属专业的大类学科是管理学，不同专业对管理的解释不同，而对我而言，记录则是一种有效管理。就像jquery时代，我们找到一种虽然原始，但行得通的方式管理状态。

但是，我们往往发现，我们正在实践的东西，有些是非常优秀的，但是，必须等到很多年（3-5年）之后，被其他团队的某个项目带热之后，才证明我们正在实践的东西是对的，是走在趋势上的，然而我们没有坚持到最后，因为最后我们采用了市面上最热门的框架或库。超前的东西往往一开始有很多人同时实践，但是随着时间流逝，这些实践的人中，很多退出了，在沉寂的发展中，会有一些坚持下来的团队，最终成为主流，比如angularjs团队。但不要着急，在angularjs还默默无闻时，甚至已经初露端倪时，仍然还是jquery的天下，直接对DOM节点操作的前端编程范式持续了至少6年，直到react提出virtual dom这样先进的理念之后，jquery才逐渐淡出历史舞台。angularjs团队至始至终都没有超出jquery的统治高度。

没有超出jquery统治高度的，还有backbone。我也多次提到过这个库，它至今还活着，你可以通过这里查看它的文档。backbone的成就核心在于它的Model（backbone是一个真正意义上的前端框架，但是它不处理view部分，它提供了view的编程范式，但你需要使用jquery来完成所有view的更新）。我们来看一个例子吧。

backbone中可没有我们现在熟知各种花里胡哨的操作方式，对于模型实例中的状态，只能通过get进行获取，通过set进行修改，set也支持传入对象批量修改。而它最大的亮点，在于模型上的on方法，这个方法实现了状态管理的一个质变。

# 状态的变化能被有效感知和响应。

on/off这对监听方法来源于jquery，但超越了jquery。jquery中只针对DOM的事件系统，而backbone可以脱离DOM，对数据变化进行监听。当数据的变化被监听之后，就可以在监听函数中对view进行修改，而对于事件的响应，只需要调用set方法修改数据。这样就做到了数据和界面代码的分离解耦，是一大进步。但backbone也止步于此。

使用set/get这种接口方法显然是一种妥协，而且不符合习惯的还有必须加一个change:前缀，以和普通事件区分。如果回到2018年去重新设计backbone，get可以做依赖收集，监听可以被优化，即使仍然采用set/get接口，而不采用defineProperty这样的黑魔法，也可以再进一步，然而，时代终将止步于该止步之处。

对于开发者而言，虽然可以通过对状态变化的监听，来实现状态和界面代码分离，却最终只能通过set/get这样的方法接口进行数据操作，有违编程的优雅。在这条路上，angularjs走的更远。同样是基于jquery打下的江山，backbone也是框架，angularjs也是框架，然而当我们如今回头去看，虽然angularjs也没有爆红，却踏踏实实的，成为一代框架典范，成为前端工程化之鼻祖，同时，也是前端状态管理的一大遗憾。

如果你使用过angularjs，你会喜欢上它，当然前提是在那个年代。它通过一套被称为脏检查机制的响应系统，让开发者可以通过直接修改状态属性值，就可以改变界面。我们来看下代码。

$scope 是angularjs的内置服务，为了避免一些作用域问题，推荐使用controllerAs来管理。但我们且不去讨论这些问题，我们看angularjs的代码，已然见到来当代所熟悉的编程风格了。我们可以把$scope当作是一个状态的容器，状态变化，会通过angularjs的响应系统，反馈到界面上去，view中所使用的数据素材，和$scope上的属性名完全对应。

# 状态的改变能驱动界面的变化。

angularjs的实现原理是，在ng-click的触发之后，除了调用执行$scope.updateName之外，实际上还要执行内部的digest循环过程，也就是脏检查的内部实现。只有经历完这个digest之后，才能更新视图界面。那么问题就由此而生，在有些情况下，这个digest确实没有被触发，举个例子，在原生的ajax请求结束时修改$scope.name就无法触发，于是angularjs提供了$apply方法解决这个问题。

不过，一个angularjs的应用，它的controller逐渐膨胀，慢慢的随着业务逻辑的增长，一个function被撑到上千行代码也有可能。而在这上千行代码中，要找到一个状态以及这个状态的变化过程，犹如在大海中寻找绣花针般，无计可施。

问题出在哪里呢？直到今天，angular已经迭代，旧版本几乎已经停止维护，这个问题仍然没有被回答。我个人猜测，最本质的根源在于，angularjs没有按照严格的MVC进行设计，它缺失了M层，所有的编程逻辑被写在controller函数中，任由开发者自由发挥，修改状态来驱动视图更新。由于没有对Model层进行强约束，导致代码里根本分不清哪些是用于控制视图变化的交互逻辑，哪些是用于控制数据变化的业务逻辑。而这个问题，在后来的react、vue中其实也存在。

一个更严重的问题，angularjs的directive（相当于组件）支持双向数据绑定，导致外层状态在内层directive中被修改，在调试问题时，由于无法掌握状态变化的顺序，使开发者可以崩溃到砸电脑状态。并且随着W3C标准的推进，“组件”这个概念开始慢慢成为开发的核心概念。而于此同时，同样基于组件思想而生的react就像横空出世一样，像一记银弹击碎了jquery多年美梦，从此前端编程范式实现了转变。

react的编程范式核心来自virtual dom，虚拟DOM的思想直接使得前端编程范式发生转变。通过将DOM树映射到一个内存对象，通过对虚拟DOM的对比，只更新实际DOM中的少量节点，从而避免频繁操作DOM带来的性能损耗。但virtual dom的杀手锏在于，将实际的DOM抽象为虚拟DOM之后，虚拟DOM是否再回到实际DOM就是可选择的事情，因为基于这套理论，虚拟DOM还可以为其他渲染方式提供驱动力，比如react-native，或者渲染canvas。而驱动virtual dom发生变化的，竟然是状态。这是一个颠覆性的质变。

react一直提倡一种纯UI组件，这种组件完全受控于其接收的props的值，像纯函数一样，props在解构全等的情况下，其渲染出来的效果是一模一样。而支配props变化的，来自于顶层组件一层一层的传递。最终，一个界面将要展示成什么样子，取决于一个状态，由这个状态参与组成虚拟DOM，并反映到真实DOM中去。状态发生变化时，按照一层一层传递的单向数据流方式，让所有的自组件按照最顶层组件的状态进行渲染。

# 界面是状态的映射。

在这种思想熏陶下，大约2016年，整个前端的编程范式都以此为基础，所涌现出来的vue，也直接借鉴这套思想进行编程。一个状态，对应一个界面，这简直是天才的想法。基于这种思想，把所有的状态按照时间线录制下来，就可以重放界面变化的所有，这种录制，将原本庞大的界面数据，抽象为状态这一小量数据，这种思维在游戏录制领域也被使用过。

诚然，虽然“映射”思想颠覆了传统前端编程更新DOM的范式，但react的编程范式所遵循的单向数据流却带来了巨大麻烦。这种一层一层传递的方式，虽然保证了“映射”行为的纯正性，但无法适应实际生产过程中所带来的coding和debug麻烦的问题。如果由于一个点击操作需要通过10层组件的传递，才能对点击做出响应，那么很可能就会出问题。单向数据流听起来让数据流很清晰，但是对应到代码中，发生一个事件发生后，这个事件信息，被如何传递，成为极其复杂的代码逻辑，那么看似明晰的清流，就变成了汹涌的浊流。

中心化的状态管理孕育而生，redux、mobx这些都是佼佼者。这些，就是我们当代真正意义上所称的状态管理器。它们当然是为了管理状态。redux是一朵奇葩，它火，火到爆炸，但是你去阅读它的源码，却又很简单。大道至简，在这些年的编程体验中，我逐渐体会到，简单，是一切的根本。redux的使用非常简单，接口就那么几个。然而，它却衍生出了自己的生态，它把自己的概念体系发展成为蓬勃的森林。我的天！原本简单的东西，非要通过概念复杂化。设计，核心是简单，工具，用完即走就行。同样的错误，mobx重蹈覆辙。它的设计理念也非常的具有颠覆性，引入观察者模式，将状态的变化通过观察者模式进行抽象，并且通过完美的封装，使得更新状态的方式和普通修改一个对象没有两样。然而，过渡设计让开发者望而却步。不过话说回来，在状态管理这个点上，它们的核心思想保持了一致，都是：

# 集中管理状态，共享状态。

集中管理实际上是共享的前提，但也超越了共享这一单项功能，集中管理状态，可以用一个状态，概括一组组件，甚至一个应用的整体状态。在映射思维驱动之下，连路由也要状态化，也就是说，整个应用的一切行为都由中心化的状态管理器决定。框架层、UI层只是应用的壳，而状态以及状态的驱动才是应用的魂。状态管理器，通过连接器将状态的变化反馈到具体的某个组件中，而这个组件，可以通过原本的单向数据流将状态传入更深的子组件中。UI层像提线木偶一样，被状态管理器完完全全的控制着。

然而，物极必反。react官方提出来的flux，本身就打破了单向数据流的体系，它使数据可以通过多条管道进行传递，而它的核心，就是要建立一条便捷通道，跨过多层组件，使分散在两个树枝上的节点组件直接通信。虽然flux通过非常复杂的概念，试图解释自己是遵循单向数据流，但是不可否认，它只是在原来的单向流之外，又开了一条流，现在有两条通道，但你只能选择其中之一，这样你才能单向数据流，从而保证界面和状态之间的映射关系。而且，基于context的技术是react官方给出的，flux是妥协的产物，它是为了解决react带来的问题而产生的，而很不幸，为了解决这个问题，flux带来了更多的问题，妥协，本质上是债务。

更致命的是，中心化的状态管理面临严重的问题。状态，本身是必要的。状态解决了临时保持和最终决定两个环节的冲突，以HTML中的select标签（本质就是一个组件）为例子，哪一个option被选中了呢？这得看当前select的状态，但这并不代表当前被选中的值将作为你最终提交的值，你提交的值，往往是看不见的option的value属性值。同样的情况比比皆是，例如你需要打开一个模态框，在里面输入东西，或者选择选项，但是模态框会给你一个cancel的能力，当你点击cancel的时候，之前的操作会被重置。而这些临时保持的状态，根本没有必要进入中心化管理的状态管理器中，一旦进入中心化状态管理器，那么就遇到内存持久不能释放，还要解决数据重置等问题。但尴尬的场景又在于，如果不进中心化状态管理器，那映射思想又无法完全实现，一个状态一定对应一个界面的理想模式无法复现。这个问题，只要是共享数据，都会碰到，不一定是共享状态，共享一个函数，共享一个模块，共享一个类的实例，都会遇到，所以，这是共享问题带来的普遍性问题。

还有一个大问题，集中管理状态的代价是状态的domain问题。一份完整的状态确实好处多多，但是带来的问题是，原本和组件无关的状态变化，也会因为状态整体的变化被通知重新执行virtual dom的diff操作。不过这是有办法解决的，无论是通过状态管理器自身的优化也好，还是通过组件的优化也好，都可以做到根据需要的状态变化来决定自身是否要做这个diff。可是大状态始终是个隐患，不仅面临内存问题，也面临数据重复、难相互依赖等问题。

直到react hooks出现，这个局面又被打破。hooks虽然表面上是让functional组件也可以在不同的生命周期环节上执行某些任务，但是本质上是重新定义组件在什么情况下重新diff。hooks函数的重点不在第一个参数，而在第二个参数（依赖）。当依赖发生变化时，需要执行对应的变化。变化源自状态的变化。hooks依赖状态，但是实际上定义的是动作及其触发的条件。

# 状态不是状态，而是动作。

从更小粒度去解释，视图层的每一个变化，是完成什么动作。这就是hooks带来的变化。这个粒度小到什么程度呢？atom。Recoil是facebook发布的一个状态管理工具，基于hooks的技术，实现状态共享。和集中管理状态不同，recoil是小到原子级别的状态管理。通过atom定义一个原子状态，通过selector定义一个依赖原子状态的复合状态（相当于计算属性），再依托hooks，实现状态共享。由atom定义的原子状态，它的状态到底是什么并不重要，我们不需要取出来看看，我们要做的，是在hooks加持下，把握住状态变化的所带来的影响，也就是每一个动作。

听上去就像在胡扯，事情会变得越来越复杂。设计，核心是简单。这里的简单，不单单是使用起来很简单，而且理解起来也要很简单。对于一个工具而言，我们要止于至简。我们追求简单，但防止过犹不及。在设计工具时，有的时候，我们可以设计出超强超灵活的能力，但是，超出简单部分的功能，往往使得使用成本和理解成本极速上升。状态管理器的本质，是管理状态，是共享状态。过度设计，过度技术化，都是过犹不及。当recoil发布的时候，大家开始讨论actor model，这是过犹不及。我们做开发设计，并非遵循某个模型进行设计，而是遵循使用者的使用习惯进行设计。当然，我不是说要迁就使用者，而是说让使用者付出最低的成本得到最高的回报，简单原则是达到这一目标的终极武器。为了简单，我们有的时候不得不放弃一些原本可以让工具更强大的能力，但是不要着急，这给我们开发工具提出了另外一个要求，就是扩展性。简单是对使用者说的，而扩展性则是对开发者说的。通过扩展性，简单工具可以变成功能强大的功能，扩展性设计是考验能力的，并非每个开发者都能做到，但是，这是基本面。

挑选优质特性

应用没有“有意识地管理状态”并非不行，以最早的jquery.data方式管理一个状态也未尝不可。但如果需要有意识的进行状态管理，那么，我们不得不需要一个状态管理器。虽然我们可以挑选市面上已有的状态管理器，但我们可能并不需要。我认为redux之所以经久不衰，核心的核心就在于简单。然而，并不是简单我们就一定要用它，如果它的简单正好符合我们的实践场景，那么它是不二之选，但是它的简单在应对我们的场景的时候略有不足，由于木桶原理，它将永远无法满足我们的要求。所以，手撸状态管理器在所难免。

当然，我们手撸，并不代表我们要全撸，例如，我们可以基于已有的redux，利用它的扩展性，撸出自己的状态管理器。然而核心要点还是在于，如何提供低成本的使用者开发体验。我们基于redux撸出来的，我们可以另外取一个名字，将我们的用法和接口暴露给使用者，我们全然不提redux，使用者但凡用的舒服，没有吐槽，就代表这是成功的，此时我们再提redux，会让我们的成果充满乐趣。而如果一开始就大书特书我们是基于redux的，想加持光环，那么得到的结果必然是，如若不是真的好用到爆炸，断然收不到好评。

既然要开始撸状态管理器，我们就要设计这个状态管理器的核心特质，缺少这些特质会是我们自己都无法忍受的。

简洁的状态定义，拒绝reducer 状态domain，拒绝庞大状态树的细小变动都惊动整个virtual dom重新计算回溯能力，可撤销变化重放能力，整个应用可以根据时间线完整播放局部状态可销毁，以释放内存局部的共享，基于某一系列流程的临时状态，当这一系列流程结束时，共享状态可销毁同时支持hooks和class components 简洁的状态更新方式，深层节点更新不需要写非常复杂的解构优雅的异步支持

其中，简洁的状态更新方式有一个库可以推荐：immer。这个库只有一个接口，它的使用方式如下：

大道至简！大道至简！大道至简！immer的作者简直就是天才。使用immer遵循了immutable的社区范式，同时又可以采用mutable的操作方式，虽然在实战中确实还有些坑，然而，对比原本写一大堆解构符号的做法，这个接口简直是上帝的馈赠。

还有一个点需要单独指出，重放功能实际上并不是强制的，因为对于大多数应用而言，要实现完全的重放，其实是不大可能的，最严重的原因有两点：1）我们无法穿透所有组件，在大部分组件中，我们不可避免的会用到内部状态，而这些内部状态的变化我们无法收集到，因此，也就无法重放由于组件的内部状态变化带来的界面变化，一旦无法重放界面变化，就会出现问题，因为DOM的变化具有副作用，下一个DOM树的基础是上一个DOM树，如果某些变化没有发生，后续变化所依赖的DOM节点可能根本就不存在，应用会报错；2）在状态中，我们不可避免的使用某些实例对象，基于class的实例对象有内存依赖，我们无法将它们保存到服务器端，再从服务器端拉出来进行回放。由于这两个原因，实际上要完全回放一个应用，是很难的。

有没有其他方向？

有的。我们谈状态管理，本质上无法摆脱应用层面的架构思维，而且这里仅仅是指围绕数据流的前端应用（Management System、Data Application），我们几乎很少在游戏这种视觉系统中大谈前端状态管理。既然是Management System，那么我不禁要问，状态管理的目的，是技术的，还是应用的？很显然，状态管理的目的，是为了让应用系统良好运作，保障系统工作稳定准确。而我们要面对的实际情况是什么呢？并非如何在组件之间共享状态。我们的实际情况是，我们需要在不同子模块之间协调，甚至，我们需要在不同的客户端之间协调。这里面的核心点实际上是“业务逻辑”。如果我们同时拥有手机端和PC端应用，虽然它们在视图层面完全不同，然而在business层面，却是一定一致的，否则系统就不可靠了。如何保障业务层面的一致性呢？

对于服务端应用而言，特别是今天这个时代，分布式系统已经是基础范式了，多个节点如何保障同一个用户的业务操作是一致的，实际上，它们还是要共享一个状态，这个状态可能存在redis中，可能通过Kafka进行同步。业务逻辑的推进，依赖这些状态。看看后端是怎么处理的？在模型中专注于整理出每一个业务原子操作，并在接收到特定事件（或请求）时，按照业务顺序，组装完整的业务逻辑出来。而现在前端是怎么做的？以react为例，几乎全部的react应用，都是将业务逻辑写在组件中，因为业务操作必须依赖用户的操作，而用户的操作必须在视图层中予以反馈。所以在react组件中写业务逻辑非常正常，这回到了angularjs的老路子上，特别是强调functional+hooks的写法之后，我很容易想象到未来的react组件和angularjs的controller函数差不多，写出上千行代码也不是不可能，到时候没人敢动这个组件。

而在这一点上，我恰恰发现vue比react好很多。vue的结构是<template><script><style>，这样的结构看上去符合早期的编程习惯，模板样式加脚本嘛！然而，如果再去琢磨vue的script部分，我发现实际上vue所export出去的对象，本质上是一个类似模型的定义（类似配置对象）。

{
  data,
  computed,
  methods,
  watch,
}

一个模型，总是围绕自己目标所需要的数据进行处理。如果写过php应用，大部分php框架都会有模型层，而在编写模型时，强调的，都是只进行数据的读写和计算，而不处理任何视图的东西，处理视图的东西，需要在控制器中读取模型上的数据，自己进行组装。所以，模型，是对单一目标数据的总体概括，具有业务逻辑的抽象性，无法单独完成整个业务流程，但是却规定了业务逻辑的核心部分，等待开发者使用这些部分，组装出完整的业务流程。

不过，vue的组件定义不仅仅包含这些东西，同时还有生命周期函数，子组件引用，props，视图事件回调函数等等东西，而这些东西的整体，又是为视图编程服务的，因此，最终它和模型也只是插肩而过。状态管理的下一个方向，我恰恰认为是去弥补这个领域。前端架构至始至终，都没有在模型层抽象出犹如后端一致的模型管理，而发展至今，也应该是时候去往这个坑填一填了。所以，我在写完react-tyshemo之后，有一种自豪感。我感觉自己好像触摸到一点点这个问题的边缘了。这个库，可以做到定义状态就定义状态，在定义函数中，把状态的所有演变都定义完整（也就是和上述vue组件script中的部分子集一致），然后通过connect注入给组件使用，对于组件而言，它就像只能从模型中读取属性和方法一样，在遇到对应的交互事件之后，调用模型上的方法去驱动模型中的状态变化，然后返回来又更新自己。这样就做到了数据模型的定义和视图层（react组件）的分离，在手机端、PC端之间共用同一个模型成为可能。

在react生态里面，炫技的不在少数。但要解决问题，而且要简单地解决问题。将状态管理升级到前端模型构建之后，模型逻辑和视图逻辑就可以完全分离。而由于我们大部分情况下，会在模型中写业务逻辑，在视图中写交互逻辑，所以只需要将它们组装起来。但是，有趣的地方在于，可以拆分开来。而且，这也带来了另一个好处，由于业务逻辑的部分被独立出来，那么在不同端，就可以被复用，手机端、PC端、其他端，可以基于同一个模型，但视图却可以不同，视图因为只负责交互逻辑，所以反而更抽象，变量命名都可以抛开业务单词使用更抽象的词汇来命名。一旦业务逻辑的东西通过模型层面，和react视图编程拆分开，那么，真的就可以做到，react组件负责纯UI，而模型负责纯业务逻辑，中间在通过某种控制器将两者粘连在一起，会是另一翻编程的景象。

最后语

本文主要是想表达，在状态管理这件事上，我们尝试一切，试图找到某种通用的优雅的解决方案，但是，在所有方案中，我们都不得不进行一些妥协。如果我们能够从历史的角度去观察，往往能够发现，世界上没有完美的事物，有一种说法“历史都是妥协出来的”，我们可以换一个好听的词，叫“博弈”，但是无论如何，我们都在追求着，每个人的追求不同，代码风格的优雅，代码量少，代码性能极致，代码明显没有bug……这些追求，驱动着我们不断探索和思考。

文章来源：

Author：frustigor
link：https://cdc.tencent.com/2020/05/22/frontend-state-management-research/

上一篇：前端异常监控解决方案研究

前端状态管理设计——优雅与妥协的艺术