引入
前些天看到了一个比较有趣的题目,需要用到一般图最大权匹配。可是我只会二分图最大匹配,甚至不会 KM 和带花树的原理,于是就进行了一个资料的搜,顺便增长一下板子库。然而——
对一般图最大权匹配,网上现成高质量资料较少。
苦于资料杂乱、且无论正确性还是代码具体实现都没有一个清晰的全流程教程,在吸取众长、奋斗三天后,终于通过了 UOJ 上的模板题。
这篇博客主要目的在于,梳理整个流程(包含代码实现)中应用的原理和使用的技巧。一般图最大权匹配主要通过下面四个问题逐步转化:
- 二分图最大匹配
- 一般图最大匹配
- 二分图最大权匹配
- 一般图最大权匹配
本文主要描述,如何通过解决前三个问题的思路,解决第四个更为复杂的问题。本文的前置知识只有匈牙利算法。
基本定义
匹配:对于图 $G=(V,E)$ 的一个匹配 $M$ 是边集 $E$ 的子集,其中两两不共用顶点。
最大匹配:边数最多的匹配。
完美匹配:包含原图所有点的匹配。
最大权匹配:对于图 $G(V,E)$,边 $e\in E$ 的权重为 $w(e)$,最大权匹配 $M=(V’,E’)$ 为 $\sum_e w(e)$ 最大的匹配。
最大权最大匹配:最大权最大匹配 $M(V’,E’)$ 为 $\sum_e w(e)$ 最大的最大匹配。
匹配点、未匹配点、匹配边、非匹配边:字面含义,对应于某个匹配的状态。
交错路径:从一个未匹配点出发,依次交错经过非匹配边、匹配边形成的路径。
增广路:一个末尾是未匹配点的交错路径。这样的路径可以通过翻转整条路上边的选择状态获得一个长度恰好增加 $1$ 的匹配。
下列各图展示了一个无向二分图(箭头只是表示增广路的顺序)某时刻对增广路增广的情况。
交错树:从未匹配点 $r$ 开始寻找增广路时,交错路径组成的树。其中,我们称向根方向匹配的点为 $S$ 点(黑点,偶点),背向根方向匹配的点为 $T$ 点(白点,奇点)。
二分图最大匹配
二分图匹配可以用网络流做,Dinic 在二分图上的复杂度和 Hopcroft-Karp 相同,均为 $O(E\sqrt{V})$ ,不赘述。
匈牙利算法流传较广的是 DFS 做法,即枚举左部每个未匹配点,记录右部节点匹配的左部标号 $match_q$,检查交错路是否为增广路,复杂度 $O(VE)$。正确性是通过 Berge’s Theorm (如果找不到某点为端点的增广路,则最大匹配可以不包括这个点)证明的,比较显然。
1 | int dfs(int p,int t){ // p: 左半边编号 |
同样地,可以进行 BFS,即初始时所有点都未匹配,将未匹配点入队。逐个取出队首元素作为交错树的根,对交错树进行 BFS 匹配。可以看出,增广的本质是在以每个点为根的交错树上寻找增广路。而二分图左部永远是黑点,右部永远是白点,因此增广路的首末必分别在左部和右部。
一般图最大匹配
对于一般图,就没有这么好的性质了。但唯一的不同是,一般图中可能有奇数长度的环,下简称奇环。在奇环上的每一个点连出去的非匹配边,都能够成为某个增广路上的边,这导致在增广的过程中难以判断如何翻转。
将花缩成一个点后,环上所有点变成黑点,并可以在交错树上向外延伸。
具体实现中,不需要真正地记录花,只需要记录每个点对应花根位置 $fa$(本质是个并查集);同时为了方便上述两种情况的判断,对于所有黑点,记录交错树上从根开始连向当前点的非匹配边 $pre$(对于非花点 $i$,$pre_i$ 就是父节点)。
每当找到黑-黑边(S-S 边)时进行缩花(shrink
)操作,花托就是两点的 LCA ,可以暴力求出;将花内所有白点变黑入队,并更新这些点的 $pre$ 。由于实现比较容易,下面不解释地给出参考代码(后来还是写了一些注释便于理解)。
1 | int mat[N],color[N],n; // color 1: black 2: white |
二分图最大权匹配
和二分图最大匹配一样,最大权匹配也可以通过网络流那一套求解:将每条边的边权看做一个费用,然后求一下最大费用最大流即可。但为了扩展到一般图,考虑 KM 算法。
学之前,我对二分图最大权匹配的印象仅停留在 KM 算法的板子上,没有真正去理解 KM 算法。下面简单介绍一下 KM 算法(如果你是第一次学习 KM 算法,推荐一个比较有趣的引入:KM算法详解+模板,仅看找对象部分大致了解一下即可)。
最大权完美匹配
我们先考虑最大权完美匹配(最大权匹配可以通过增加零边变成完美匹配)。设对于边 $e$,选/不选该边表示为 $x_e=0$ 或 $x_e=1$;设 $\delta(v)$ 表示 $v$ 所连的边集,则我们要求的最大权匹配即为
$\max\sum_{e\in E} w(e)x_e$,满足条件 $\left\{\begin{aligned}&x(\delta(v))=1:\forall v\in V\\&x_e\in{0, 1}:\forall e\in E\end{aligned}\right.$
这是一个整数规划问题,通过原始对偶(Primal-Dual)思想转化为对偶问题:
$\min \sum_{v\in V}z_v$,满足条件 $\left\{\begin{aligned}&z_e=z_u+z_v-w(e)\ge 0:\forall e\in E\\& z_u\ge 0:\forall v\in V\end{aligned}\right.$
同时,根据互补松弛条件, $x_e>0\Rightarrow z_e=0$。即,对于选中的边 $e$,必有 $z_e=0$。
这里的 $z$ 就是 $KM$ 算法中的顶标(vertex labeling)。定义边 $e(u,v)$ 为”等边“当且仅当 $z_u+z_v=w(e)$,也即 $z_e=0$,根据上述互补松弛条件,匹配只能在等边构成的子图上建。初始时,左部(黑点)每个点的顶标均为其能够连到的最大边权,右部(白点)每个点的顶标均为 $0$。与匈牙利算法类似,每次增广先在“等边”构成的一张二分子图上进行尝试匹配,如果匹配不到,则松弛(将标准放低一些)后继续尝试;直至所有边都成为等边仍未找到增广,算法结束。
松弛的目的是使一些新边成为等边,加入二分子图,让左部点能尝试匹配的点更多;同时保证已有匹配边 $z_e=0$ 。对于所有未匹配边,求出最小的 $delta=\min_e z_e=z_u+z_v-w(e)$,然后将交错树中黑点的顶标降低 $delta$,交错树中白点的顶标增加 $delta$。这样暴力做的复杂度是 $O(n^4)$,下面给出参考代码。
暴力实现
1 | const ll inf=0x3f3f3f3f3f3f3f3f; |
不太行,考虑优化。
优化方案
一种可行的方案是,对于所有右部点 $y$,记录 $slv_y=\text{argmin}_{x\in T}(z_x+z_y-w(x,y))$ ,即固定了 $y$ 后, $z_e$ 最小值对应 $x$ ,其中 $T$ 为交错树。每次扩展的时候,都是取 $slv_y$ 计算出结果最小的 $y$ 进行扩展,这样就能够保留已有的交错树进而继续增广,每次增广的复杂度变成 $O(n^2)$,总复杂度 $O(n^3)$。下面给出示例代码,其中为方便增广,使用 $pre$ 记录黑点在交错上父亲的父亲(最近黑点祖先)。
1 | const ll inf=0x3f3f3f3f3f3f3f3f; |
Bonus
还有一种使用同样思想,利用局部最优获得全局最优的实现方式。对于每一个黑点 $x$,找到某个白点加入交错树,这个过程中始终是选择 $z_e$ 较小的边进行扩展的,直到找到 $x$ 所对应的增广路。
假设当前已经处理到 $x$,$1\dots x-1$ 都已经有对应的增广路了。设对于未匹配白点 $y$,与所有已匹配黑点 $x$ 中的 $z_e$ 最小值为 $slack_y$,有 $slack_y=\min_{i\in[1,x)}z_i+z_y-w_{i,y}$。那么加入交错树的 $yy=\text{argmin}( slack_y)$;同时,根据 $yy$ 的 $z_{(i,yy)}$ 去更新黑白已匹配点的顶标和下一轮的 $slack$,同时将 $mat_{yy}$ 这个黑点加入交错树(如果 $yy$ 没有匹配那就说明增广路找着了,退出循环)。
这样的方法对于顶标的初始值没有要求(可以不初始化),每次得到的是 $x$ 的局部最优解,但由于可以进行增广,因此最后得到的也是全局最优解,非常巧妙。下面给出代码。其中 $pre$ 记录的是白点在交错树上父亲的父亲(最近白点祖先),$visy$ 记录白点 $i$ 是否在交错树中。这个实现常数略小一点。
1 | const ll inf=0x3f3f3f3f3f3f3f3f; |
其他匹配的形式
上述讨论的都是左右部大小相等的完全二分图上的最大权完美匹配;对于 $n_1\neq n_2$ 的情况,可以补齐不足元素进行计算;对于不要求完美匹配的最大权匹配,可以直接应用本模板;对于非完全二分图,增广过程中对不存在的边进行特判即可。
一般图最大权匹配
仍然考虑 KM 算法在带花树上跑的过程。当进行松弛操作时,如果仍然按照上面的处理方式,白点 $+delta$,黑点 $-delta$,那么对于一个缩成点的花来说,其中有很多交错树上的边 $(u,v)$,$u$ 和 $v$ 的顶标都被加或者减掉了 $delta$,导致这条边不满足 $z_e\ge 0$ 的条件。于是需要对于整个花 $B$,设置额外的花标 $z_B$,在松弛时额外对所有黑花 $+2delta$,对白花 $-2delta$,才能保持平衡。
对偶问题
设 $O$ 为大小为 $\ge 3$ 奇数的集合的集合(包含所有花),$\gamma(S)$ 表示 $S$ 集合中的边,这个过程仍然可通过线性规划转化为对偶问题:
$\max \sum_{e\in E}w(e)x_e$,满足条件 $\left\{\begin{aligned}&x(\delta(v))=1:\forall v\in V\\&x_e\in{0,1}:\forall e\in E\\&x(\gamma(B))\le \lfloor\frac{|B|}{2}\rfloor:\forall B\in O\end{aligned}\right.$
对偶问题
$\min \sum_{v\in V}z_v+\sum_{B\in O}\lfloor\frac{|B|}{2}\rfloor z_B$,满足条件 $\left\{\begin{aligned}&z_B\ge 0:\forall B\in O\\&z_e=z_u+z_v-w(e)+\sum_{B\in O,(u,v)\in \gamma(B)} Z_B \ge 0:\forall e\in E\end{aligned}\right.$
与二分图最大权匹配相同,根据互补松弛条件, $x_e>0\Rightarrow z_e=0$。即,对于选中的边 $e$,必有 $z_e=0$;除此以外,还有 $z_B>0\Rightarrow x(\gamma(B))=\lfloor\frac{|B|}2\rfloor$,即所有 $z_B>0$ 的集合 $B$,都被选了集合大小一半的边,也即 $B$ 是一朵花。同时,我们加入一个条件: $z_B>0\Rightarrow x(\delta(B))=1$,即只有花 $B$ 向外连了一条边的时候, $z_B>0$ 才是有意义的。这很容易根据 $z_B$ 的用途理解。
具体实现
因此,我们需要维护的就是:
- 任意边 $z_e\ge 0$,取等时是交错树里(包括形成花的边)的边;
- $z_B\ge 0$。
通过类似 KM 的办法,我们就可以容易地维护带花树了!本文完
难点就在它的实现步骤。这里我分享一下通过借鉴一派 UOJ 神仙提交代码,提纯结晶后得到的模板实现思路与细节。min25 的板子真心看不懂,有懂哥欢迎补充!
先摆一下是如何存储这张带花树的:使用 $edge$ 类型存边,大有讲究!对于有花参与的连边,$edge$ 存储的 $u,v$ 不是花本身,而是花内真实节点的边。
1 |
|
其中,与普通带花树不同,这里的花是额外进行存储的(存储在 $n+1$ 到 $n_x$ 内),因此需要开两倍空间。花可以嵌套,而且花需要在某些时刻进行展开(后面会详细讲述),因此需要保存额外的信息。对于一个花 $B$,存储其根 $root$,对于花内任意点有 $root_{i\in B}=B$;存储花内所有节点 $flower_B$,是以花托为起始的环;同时,花内每一点 $i$ 保存“花内最大父花” flower_from[B][i]
表示最大的包含 $i$ 的 $B$ 的子花。
对于上面这朵嵌套花:${1,2,3}\in B_1,{B_1,4,5,6}\in B_2$,存储为:
1 | flower[B1]={1,2,3} // 1 是花托,按照某个顺序转圈,也可能是 {1,3,2} |
然后是 $slack$ 和匹配相关:
1 | // slack |
$label$ 也就是对偶问题里的 $z$。$col$ 是节点颜色,为黑色或白色。$slv_y$ 表示与 $y$ 邻接且不在一朵花的、 $z(x,y)$ 最小的 $x$,因为仅会在 $x,y$ 不在一朵花中的时候用到,计算时可以直接 $z_x+z_y-w(x,y)$。 $slv$ 的目的是计算松弛:每次松弛时,找到的边只有两种,即未访问点 $y$ 和某个黑点 $x$ 之间的边;已访问的黑点 $y$ 和某个已访问且不同花黑点之间的边。因此通过 $slv$ 可以方便地进行计算,总复杂度 $O(n^3)$。
$mat$ 可能是花之间的匹配,即 $mat_x=y$ 中 $x>n,y>n$ 均是被允许的。$vis$ 只用来计算 $LCA$ ,可以暂时忽略。$fa$ 表示某白点在交错树上的父节点。注意到黑点交错树上的父节点是 $mat_i$,利用这两个东西就可以在交错树上追溯到根了。
接下来是对 $slv$ 的更新和计算:
1 | // calculate slv |
对于 BFS 队列,在将花加入队列时需要将花中所有点都加入队列;设置最外层花时,对于花中所有点都要进行设置。
1 | // only push nodes, not flowers |
获取某朵花 $b$ 中,从花托到 $x$ 一条交错路径:对花连出去边的两种情况分别处理,返回一个指针。
1 | // return a (+-)^k path in flower b from root[b] to x |
某次增广使得需要设置 $u$ 匹配 $v$,$u$ 可能是花($v$ 不管):对于 $u$ 为花的情况,从花托到真实 $u$ 的边都进行翻转匹配,最后花托移位,旋转花到正确位置。
1 | // set (u->v) match, can be flower |
连接两个不在同一个花里的 S 点(黑点):两个点到根的路径,加上两点之间的边,能构成一条增广路。
1 | // link 2 S points |
暴力查询两点 LCA:直接跳父链打标记。
1 | int get_lca(int u,int v){ |
增加一朵奇花:需要申请一个 $id$ 设为 $b$,清空所有数据,并重构。需要重构的部分有:颜色;匹配(继承花托的匹配);花内节点;花内节点的 root
、flower_from
;邻接矩阵;slv
值。其中,邻接矩阵取的是 $z_e$ 最小的值,这可以保证正确性。
1 | void add_blossom(int u,int v,int r){ |
尝试增广一条等边:如果对点未染过色,则必然已经有匹配,将其匹配染色后丢入队列;如果对点是黑点,分两种情况,如果 $LCA=0$ 即不在同一花内,则 linkSS
,否则添加花。
1 | // found_edge |
一次增广:将所有未匹配点入队进行 BFS。先尝试使用当前 $label$ 下的等边构成的子图跑增广,如果增广成功直接返回。如果无法成功,则需要计算出松弛的大小,并将 $z_u,z_B$ 分别进行更新。更新后,如果某点 $(i,slv_i)$ 路径被加入等边子图中,则进行尝试增广。如果没有,则进行新的一轮增广。
有几个细节需要注意:
- 白花 $z_B$ 会减掉一个正数,但要求保证 $z_B\ge 0$。
- 如何计算松弛的大小
由于有 $z_B\ge 0$ 这样的特殊约束,当一朵白花 $z_B=0$ 时,需要对其进行开花操作 expand_blossom
,即将花展开,将花中在交错树上的部分链加入交错树中,并将其他节点设置为“没有听说过”,即 $col_i=0$。
上面也提到过,每次松弛需要考虑的只有下列情况:
- 某个黑点 $u$ 和某个未匹配点 $v$ 之间的边
- 某两个不在同一个花内的黑点 $u,v$ 之间的连边
加上 $z_B\ge 0,z_u\ge 0$ 两个条件,总共需要找的是四种情况,其中要用到 $\frac{z_B}2$、$\frac{z_e}{2}$ 的形式,因此边权整体乘二;但 $z_B$ 要小于零了可以拆花,$z_u$ 要小于零可就真的找不到匹配路径了,因此如果某次结束后 $z_u=0$,直接返回增广失败。
1 | int augment(){ |
两开花的具体实现:
1 | // only expand outermost blossom b, b is T(white) blossom |
参考代码
加上主函数,下面放一下完整的模板实现(题目是 UOJ #81):
1 |
|
参考资料与工具
- OI-wiki,一般图最大匹配
- Fuyuki,题解 P6113 【模板】一般图最大匹配
- 胡拉哥,算法设计技巧:Primal-Dual
- wenruo,KM算法详解+模板
- Shawn-Yang,KM算法–学习笔记
- 陈胤伯,2015 年国家集训队论文《浅谈图的匹配算法及其应用》
- jacky860226,general-graph-weighted-match-slides
- vfleaking,妈妈我终于会一般图最大权匹配了!
- Joris_VR,Maximum Weighted Matching
- zhongzihao,一般图最大权(最大)匹配
- Kurt Mehlhorn et al.,Implementation of O(nmlogn) weighted matchings in general graphs: the power of data structures
- Visualizations of Graph Algorithms
- Graph Editor
- NetworkX
提交通道
结语
欢迎纠错与讨论。感谢阅读!