浅谈LCA问题(最近公共祖先)(四种做法)

2023-02-27,,

【模板】最近公共祖先(LCA)

\(update \ 2023.1.3\) 新增了树链剖分

题目描述

如题,给定一棵有根多叉树,请求出指定两个点直接最近的公共祖先。

输入格式

第一行包含三个正整数 \(N,M,S\),分别表示树的结点个数、询问的个数和树根结点的序号。

接下来 \(N-1\) 行每行包含两个正整数 \(x, y\),表示 \(x\) 结点和 \(y\) 结点之间有一条直接连接的边(数据保证可以构成树)。

接下来 \(M\) 行每行包含两个正整数 \(a, b\),表示询问 \(a\) 结点和 \(b\) 结点的最近公共祖先。

输出格式

输出包含 \(M\) 行,每行包含一个正整数,依次为每一个询问的结果。

样例 #1

样例输入 #1

5 5 4
3 1
2 4
5 1
1 4
2 4
3 2
3 5
1 2
4 5

样例输出 #1

4
4
1
4
4

提示

对于 \(30\%\) 的数据,\(N\leq 10\),\(M\leq 10\)。

对于 \(70\%\) 的数据,\(N\leq 10000\),\(M\leq 10000\)。

对于 \(100\%\) 的数据,\(N\leq 500000\),\(M\leq 500000\)。

样例说明:

该树结构如下:

第一次询问:\(2, 4\) 的最近公共祖先,故为 \(4\)。

第二次询问:\(3, 2\) 的最近公共祖先,故为 \(4\)。

第三次询问:\(3, 5\) 的最近公共祖先,故为 \(1\)。

第四次询问:\(1, 2\) 的最近公共祖先,故为 \(4\)。

第五次询问:\(4, 5\) 的最近公共祖先,故为 \(4\)。

故输出依次为 \(4, 4, 1, 4, 4\)。

2021/10/4 数据更新 @fstqwq:应要求加了两组数据卡掉了暴力跳。

浅浅分析一下?

首先,知道最近公共祖先是什么意思

这个节点的父节点,父节点的父节点都是祖先……,甚至自己都是祖先

去看看这个题的样例解释,明白了这个概念后,再看后面。

暴力做法?

不要把算法想的太复杂,说到底,就是暴力的思路,然后想尽办法优化,什么常数优化啊一大堆乱七八糟的。

这道题也是一样,我们来考虑暴力做法

记录一个点的所有祖先,枚举另一个点的祖先,相同输出。

如果出题人故意卡你,给你出一个两条互不相同的链,然后头结点拼起来,然后给你一个查询:两条链的尾结点,你肯定会超时。

倍增

预处理

我们需要知道每个点的祖先,但不需要全部,毕竟空间存不下(具体思路见我RMQ的思路)

\(f[i][j]\)表示\(i\)的\(2^j\)级祖先是谁

\(f[i][0]\)表示\(i\)的父亲…………

状态转移方程:\(f[i][j]=f[f[i][j-1]][j-1]\)

这个怎么记呢?

“爸爸的爸爸叫爷爷”

查询

第一步:对齐

若\(x,y\)深度不一样,不妨设\(x\)的深度\(>y\)的深度

首先令\(x\)爬到\(x\)的某个深度与\(y\)相等的祖先

如果\(y==x\)那\(y\)就是\(x\)的祖先,输出\(y\)即可,否则进入下一步

第二步:爬树

\(x,y\)以倍增的形式向上爬树,单次查询:\(O({log_{2}}^{n})\)

\(dfs\)查询每个节点的\(2^j\)级祖先(这里用的是链式前向星存储)(不会的去查吧)

void dfs(int x,int fat)
{
fa[x][0]=fat;
deep[x]=deep[fat]+1;//深度等于他爸的深度+1
for(int i=1;i<=lg[deep[x]];++i)
fa[x][i]=fa[fa[x][i-1]][i-1];//爸爸的爸爸叫爷爷
for(int i=head[x];i;i=edge[i].next)
if(edge[i].to!=fat)//不是父亲
dfs(edge[i].to,x);//遍历
}

开始爬树(同一高度)

int LCA(int x,int y)
{
if(deep[x]<deep[y])
swap(x,y);//不妨设x深度大于y
while(deep[x]>deep[y])
x=fa[x][lg[deep[x]-deep[y]]-1];//RMQ讲过的,log值要减一
if(x==y)return x;//y是x的祖先
//现在x和y在同一深度上

继续爬树

for(int k=lg[deep[x]]-1;k>=0;k--)//注意遍历顺序
if(fa[x][k]!=fa[y][k]){//没爬到
x=fa[x][k];
y=fa[y][k];
}
//也许超了,不往上爬
return fa[x][0];//爬完之后,它肯定在最近公共祖先的儿子,返回他爸
}

\(Code:\)

#include<bits/stdc++.h>

using namespace std;
struct node{int to,nxt;}edge[1000005];
int n,m,s,head[1000005],cnt;
int fa[1000005][25],r[1000005],lg[1000005];
void log_2(int k){
for(int i=1;i<=k;i++)
lg[i]=lg[i-1]+((1<<lg[i-1])==i);
}
void add(int from,int to){
edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void dfs(int u,int fat){//dfs初始化fa数组
fa[u][0]=fat,r[u]=r[fat]+1;
for(int i=1;i<lg[r[u]];/*注意-1*/i++)
fa[u][i]=fa[fa[u][i-1]][i-1];//爸爸的爸爸叫爷爷
for(int i=head[u];i;i=edge[i].nxt)
if(edge[i].to!=fat)
dfs(edge[i].to,u);
}
int LCA(int x,int y){
if(r[x]<r[y])swap(x,y);//不妨设x比y深
while(r[x]>r[y])
x=fa[x][lg[r[x]-r[y]]-1];//注意减一
if(x==y) return y;//y是x的祖先
for(int i=lg[r[x]]-1;i>=0;i--){//预好跳完整个数的准备,从大到小,注意减一
if(fa[x][i]!=fa[y][i]) x=fa[x][i],y=fa[y][i];//跳
//不然什么都不干
}
return fa[x][0];//返回他的父亲,自行模拟
}
int main()
{
cin>>n>>m>>s;
for(int i=1;i<n;i++){
int u,v;scanf("%d %d",&u,&v);
add(u,v),add(v,u);
}
log_2(n);
dfs(s,0);
for(int i=1;i<=m;i++){
int x,y;scanf("%d %d",&x,&y);
printf("%d\n",LCA(x,y));
}
return 0;
}

RMQ

这东西没想出来正常(因为我没有想出来),非常神奇

我们先来了解各个需要用到的数组含义

\(ver[i]\)表示\(dfs\)第\(i\)个访问的节点

\(R[i]\)表示\(ver[i]\)所在的层数,也就是深度

\(first[i]\)表示\(i\)个节点在\(ver[i]\)的最小编号,也就是第一个出现的编号

如果我们要求\(d\)和\(f\)的\(LCA\),我们发现\(d\)第一次出现在\(4\),\(f\)第一次出现在\(9\),由\(dfs\)的性质可以知道,在\(4~9\)之间深度最小的点就是\(LCA\)

这不就是区间查询问题吗?

于是我们就想到了\(RMQ\),预处理\(O(n{log_{2}}^n)\),查询:\(O(1)\)非常之快

直接上代码,都讲过(三个数组的预处理都会吧)

\(Code:\)

//LCA(RMQ方法)
#include<bits/stdc++.h> using namespace std;
struct node{int value,nxt,to;}edge[2000005];
int n,m,s,head[1000005],cnt,tot;
int fir[1000005];//每个点第一次出现的时间
int ver[1000005];//时间戳
int r[1000005];//时间戳每个点的深度
int f[20][1000005];//RMQ数组(记录深度)
int rec[20][1000005];//记录标号
int lg[1000005];//log2数组
void tiao_shi(){
for(int i=1;i<=tot;i++) cout<<ver[i]<<' ';
cout<<endl;
for(int i=1;i<=tot;i++) cout<<r[i]<<' ';
cout<<endl;
for(int i=1;i<=n;i++) cout<<fir[i]<<' ';
cout<<endl;
}
void add(int from,int to){//链式前向星
edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void log_2(int k){
for(int i=1;i<=k;i++)
lg[i]=lg[i-1]+(1<<lg[i-1]==i);
}
void dfs(int u,int dep){
fir[u]=++tot,ver[tot]=u,r[tot]=dep;
for(int i=head[u];i;i=edge[i].nxt){
int v=edge[i].to;
if(!fir[v])
dfs(v,dep+1),ver[++tot]=u,r[tot]=dep;//去了又,回来
}
}
void RMQ_init(){//RMQ初始化,详见RMP模板
log_2(tot);//求log2 1~tot比cmath库的函数快很多
for(int i=1;i<lg[tot];i++)
for(int j=1;j+(1<<i)-1<=tot;j++)
f[i][j]=1e9;
for(int i=1;i<=tot;i++)//数组初始化
f[0][i]=r[i],rec[0][i]=ver[i];
for(int i=1;i<lg[tot];i++)
for(int j=1;j+(1<<i)-1<=tot;j++){
if(f[i-1][j]<f[i-1][j+(1<<i-1)])
f[i][j]=f[i-1][j],rec[i][j]=rec[i-1][j];
else f[i][j]=f[i-1][j+(1<<i-1)],rec[i][j]=rec[i-1][j+(1<<i-1)];//聚合
}
}
int main()
{
cin>>n>>m>>s;
for(int i=1;i<n;i++){
int u,v;scanf("%d %d",&u,&v);
add(u,v),add(v,u);
}
dfs(s,1);
RMQ_init();
for(int i=1;i<=m;i++){
int l,r;scanf("%d %d",&l,&r);
l=fir[l],r=fir[r];
if(l>r)swap(l,r);
int k=lg[r-l+1]-1;//注意减一
if(f[k][l]<f[k][r-(1<<k)+1]) printf("%d\n",rec[k][l]);
else printf("%d\n",rec[k][r-(1<<k)+1]);
}
//详细见RMQ,这里只提供思路
// tiao_shi();
return 0;
}

tarjan

自认为讲不清楚

推荐一个详解博客:tarjan——LCA

这里说一下简略思路

第一步遍历,\(DFS\)遍历,如果走不下去了,就把那个点用并查集并起来

然后用一个\(vis\)数组标记,如果遍历到一个点,寻找和他有关系的点,如果那个点被标记过了,他们的最近公共祖先就是\(find(那个点)\)

详细请见那个博客,这里给出这个博客给的思路写出来的代码

\(Code:\)

#include<bits/stdc++.h>

using namespace std;
struct node{int to,nxt,id;}edge[1000005],deg[1000005];
int n,m,s,cnt,dcnt,head[1000005],dhd[1000005],ict;
int fa[1000005],rak[1000005];//并查集
int vis[1000005];//标记数组
int ans[1000005];//答案数组
void add(int from,int to){
edge[++cnt].to=to,edge[cnt].nxt=head[from],head[from]=cnt;
}
void dadd(int from,int to){
deg[++dcnt].to=to,deg[dcnt].nxt=dhd[from],dhd[from]=dcnt,deg[dcnt].id=++ict;
deg[++dcnt].to=from,deg[dcnt].nxt=dhd[to],dhd[to]=dcnt,deg[dcnt].id=ict;
}
void init(){
for(int i=1;i<=n;i++) fa[i]=i;
}
int find(int x){
if(x==fa[x]) return x;
return fa[x]=find(fa[x]);//小优化
}
void marge(int u,int v){//不能用按秩合并,有顺序的限定!
int f1=find(u),f2=find(v);
fa[f2]=f1;
}
void tarjan(int u,int fat){
vis[u]=1;
for(int i=head[u];i;i=edge[i].nxt)
if(!vis[edge[i].to]&&edge[i].to!=fat)//并查集挺高查找速度
tarjan(edge[i].to,u),marge(u,edge[i].to);
for(int i=dhd[u];i;i=deg[i].nxt)
if(vis[deg[i].to]&&!ans[deg[i].id])
ans[deg[i].id]=find(deg[i].to);
}
int main()
{
cin>>n>>m>>s;
for(int i=1;i<n;i++){
int u,v;cin>>u>>v;
add(u,v),add(v,u);
}
for(int i=1;i<=m;i++){
int x,y;cin>>x>>y;
dadd(x,y);
}
init();
tarjan(s,0);
for(int i=1;i<=ict;i++) cout<<ans[i]<<endl;
return 0;
}

树链剖分

个人认为树剖是倍增的另一种优化形式

倍增是使用\(ST\)表这一神奇东西优化

而树剖就是将一棵树分成若干条链,进而减少跳树的过程

而怎么将一棵树分成几条链呢?

先看看下面一些元素的定义

    重儿子:指的是以这棵树的儿子为根的子树元素最多的儿子

    不理解?

    看看这张图

    节点\(1\)有\(2\)个儿子,分别是节点\(2\)和节点\(3\),以\(2\)根的子树的元素数量为\(1\)(就他自己)(为了方便,以\(x\)为分根的子树的元素数量为\(size_x\))

    而\(size_3=2\),所以元素\(1\)的重儿子是\(3\)

2.有重儿子自然也有轻儿子,轻儿子就是父节点除了重儿子以外的儿子,很好理解吧

3.重边:父节点与重儿子的连线

4.轻边:父节点与轻儿子的连线

5.重链:多条重边组成的链

6.轻链:多条轻边组成的链

比如上面的图,黑色粗边组成的链子就是重链,其他是轻链

注意:标有红色点的是每条重链的起点

好啦,以上就是一些基础元素,如果你学到这里全部理解,那么下面的实现肯定难不倒你捏

回到正题,首先我们肯定要建链(不准确学名),我们首先先把整个树建出来并且把每个点的重儿子找出来

int f[MAXN], d[MAXN], son[MAXN], size[MAXN];
//f[i]是i的父亲
//d[i]是i的深度
//son[i]是i的重儿子
//size[i]是以i为根的子树的元素总和
void dfs1(int u, int fa, int depth) {//u:现在的点,fa:字面意思,depth:字面意思
f[u] = fa, d[u] = depth, size[u] = 1;//附初值
for (int i = head[u]; i; i = edge[i].nxt) {
int v = edge[i].to;
if(f[u] == v) continue;
dfs1(v, u, depth + 1);
size[u] += size[v];//要先递归,此时size[v]是求出来的
if(size[v] > size[son[u]]) son[u] = v;//求重儿子
}
}

接下来,我们就可以正儿八经的建链啦

int top[MAXN], id[MAXN], rt[MAXN], l_cnt;
//top[i]表示i所在的链的链头,即上文图片中打红色点的节点
//id[i],rt[i],l_cnt求和用的,这里先不讲
void dfs2(int u, int t) {
top[u] = t, id[u] = ++l_cnt, rt[l_cnt] = u;
if(!son[u]) return ;//叶子节点return掉
dfs2(son[u], t);//要想清楚,一条重链的节点都是重儿子,所以这条链的top还是原来的top
for (int i = head[u]; i; i = edge[i].nxt) {
int v = edge[i].to;
if(v != son[u] && v != f[u]) //处理轻儿子
dfs2(v, v);//轻儿子的链头是自己啦
}
}

建完链之后我们就可以求\(LCA\)啦

具体做法就是让两个点条到一条链上,然后高的那个点(也有可能一样高)就是公共祖先啦

int LCA(int x, int y) {
while(top[x] != top[y]) {
if(d[top[x]] < d[top[y]]) swap(x, y);//不妨设d[x]大于d[y]
x = f[top[x]];//跳到链头的父亲那,也就是比他高一级的链的末尾
}
if(d[x] > d[y]) swap(x, y);
return x;//高的那个点就是公共祖先
}

这道题到这里就结束了,配上高清无码代码

\(\mathcal{Code}\)

#include<bits/stdc++.h>

using namespace std;
const int MAXN = 5e5 + 7; struct node{int nxt, to;}edge[2 * MAXN];
int cnt, head[MAXN];
inline void add(int front, int to) {edge[++cnt].to = to, edge[cnt].nxt = head[front], head[front] = cnt;} int f[MAXN], d[MAXN], son[MAXN], size[MAXN];
void dfs1(int u, int fa, int depth) {
f[u] = fa, d[u] = depth, size[u] = 1;
for (int i = head[u]; i; i = edge[i].nxt) {
int v = edge[i].to;
if(f[u] == v) continue;
dfs1(v, u, depth + 1);
size[u] += size[v];
if(size[v] > size[son[u]]) son[u] = v;
}
}
int top[MAXN], id[MAXN], rt[MAXN], l_cnt;
void dfs2(int u, int t) {
top[u] = t, id[u] = ++l_cnt, rt[l_cnt] = u;
if(!son[u]) return ;
dfs2(son[u], t);
for (int i = head[u]; i; i = edge[i].nxt) {
int v = edge[i].to;
if(v != son[u] && v != f[u])
dfs2(v, v);
}
}
int LCA(int x, int y) {
while(top[x] != top[y]) {
if(d[top[x]] < d[top[y]]) swap(x, y);
x = f[top[x]];
}
if(d[x] > d[y]) swap(x, y);
return x;
} int N, M, S, x, y, a, b; int main() {
ios::sync_with_stdio(false);
cin.tie(0); cout.tie(0); cin >> N >> M >> S;
for (int i = 1; i < N; i++) {
cin >> x >> y;
add(x, y), add(y, x);
} dfs1(S, 0, 1);
dfs2(S, S);
for (int i = 1; i <= M; i++) {
cin >> a >> b;
cout << LCA(a, b) << endl;
}
return 0;
}

大家可以用这道题练练手。

熟能生巧,\(NOI\)路上也是如此,加油啊!童鞋们

浅谈LCA问题(最近公共祖先)(四种做法)的相关教程结束。

《浅谈LCA问题(最近公共祖先)(四种做法).doc》

下载本文的Word格式文档,以方便收藏与打印。