当前位置: 移动技术网 > 互联网>游戏>手游 > HDU 2457 AC 自动机 + DP

HDU 2457 AC 自动机 + DP

2020年09月01日  | 移动技术网互联网  | 我要评论
题意传送门 HDU 2457题解初始化 ACACAC 自动机,将 TrieTrieTrie 上节点看做字符串后缀的不同模式(或者状态)。若一个模式存在目标基因,那么这个节点或其失配节点(最长前缀)对应的字符串是目标基因。计算失配指针的时候,处理了各节点的所有状态转移(即在字符串结尾添加 A,C,G,TA,C,G,TA,C,G,T 其中一个字符),同时标记各状态是否存在目标基因即可。dp[i+1][j]dp[i+1][j]dp[i+1][j] 代表字符串在区间 [0,i][0,i][0,i] 且后缀模
题意

传送门

题解

初始化 A C AC AC 自动机,将 T r i e Trie Trie 上节点看做字符串后缀的不同模式(或者状态)。若一个模式存在目标基因,那么这个节点或其失配节点(最长后缀)对应的字符串是目标基因。计算失配指针的时候,处理了各节点的所有状态转移(即在字符串结尾添加 A , C , G , T A,C,G,T A,C,G,T 其中一个字符),同时标记各状态是否存在目标基因即可。

d p [ i + 1 ] [ j ] dp[i+1][j] dp[i+1][j] 代表字符串在区间 [ 0 , i ] [0,i] [0,i] 且后缀模式为状态 j j j 的最少处理次数,设原始字符串为 s t r str str 则有

d p [ i + 1 ] [ t r i e [ j ] [ k ] ] = { d p [ i ] [ j ] s t r [ i ] 等 于 k 代 表 的 字 符 d p [ i ] [ j ] + 1 o t h e r w i s e dp[i+1][trie[j][k]]=\begin{cases} dp[i][j] & str[i]等于k代表的字符\\ dp[i][j]+1 & otherwise \\ \end{cases} dp[i+1][trie[j][k]]={dp[i][j]dp[i][j]+1str[i]kotherwise

状态转移时要保证各状态代表的后缀模式不存在目标基因,不合法状态设为 I N F INF INF,初始为空串,满足条件,则有 d p [ 0 ] [ 0 ] = 0 dp[0][0]=0 dp[0][0]=0

#include <algorithm>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <queue>
using namespace std;
#define maxn 1005
int ns, id['Z' + 1], trie[maxn][4], flag[maxn], fail[maxn], dp[maxn][maxn];
char str[maxn];

void insert(char *s)
{
    int len = strlen(s), p = 0;
    for (int i = 0; i < len; i++)
    {
        int c = id[s[i]];
        if (!trie[p][c])
        {
            memset(trie[ns], 0, sizeof(trie[ns]));
            trie[p][c] = ns++;
        }
        p = trie[p][c];
    }
    flag[p] = 1;
}

void getFail()
{
    queue<int> q;
    for (int i = 0; i < 4; i++)
    {
        if (trie[0][i])
        {
            fail[trie[0][i]] = 0;
            q.push(trie[0][i]);
        }
    }
    while (!q.empty())
    {
        int p = q.front();
        q.pop();
        if (flag[fail[p]])
        {
            flag[p] = 1;
        }
        for (int i = 0; i < 4; i++)
        {
            if (trie[p][i])
            {
                fail[trie[p][i]] = trie[fail[p]][i];
                q.push(trie[p][i]);
            }
            else
            {
                trie[p][i] = trie[fail[p]][i];
            }
        }
    }
}

int main()
{
    int n, t = 0;
    while (~scanf("%d", &n) && n)
    {
        ns = 1, id['A'] = 0, id['C'] = 1, id['G'] = 2, id['T'] = 3;
        memset(trie[0], 0, sizeof(trie[0]));
        memset(flag, 0, sizeof(flag));
        char s[25];
        for (int i = 0; i < n; i++)
        {
            scanf(" %s", s);
            insert(s);
        }
        getFail();
        scanf(" %s", str);
        int len = strlen(str);
        memset(dp, 0x3f, sizeof(dp));
        dp[0][0] = 0;
        for (int i = 0; i < len; i++)
        {
            for (int j = 0; j < ns; j++)
            {
                for (int k = 0; k < 4; k++)
                {
                    int nxt = trie[j][k];
                    if (!flag[j] && !flag[nxt])
                    {
                        dp[i + 1][nxt] = min(dp[i + 1][nxt], dp[i][j] + (k == id[str[i]] ? 0 : 1));
                    }
                }
            }
        }
        int res = len + 1;
        for (int i = 0; i < ns; i++)
        {
            if (!flag[i])
            {
                res = min(res, dp[len][i]);
            }
        }
        printf("Case %d: %d\n", ++t, res > len ? -1 : res);
    }
    return 0;
}

本文地址:https://blog.csdn.net/neweryyy/article/details/108589714

如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!

相关文章:

验证码:
移动技术网