LeetCode 115. Distinct Subsequences

历史记录

清除记录

猜你想搜

AcWing热点
App
登录/注册

LeetCode 115. Distinct Subsequences 原题链接困难

作者：

zyq2652192993 , 2020-04-26 15:36:03 , 所有人可见 , 阅读 661

1

1

题目描述

Given a string S and a string T, count the number of distinct subsequences of S which equals T.

A subsequence of a string is a new string which is formed from the original string by deleting some (can be none) of the characters without disturbing the relative positions of the remaining characters. (ie, "ACE" is a subsequence of "ABCDE" while "AEC" is not).

It’s guaranteed the answer fits on a 32-bit signed integer.

样例

Example 1:

Input: S = "rabbbit", T = "rabbit"
Output: 3
Explanation:
As shown below, there are 3 ways you can generate "rabbit" from S.
(The caret symbol ^ means the chosen letters)

rabbbit
^^^^ ^^
rabbbit
^^ ^^^^
rabbbit
^^^ ^^^

Example 2:

Input: S = "babgbag", T = "bag"
Output: 5
Explanation:
As shown below, there are 5 ways you can generate "bag" from S.
(The caret symbol ^ means the chosen letters)

babgbag
^^ ^
babgbag
^^    ^
babgbag
^    ^^
babgbag
  ^  ^^
babgbag
    ^^^

算法

(动态规划) $O(m\times n)$

题目的意思是给定字符串s和t，问在s中不连续的子串中有多少个和t完全匹配，本质上还是一个匹配问题。

首先思考连续的时候是怎么处理，很显然字符串哈希和KMP都可以解决，不连续情况多半就是动态规划了。

用d[i][j]表示s的前i个字符包含t前j个字符的个数，状态转移方程需要考虑s的第i个字符和t的第j个字符是否匹配。

如果s[i - 1] != t[j - 1]，那么那么只能是前i-1个字符和t的前j个字符进行计算，所以d[i][j] = d[i-1][j]。
如果匹配，那么存在如下例子

第一个例子
s = abb
t = ab
很显然出现次数是2

第二个例子
s = aab
t = ab
很显然出现次数是2

所以s[i - 1] == t[j - 1]的时候存在两种情况：

s[i - 1]和t[j - 1]完成匹配，于是只需要计算d[i-1][j-1]，第二个例子
s[i-1]属于重复的部分，第一个例子，那么需要计算d[i - 1][j]

所以d[i][j]就是两种情况的总和。

接下来就是很重要的初始化过程了，对于很多情况，比如d[0][0]究竟该怎么初始化会存在一些疑惑，那么最简单的判断方法就是举个例子，看看自己循环里是否会使用到d[0][0]，以及d[0][0]对程序的影响，那么就很容易判断d[0][0] =1还是0了。需要对t里的第一个字符进行特判。

另外最开始自己把14行的程序放在了if条件里面，下面这个样例就会错误：

s = aabb
t = ab
结果为4

如果把14行放在if里面，结果就是2，原因在于当s的第一个b和t里的a计算时，无法完成匹配，会让对应的d[3][1]= 0，但是实际上应为2。

另外还有一个测试用例发生错误是可能存在数据溢出问题，比如这个例子：

"xslledayhxhadmctrliaxqpokyezcfhzaskeykchkmhpyjipxtsuljkwkovmvelvwxzwieeuqnjozrfwmzsylcwvsthnxujvrkszqwtglewkycikdaiocglwzukwovsghkhyidevhbgffoqkpabthmqihcfxxzdejletqjoxmwftlxfcxgxgvpperwbqvhxgsbbkmphyomtbjzdjhcrcsggleiczpbfjcgtpycpmrjnckslrwduqlccqmgrdhxolfjafmsrfdghnatexyanldrdpxvvgujsztuffoymrfteholgonuaqndinadtumnuhkboyzaqguwqijwxxszngextfcozpetyownmyneehdwqmtpjloztswmzzdzqhuoxrblppqvyvsqhnhryvqsqogpnlqfulurexdtovqpqkfxxnqykgscxaskmksivoazlducanrqxynxlgvwonalpsyddqmaemcrrwvrjmjjnygyebwtqxehrclwsxzylbqexnxjcgspeynlbmetlkacnnbhmaizbadynajpibepbuacggxrqavfnwpcwxbzxfymhjcslghmajrirqzjqxpgtgisfjreqrqabssobbadmtmdknmakdigjqyqcruujlwmfoagrckdwyiglviyyrekjealvvigiesnvuumxgsveadrxlpwetioxibtdjblowblqvzpbrmhupyrdophjxvhgzclidzybajuxllacyhyphssvhcffxonysahvzhzbttyeeyiefhunbokiqrpqfcoxdxvefugapeevdoakxwzykmhbdytjbhigffkmbqmqxsoaiomgmmgwapzdosorcxxhejvgajyzdmzlcntqbapbpofdjtulstuzdrffafedufqwsknumcxbschdybosxkrabyfdejgyozwillcxpcaiehlelczioskqtptzaczobvyojdlyflilvwqgyrqmjaeepydrcchfyftjighntqzoo"
"rwmimatmhydhbujebqehjprrwfkoebcxxqfktayaaeheys"
结果为543744000，超出INT_MAX

所以涉及到加法以及计数的时候，还是要考虑以下数据溢出问题。

C++ 代码

class Solution {
public:
    int numDistinct(string s, string t) {
        std::ios_base::sync_with_stdio(false);
        cin.tie(NULL);
        cout.tie(NULL);

        int m = s.size(), n = t.size();
        vector<vector<long long>> d(m + 1, vector<long long>(n + 1, 0));
        d[0][0] = 1;
        int cnt = 0;
        for (int i = 1; i <= m; ++i) {
            if (s[i - 1] == t[0]) ++cnt;
            d[i][1] = cnt;
        }

        for (int i = 1; i <= m; ++i) {
            for (int j = 2; j <= i && j <= n; ++j) {
                if (s[i - 1] == t[j - 1]) d[i][j] = d[i - 1][j - 1] + d[i - 1][j];
                else d[i][j] = d[i - 1][j];
            }
        }

        return d[m][n];
    }
};