这一章，我们会讨论两个特别有意思的问题：

用算法做投资决策
用算法玩扑克游戏

但，在讨论这两个问题之前，我们先来讨论一个之前我们提到了，但是没讨论的问题，换零钱。
试图通过这种方式，带来一个关于动态规划的"公式套路"。

换零钱

在《4.递归》这一章的最后，我们讨论了跳台阶这个问题。

【排列】 现在有N阶台阶，每次只能跳1阶或者2阶，有多少种方法？

通过这个问题，我们引出了递归的一个缺点：重复计算。
然后我们在《7.哈希表》这一章中，讨论了如何用哈希表克服这个缺点。

另外，在《4.递归》中，我们还提到了这么一个问题：

【组合】 现在有N元钱，要换成1元的或者2元的，有多少种方法？

现在，我们来讨论换零钱。
假设我们现在有 $100$ 元，要换成零钱。零钱用一个数组表示，比如：

$[1,2,5,10,20,50]$

有多少种方法？

暴力递归

我们来穷举，遍历。
对于0位置的货币，可以选择 $0$ 张、 $1$ 张、 $2$ 张、一直到 $\frac{100}{1}$ 张。
比如0位置的货币选了 $M$ 张，那么1位置的货币，可以选 $0$ 张、 $1$ 张、一直到 $\frac{100 - M*1}{2}$ 张。

示例代码：

package ch11;

public class PocketMoneyRecur {

    public static int process(int[] arr,int index,int rest){
        // 如果没有货币可选了
        if (index == arr.length){
            // 恰好换完了，那么这也是一种方法，啥也不换
            // 否则，不是方法
            return rest == 0 ? 1:0;
        }
        int ways = 0;
        for (int zhang = 0; zhang * arr[index] <= rest; zhang++) {
            ways = ways + process(arr,index+1,rest-(zhang*arr[index]));
        }
        return ways;
    }

    public static void main(String[] args) {
        int[] arr = {1,2,5,10,20,50};
        int total = 100;
        System.out.println(process(arr,0,total));
    }
}

运行结果：

示例代码：

def process(arr, index, rest):
    # 如果没有货币可选了
    if index == len(arr):
        # 恰好换完了，那么这也是一种方法，啥也不换
        # 否则，不是方法
        return 1 if rest == 0 else 0
    ways = 0
    zhang = 0
    while zhang * arr[index] <= rest:
        ways = ways + process(arr, index + 1, rest - (zhang * arr[index]))
        zhang = zhang + 1
    return ways


if __name__ == '__main__':
    a = [1, 2, 5, 10, 20, 50]
    total = 100
    print(process(a, 0, total))

运行结果：

记忆化搜索

在讨论跳台阶的时候，我们说递归会有重复计算。那么换零钱问题会有重复计算吗？
有。
比如：

我们用了2张一元的，0张两元的。那么我们是从2位置的货币开始，换98元。
我们用了0张一元的，1张两元的。那么我们也是从2位置的货币开始，换98元。

对症下药。
我们把每次计算结果都记下来，下次计算前，先看看有没有算过。
这就是记忆化搜索。
其实，在《7.哈希表》中，我们用哈希表去处理跳台阶重复计算问题的方法，就是记忆化搜索。

示例代码：

package ch11;

public class PocketMoneyMemory {

    public static int process(int[] arr,int index,int rest,int[][] memory){
        // 如果算过
        if (memory[index][rest] != -1){
            return memory[index][rest];
        }
        // 如果没有货币可选了
        if (index == arr.length){
            // 恰好换完了，那么这也是一种方法，啥也不换
            // 否则，不是方法

            // 记住
            memory[index][rest] = rest == 0 ? 1:0;
            return memory[index][rest];
        }
        int ways = 0;
        for (int zhang = 0; zhang * arr[index] <= rest; zhang++) {
            ways = ways + process(arr,index+1,rest-(zhang*arr[index]),memory);
        }
        
        // 记住
        memory[index][rest] = ways;
        return memory[index][rest];
    }

    public static void main(String[] args) {
        int[] arr = {1,2,5,10,20,50};
        int total = 100;
        // 记忆
        // -1代表没有记忆
        // 一开始没有记忆
        int[][] memory = new int[arr.length + 1][total+1];
        for (int i = 0; i < memory.length; i++) {
            for (int j = 0; j < memory[i].length; j++) {
                memory[i][j] = -1;
            }
        }
        System.out.println(process(arr,0,total,memory));
    }
}

运行结果：

示例代码：

def process(arr, index, rest, memory):
    # 如果算过
    if memory[index][rest] is not None:
        return memory[index][rest]
    # 如果没有货币可选了
    if index == len(arr):
        # 恰好换完了，那么这也是一种方法，啥也不换
        # 否则，不是方法

        # 记住
        memory[index][rest] = 1 if rest == 0 else 0
        return memory[index][rest]
    ways = 0
    zhang = 0
    while zhang * arr[index] <= rest:
        ways = ways + process(arr, index + 1, rest - (zhang * arr[index]), memory)
        zhang = zhang + 1

    memory[index][rest] = ways
    return memory[index][rest]


if __name__ == '__main__':
    a = [1, 2, 5, 10, 20, 50]
    total = 100
    # 记忆
    # None 代表没有记忆
    # 一开始没有记忆
    memory = [[None] * (total + 1) for i in range(len(a) + 1)]
    print(process(a, 0, total, memory))

运行结果：

动态规划

第三步，我们来做动态规划。
根据递归的代码。
我们知道，当index == arr.length且rest == 0的时候，返回 $1$ ，其他的index == arr.length都是返回 $0$ 。
所以，我们有：

我们要求的值就是画五角星的地方。
根据递归的过程index + 1，且我们已经知道了第N行的值。
所以对于整体的顺序，是从下往上；具体到每一行，是从左往右。

接下来，就根据这个过程写代码。

示例代码：

package ch11;

public class PocketMoneyDP  {

    public static void main(String[] args) {
        int[] arr = {1,2,5,10,20,50};
        int total = 100;
        int[][] dp = new int[arr.length + 1][total+1];

        // 根据之前的递归代码，我们知道"dp[arr.length][0] = 1"
        // if (index == arr.length){
        //     return rest == 0 ? 1:0;
        // }
        dp[arr.length][0] = 1;

        // 根据我们的递推代码
        // ways = ways + process(arr,index+1,rest-(zhang*arr[index]),memory);
        // 所以，我们可以通过第N行，推出第N-1行；通过第N-1行，推出第N-2行。
        // arr.length行在上一步已经填好了
        for (int index = arr.length-1;index >= 0;index--){
            for (int rest = 0; rest <= total; rest++) {
                // 把dp[index][rest]填好
                int ways = 0;
                for (int zhang = 0; zhang * arr[index] <= rest; zhang++) {
                    ways = ways + dp[index+1][rest - (zhang * arr[index])];
                }
                dp[index][rest] = ways;
            }
        }

        // 最终要 0-total 的值
        System.out.println(dp[0][total]);
    }

}

运行结果：

示例代码：

arr = [1, 2, 5, 10, 20, 50]
total = 100
dp = [[0] * (total + 1) for i in range(len(arr) + 1)]
# 根据之前的递归代码，我们知道"dp[arr.length][0] = 1"
# if (index == arr.length){
#     return rest == 0 ? 1:0;
# }
dp[len(arr)][0] = 1
# 根据我们的递推代码
# ways = ways + process(arr,index+1,rest-(zhang*arr[index]),memory);
# 所以，我们可以通过第N行，推出第N-1行；通过第N-1行，推出第N-2行。
# arr.length行在上一步已经填好了
for index in range(len(arr) - 1, -1, -1):
    for rest in range(0, total + 1, 1):
        # 把dp[index][rest]填好
        ways = 0
        zhang = 0
        while zhang * arr[index] <= rest:
            ways = ways + dp[index + 1][rest - (zhang * arr[index])]
            zhang = zhang + 1
            dp[index][rest] = ways

print(dp[0][total])

运行结果：

代码的形式非常像"暴力递归"和"记忆化搜索"的一个整合

继续优化

根据上面的代码，我们还可以得到如图所示的一个关系。

$\text{问号} = a + b + c + \cdots$

再来看，从左往右计算，我们是不是先计算 星号 的值，再计算 问号 的值？
是的。

那么星号等于多少？

$\text{星号} = b + c + \cdots$

所以，我们有：

$\text{问号} = \text{星号} + a$

这就是我们继续优化后的动态规划。

示例代码：

package ch11;

public class PocketMoneyDP2nd {

    public static void main(String[] args) {
        int[] arr = {1,2,5,10,20,50};
        int total = 100;
        int[][] dp = new int[arr.length + 1][total+1];

        dp[arr.length][0] = 1;

        for (int index = arr.length-1;index >= 0;index--){
            for (int rest = 0; rest <= total; rest++) {
                // a
                dp[index][rest] = dp[index + 1][rest];
                if (rest - arr[index] >= 0){
                    // 问号 = a + 星号
                    dp[index][rest] = dp[index][rest] + dp[index][rest-arr[index]];
                }
            }
        }

        // 最终要 0-total 的值
        System.out.println(dp[0][total]);
    }

}

运行结果：

示例代码：

arr = [1, 2, 5, 10, 20, 50]
total = 100
dp = [[0] * (total + 1) for i in range(len(arr) + 1)]
dp[len(arr)][0] = 1
for index in range(len(arr) - 1, -1, -1):
    for rest in range(0, total + 1, 1):
        # a
        dp[index][rest] = dp[index + 1][rest]
        if rest - arr[index] >= 0:
            # 问号 = a + 星号
            dp[index][rest] = dp[index][rest] + dp[index][rest-arr[index]]

print(dp[0][total])

运行结果：

公式套路

我们来小结一下上述过程：

首先，我们用暴力递归的方法，发现存在重复计算。
于是，我们改成记忆化搜索。
然后，我们把再做精细化组织，就是我们的动态规划。
最后，我们发现还可以再优化，那就再优化。

而，我们动态规划的代码形式非常像"暴力递归"和"记忆化搜索"的一个整合
之后，我们再遇到类似的问题，也可以按照上面的公式套路，一步一步来。
比如，接下来的两个问题。

背包问题

背包问题是一类问题的代表，其实有很多种形式。
比如：
现在有 $N$ 个项目，每个项目都有其需要投入的资金 $W_N$ 及期望回报 $P_N$ 。现在我们的可用资金是 $M$ ，问如何进行投资，总期望回报最大？

那么，我们怎么做？
把所有的项目按照"单位投资的回报"进行排序，"单位投资的回报"大的先投？
这个策略非常类似我们在上一章讨论的最小生成树的算法Kruskal，贪心。
那么，这个策略对吗？
很可惜，不对。
我们来看反例。

项目	一	二	三	四	五	六
资金	9	2	2	2	2	2
回报	10	2.1	2.1	2.1	2.1	2.1

现在我们的可用资金是 $10$ 。
项目一的"单位投资的回报"是 $\frac{10}{9} \approx 1.11$
项目二到项目六的"单位投资的回报"都是 $\frac{2.1}{1} = 1.05$
按照"单位投资的回报"大的先投这个策略，我们先投资项目一，投资项目一之后，我们的剩余资金 $1$ 无法再进行其他任何投资，最后总回报是 $10$ 。
但是如果我们投资项目二到项目六呢？我们的总回报是 $10.5$

暴力递归

现在，让我们按公式套路来解决问题，首先暴力递归。
一共6个项目，每个项目，投或者不投。

穷举，比较大小。
唯一的技巧是我们在一边穷举一边比大小。

示例代码：

package ch11;


public class KnapsackRecur {


    /**
     *
     * @param wArr 投资数额
     * @param pArr 投资收益
     * @param index
     * @param rest 剩余可用资金
     * @return -1 该投资不可行
     */
    public static double process(double[] wArr , double[] pArr, int index, double rest) {
        // 该投资不可行
        if (rest < 0) {
            return -1;
        }
        // 没有更多投资项目
        if (index == wArr.length) {
            return 0;
        }
        // 投资该项目
        double p1 = 0;
        double next = process(wArr, pArr, index + 1, rest - wArr[index]);
        if (next != -1) {
            p1 = pArr[index] + next;
        }

        // 不投资该项目
        double p2 = process(wArr, pArr, index + 1, rest);

        return Math.max(p1, p2);
    }

    public static void main(String[] args) {
        double[] wArr = {9.0,2.0,2.0,2.0,2.0,2.0};
        double[] pArr = {10.0,2.1,2.1,2.1,2.1,2.1};
        System.out.println(process(wArr,pArr,0,10));
    }
}

运行结果：

10.5

示例代码：

def process(w_arr, p_arr, index, rest):
    # 该投资不可行
    if rest < 0:
        return -1
    # 没有更多投资项目
    if index == len(w_arr):
        return 0

    # 投资该项目
    p1 = 0
    next = process(w_arr, p_arr, index + 1, rest - w_arr[index])
    if next != -1:
        p1 = p_arr[index] + next

    # 不投资该项目
    p2 = process(w_arr, p_arr, index + 1, rest)
    return max(p1, p2)


if __name__ == '__main__':
    w_arr = [9.0, 2.0, 2.0, 2.0, 2.0, 2.0]
    p_arr = [10.0, 2.1, 2.1, 2.1, 2.1, 2.1]
    print(process(w_arr, p_arr, 0, 10))

运行结果：

10.5

记忆化搜索

那么，在上述过程中，有重复计算吗？
很明显有。

项目一不投，项目二投，项目三不投：
剩余未计算的是项目四五六，剩余资金是8。
项目一不投，项目二不投，项目三投：
剩余未计算的也是项目四五六，剩余资金也是8。

既然这样的话，我们就可以改成记忆化搜索。

与上例不同的在于，我们的资金，我们的收益，都是浮点数。

第一种方法：
我们用map，key = index + "-" + rest。

示例代码：

package ch11;

import java.util.HashMap;

public class KnapsackMemory {

    /**
     *
     * @param wArr 投资数额
     * @param pArr 投资收益
     * @param index
     * @param rest 剩余可用资金
     * @return -1 该投资不可行
     */
    public static double process(double[] wArr , double[] pArr, int index, double rest,HashMap<String,Double> memory) {
        String key = index + "-" + rest;
        if (memory.containsKey(key)){
            return memory.get(key);
        }
        // 该投资不可行
        if (rest < 0) {
            return -1;
        }
        // 没有更多投资项目
        if (index == wArr.length) {
            memory.put(key, 0.0);
            return memory.get(key);
        }
        // 投资该项目
        double p1 = 0;
        double next = process(wArr, pArr, index + 1, rest - wArr[index],memory);
        if (next != -1) {
            p1 = pArr[index] + next;
        }

        // 不投资该项目
        double p2 = process(wArr, pArr, index + 1, rest,memory);

        memory.put(key,Math.max(p1, p2));
        return memory.get(key);
    }

    public static void main(String[] args) {
        double[] wArr = {9.0,2.0,2.0,2.0,2.0,2.0};
        double[] pArr = {10.0,2.1,2.1,2.1,2.1,2.1};
        // 记忆
        HashMap<String,Double> memory = new HashMap<>();
        System.out.println(process(wArr,pArr,0,10,memory));
    }

}

运行结果：

10.5

示例代码：

def process(w_arr, p_arr, index, rest, memory):
    key = str(index) + '-' + str(rest)
    if key in memory.keys():
        return memory[key]

    # 该投资不可行
    if rest < 0:
        memory[key] = -1
        return memory[key]
    # 没有更多投资项目
    if index == len(w_arr):
        memory[key] = 0
        return memory[key]

    # 投资该项目
    p1 = 0
    next = process(w_arr, p_arr, index + 1, rest - w_arr[index], memory)
    if next != -1:
        p1 = p_arr[index] + next

    # 不投资该项目
    p2 = process(w_arr, p_arr, index + 1, rest, memory)
    memory[key] = max(p1, p2)
    return memory[key]


if __name__ == '__main__':
    w = [9.0, 2.0, 2.0, 2.0, 2.0, 2.0]
    p = [10.0, 2.1, 2.1, 2.1, 2.1, 2.1]
    m = dict()
    print(process(w, p, 0, 10, m))

运行结果：

10.5

第二种方法：
如果我们已知只有一位小数的话，乘以10，转成整型，最后再对结果除以10。

示例代码：

package ch11;

public class KnapsackMemory2nd {

    /**
     *
     * @param wArr 投资数额
     * @param pArr 投资收益
     * @param index
     * @param rest 剩余可用资金
     * @return -1 该投资不可行
     */
    public static int process(int[] wArr , int[] pArr, int index, int rest,int[][] memory) {
        // 该投资不可行
        if (rest < 0) {
            return -1;
        }
        if (memory[index][rest] != -1){
            return memory[index][rest];
        }
        // 没有更多投资项目
        if (index == wArr.length) {
            memory[index][rest] = 0;
            return memory[index][rest];
        }
        // 投资该项目
        int p1 = 0;
        int next = process(wArr, pArr, index + 1, rest - wArr[index],memory);
        if (next != -1) {
            p1 = pArr[index] + next;
        }

        // 不投资该项目
        int p2 = process(wArr, pArr, index + 1, rest,memory);

        memory[index][rest] = Math.max(p1, p2);
        return memory[index][rest];
    }

    public static void main(String[] args) {
        double[] wArr = {9.0,2.0,2.0,2.0,2.0,2.0};
        double[] pArr = {10.0,2.1,2.1,2.1,2.1,2.1};

        int[] wArr_int = new int[wArr.length];
        for (int i = 0; i < wArr.length; i++) {
            wArr_int[i] = (int) (wArr[i] * 10);
        }
        int[] pArr_int = new int[pArr.length];
        for (int i = 0; i < pArr.length; i++) {
            pArr_int[i] = (int) (pArr[i] * 10);
        }

        int rest = 10 * 10;

        // 记忆
        // -1代表没有记忆
        // 一开始没有记忆
        int[][] memory = new int[wArr.length + 1][rest + 1];
        for (int i = 0; i < memory.length; i++) {
            for (int j = 0; j < memory[i].length; j++) {
                memory[i][j] = -1;
            }
        }
        System.out.println(process(wArr_int,pArr_int,0,rest,memory)/10.0);
    }

}

运行结果：

10.5

示例代码：

def process(w_arr, p_arr, index, rest, memory):
    # 该投资不可行
    if rest < 0:
        return -1
    if memory[index][rest] is not None:
        return memory[index][rest]
    # 没有更多投资项目
    if index == len(w_arr):
        memory[index][rest] = 0
        return memory[index][rest]

    # 投资该项目
    p1 = 0
    next = process(w_arr, p_arr, index + 1, rest - w_arr[index], memory)
    if next != -1:
        p1 = p_arr[index] + next

    # 不投资该项目
    p2 = process(w_arr, p_arr, index + 1, rest, memory)
    memory[index][rest] = max(p1, p2)
    return memory[index][rest]


if __name__ == '__main__':
    w = [9.0, 2.0, 2.0, 2.0, 2.0, 2.0]
    p = [10.0, 2.1, 2.1, 2.1, 2.1, 2.1]
    w_10 = [int(i * 10) for i in w]
    p_10 = [int(i * 10) for i in p]
    rest = 10 * 10
    m = [[None] * (rest + 1) for i in range(len(w_10) + 1)]
    print(process(w_10, p_10, 0, rest, m)/10.0)

运行结果：

10.5

动态规划

按照公式套路，第三步，我们要改动态规划了。
根据我们的暴力递归过程，我们可以知道

当index == 6，无论rest等于多少，都是0。
我们需要的是0,100位置的值。

即：

那么，我们如何一步一步的推到0,100呢？
根据我们暴力递归的代码，在动态规划中，我们是从下往上，从左往右。

示例代码：

package ch11;

public class KnapsackDP {

    public static void main(String[] args) {
        double[] wArr = {9.0, 2.0, 2.0, 2.0, 2.0, 2.0};
        double[] pArr = {10.0, 2.1, 2.1, 2.1, 2.1, 2.1};

        int[] wArr_int = new int[wArr.length];
        for (int i = 0; i < wArr.length; i++) {
            wArr_int[i] = (int) (wArr[i] * 10);
        }
        int[] pArr_int = new int[pArr.length];
        for (int i = 0; i < pArr.length; i++) {
            pArr_int[i] = (int) (pArr[i] * 10);
        }

        int rest = 10 * 10;

        int[][] dp = new int[wArr_int.length + 1][rest + 1];
        for (int index = wArr_int.length - 1; index >= 0; index--) {
            for (int r = 0; r <= rest; r++) {
                int p1 = dp[index + 1][r];
                int p2 = 0;
                int next = r - wArr_int[index] < 0 ? -1 : dp[index + 1][r - wArr_int[index]];
                if (next != -1) {
                    p2 = pArr_int[index] + next;
                }
                dp[index][r] = Math.max(p1, p2);
            }
        }


        System.out.println(dp[0][rest] / 10.0);
    }
}

运行结果：

10.5

示例代码：

w = [9.0, 2.0, 2.0, 2.0, 2.0, 2.0]
p = [10.0, 2.1, 2.1, 2.1, 2.1, 2.1]
w_10 = [int(i * 10) for i in w]
p_10 = [int(i * 10) for i in p]
rest = 10 * 10
dp = [[0] * (rest + 1) for i in range(len(w_10) + 1)]

for index in range(len(w_10) - 1, -1, -1):
    for r in range(0, rest + 1, 1):
        p1 = dp[index + 1][r]
        p2 = 0
        next = -1 if r - w_10[index] < 0 else dp[index + 1][r - w_10[index]]
        if next != -1:
            p2 = p_10[index] + next

        dp[index][r] = max(p1, p2)

print(dp[0][rest] / 10.0)

运行结果：

10.5

预测赢家

在电影《决胜21点》中，一个由MIT的教授和学生组成的团队，靠数学在拉斯维加斯的赌场上赚钱。这个过程和量化投资极为相似(当然，金融市场不是赌场，但同样充满了不确定性)，因此这部电影甚至被看作是一部和量化投资有关的电影。

现在我们就来做这么一件事情。
牌桌上有一组扑克牌，并且都是翻开的，也就是说每张牌的点数是多少都是已知的。现在有两位玩家，每位玩家每次只能从最左边或者最右边拿牌。
举个例子：
现在有扑克牌：

$7,K,A,5$

玩家一先拿牌，如果玩家一拿 $7$ 的话，那么 $K$ 将会暴露出来，那么下一轮玩家二就可以拿 $K$ 了。而玩家一为了不让玩家二拿到 $K$ ，就会去拿 $5$ 。这时候玩家二无论拿 $A$ 或者 $7$ 都会把 $K$ 暴露出来，玩家二选择拿 $7$ ，然后玩家一拿 $K$ ，玩家二拿 $A$ 。最后玩家一获胜， $K+5=18$ ，大于 $7+A=8$ 。

那么，这个游戏是不是先手一定会赢呢？不是。比如：

$A,K,A$

现在，我们假设所有的玩家都知道了这个游戏的技巧，这将会是一个强有效市场，输赢从牌发下来那一刻就已经注定了。所以直接参与这个游戏，很有可能就是一个输赢各一半的游戏。
但，如果间接参与这个游戏呢？
衍生品。

接下来，我们就讨论如何预测赢家。
比如，现在拿到的是

$A,5,8,6$

暴力递归

同样，第一个方法是暴力递归。
我们列举出所有的可能

从下向上进行分析。

对于玩家一：
- 如果现在有8,6两张牌，如果选8的话，玩家二就会选6，赢面是2；如果选6的话，玩家二就会选8，赢面是-2。那么玩家一肯定会选8，即8,6，玩家一的赢面是2。
- 同理，对于5,8，玩家一肯定会选8，赢面是3。
- 对于5,8，玩家一的赢面是3。
- 对于A,5，玩家一的赢面是4。
往上，对于玩家二：
- 现在有5,8,6，如果选5，玩家一的赢面是2，玩家二是赢面就是3，如果选6，玩家一的赢面是3，玩家二的赢面也是3，所以在5,8,6中，玩家二的赢面是3。
- 同理，对于1,5,8，玩家二的赢面是4。
回到顶部：
- 如果玩家一选1，赢面是-2。
- 如果玩家一选6，赢面是2。

所以要判断玩家一是否获胜，只需要考虑max(-2,2)是否大于0。

示例代码：

package ch11;

public class PredictWinnerRecur {

    public static int predictWinner(int[] arr,int L,int R){
        if (L == R){
            return arr[L];
        }
        return Math.max(arr[L] - predictWinner(arr,L+1,R),arr[R] - predictWinner(arr,L,R-1));
    }

    public static void main(String[] args) {
        int[] arr = {1,5,8,6};
        if (predictWinner(arr,0,arr.length-1) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }


        arr = new int[]{7, 13, 1, 5};
        if (predictWinner(arr,0,arr.length-1) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }

        arr = new int[]{1, 13, 1};
        if (predictWinner(arr,0,arr.length-1) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }
    }

}

运行结果：

1
2
3

玩家一获胜
玩家一获胜
玩家二获胜

示例代码：

def predict_winner(arr, l, r):
    if l == r:
        return arr[l]
    return max(arr[l] - predict_winner(arr, l + 1, r), arr[r] - predict_winner(arr, l, r - 1));


if __name__ == '__main__':
    a = [1, 5, 8, 6]
    if predict_winner(a, 0, len(a) - 1) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

    a = [7, 13, 1, 5]
    if predict_winner(a, 0, len(a) - 1) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

    a = [1, 13, 1]
    if predict_winner(a, 0, len(a) - 1) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

运行结果：

1
2
3

玩家一获胜
玩家一获胜
玩家二获胜

记忆化搜索

那么这个问题有重复计算吗？
有，通过上面的图可以看出来，5,8。
所以，就可以改成记忆化搜索。

示例代码：

package ch11;

public class PredictWinnerMemory {

    public static int predictWinner(int[] arr,int L,int R,Integer[][] memory){
        if (null != memory[L][R]){
            return memory[L][R];
        }
        if (L == R){
            memory[L][R] = arr[L];
            return memory[L][R];
        }
        int a = 0;
        if (null != memory[L+1][R]){
            a = memory[L+1][R];
        }else {
            a = predictWinner(arr,L+1,R,memory);
        }
        int b = 0;
        if (null !=  memory[L][R-1]){
            b = memory[L][R-1];
        }else {
            b = predictWinner(arr,L,R-1,memory);
        }
        memory[L][R] = Math.max(arr[L] - a,arr[R] - b);
        return memory[L][R];
    }

    public static void main(String[] args) {
        int[] arr = {1,5,8,6};
        Integer[][] memory = new Integer[arr.length][arr.length];
        if (predictWinner(arr,0,arr.length-1,memory) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }


        arr = new int[]{7, 13, 1, 5};
        memory = new Integer[arr.length][arr.length];
        if (predictWinner(arr,0,arr.length-1,memory) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }

        arr = new int[]{1, 13, 1};
        memory = new Integer[arr.length][arr.length];
        if (predictWinner(arr,0,arr.length-1,memory) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }
    }

}

运行结果：

1
2
3

玩家一获胜
玩家一获胜
玩家二获胜

示例代码：

def predict_winner(arr, l, r, memory):
    if memory[l][r] is not None:
        return memory[l][r]
    if l == r:
        memory[l][r] = arr[l]
        return memory[l][r]
    a = 0
    if memory[l + 1][r] is not None:
        a = memory[l + 1][r]
    else:
        a = predict_winner(arr, l + 1, r,memory)

    b = 0
    if memory[l][r - 1] is not None:
        b = memory[l][r - 1]
    else:
        b = predict_winner(arr, l, r - 1,memory)

    return max(arr[l] - a, arr[r] - b)


if __name__ == '__main__':
    a = [1, 5, 8, 6]
    m = [[None] * (len(a) + 1) for i in range(len(a) + 1)]
    if predict_winner(a, 0, len(a) - 1, m) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

    a = [7, 13, 1, 5]
    if predict_winner(a, 0, len(a) - 1, m) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

    a = [1, 13, 1]
    if predict_winner(a, 0, len(a) - 1, m) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

运行结果：

1
2
3

玩家一获胜
玩家一获胜
玩家二获胜

动态规划

第三步，动态规划。
以1 5 8 6为例。

L > R，没有意义，用X表示
L = R，取arr[L]，在这个例子中是1 5 8 6。

示例代码：

package ch11;

public class PredictWinnerDP {

    public static int predictWinner(int[] arr){
        Integer[][] dp = new Integer[arr.length][arr.length];
        for (int i = 0; i < arr.length; i++) {
            dp[i][i] = arr[i];
        }
        for (int i = arr.length-1; i >= 0; i--) {
            for (int j = i+1;j< arr.length;j++){
                dp[i][j]=Math.max(arr[i]-dp[i+1][j],arr[j]-dp[i][j-1]);
            }
        }
        return dp[0][arr.length-1];
    }

    public static void main(String[] args) {
        int[] arr = {1,5,8,6};
        if (predictWinner(arr) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }


        arr = new int[]{7, 13, 1, 5};
        if (predictWinner(arr) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }

        arr = new int[]{1, 13, 1};
        if (predictWinner(arr) >= 0){
            System.out.println("玩家一获胜");
        }else{
            System.out.println("玩家二获胜");
        }
    }

}

运行结果：

1
2
3

玩家一获胜
玩家一获胜
玩家二获胜

示例代码：

def predict_winner(arr):
    dp = [[None] * (len(arr) + 1) for i in range(len(arr) + 1)]
    for i in range(len(a)):
        dp[i][i] = arr[i]
    for i in range(len(arr) - 1, -1, -1):
        for j in range(i + 1, len(arr), 1):
            dp[i][j] = max(arr[i] - dp[i + 1][j], arr[j] - dp[i][j - 1])

    return dp[0][len(arr) - 1]


if __name__ == '__main__':
    a = [1, 5, 8, 6]
    if predict_winner(a) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

    a = [7, 13, 1, 5]
    if predict_winner(a) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

    a = [1, 13, 1]
    if predict_winner(a) >= 0:
        print("玩家一获胜")
    else:
        print("玩家二获胜")

运行结果：

1
2
3

玩家一获胜
玩家一获胜
玩家二获胜

文章作者: Kaka Wan Yifan

文章链接: https://kakawanyifan.com/10611

留言板