洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王题解【期望】【DP】

作者: wjyyy 分类: DP,数学,概率期望,解题报告发布时间: 2019-03-05 17:14

点击量：281

？？？看不懂的期望DP

目录

题目描述
题解：
Code：

题目描述

小 K 不慎被 LL 邪教洗脑了，洗脑程度深到他甚至想要从亚瑟王邪教中脱坑。

他决定，在脱坑之前，最后再来打一盘亚瑟王。既然是最后一战，就一定要打得漂亮。众所周知，亚瑟王是一个看脸的游戏，技能的发动都是看概率的。作为一个非洲人，同时作为一个前 OIer，小 K 自然是希望最大化造成伤害的期望值。但他已经多年没写过代码，连 Spaly 都敲不对了，因此，希望你能帮帮小 K，让他感受一下当欧洲人是怎样的体验。

本题中我们将考虑游戏的一个简化版模型。

玩家有一套卡牌，共 $ n$ 张。游戏时，玩家将 $ n$ 张卡牌排列成某种顺序，排列后将卡牌按从前往后依次编号为 $ 1\sim n$。本题中，顺序已经确定，即为输入的顺序。

每张卡牌都有一个技能。第 $ i$ 张卡牌的技能发动概率为 $ p_i$，如果成功发动，则会对敌方造成 $ d_i$ 点伤害。也只有通过发动技能，卡牌才能对敌方造成伤害。基于现实因素以及小 K 非洲血统的考虑，$ p_i$ 不会为 0，也不会为 1，即 $ 0<p_i<1$。

一局游戏一共有 $ r$ 轮。在每一轮中，系统将从第一张卡牌开始，按照顺序依次考虑每张卡牌。在一轮中，对于依次考虑的每一张卡牌：

如果这张卡牌在这一局游戏中已经发动过技能，则
1.1 如果这张卡牌不是最后一张，则跳过之（考虑下一张卡牌）；否则（是最后一张），结束这一轮游戏。

否则（这张卡牌在这一局游戏中没有发动过技能），设这张卡牌为第 $ i$ 张。
2.1 将其以 $ p_i$ 的概率发动技能。
2.2 如果技能发动，则对敌方造成 $ d_i$ 点伤害，并结束这一轮。
2.3 如果这张卡牌已经是最后一张（即 $ i$ 等于 $ n$），则结束这一轮；否则，考虑下一张卡牌。

请帮助小 K 求出这一套卡牌在一局游戏中能造成的伤害的期望值。

输入输出格式

输入格式：

输入文件的第一行包含一个整数 $ T$，代表测试数据组数。

接下来一共 $ T$ 组数据。

每组数据的第一行包含两个用空格分开的整数 $ n$ 和 $ r$，分别代表卡牌的张数和游戏的轮数。

接下来 $ n$ 行，每行包含一个实数和一个整数，由空格隔开，描述一张卡牌。第 $ i$ 行的两个数为 $ p_i$ 和 $ d_i$，分别代表第 $ i$ 张卡牌技能发动的概率（实数）和技能发动造成的伤害（整数）。保证 $ p_i$ 最多包含四位小数，且为一个合法的概率。

输出格式：

对于每组数据，输出一行，包含一个实数，为这套卡牌在这一局游戏中造成的伤害的期望值。

对于每一行输出，只有当你的输出和标准答案的相对误差不超过 $ 10^{-8}$ 时——即 $ \frac{|a-o|}{a}\le 10^{-8}$ 时 (其中 $ a$ 是标准答案，$ o$ 是输出)，你的输出才会被判为正确。建议输出十位小数。

输入输出样例

输入样例：
1 
3 2 
0.5000 2 
0.3000 3 
0.9000 1
输出样例：
3.2660250000
样例解释：

一共有 $ 13$ 种可能的情况：

第一轮中，第 $ 1$ 张卡牌发动技能；第二轮中，第 $ 2$ 张卡牌发动技能；概率为 $ 0.15$，伤害为 $ 5$。

第一轮中，第 $ 1$ 张卡牌发动技能；第二轮中，第 $ 3$ 张卡牌发动技能；概率为 $ 0.315$，伤害为 $ 3$。

第一轮中，第 $ 1$ 张卡牌发动技能；第二轮不发动技能；概率为 $ 0.035$，伤害为 $ 2$。

第一轮中，第 $ 2$ 张卡牌发动技能；第二轮中，第 $ 1$ 张卡牌发动技能；概率为 $ 0.075$，伤害为 $ 5$。

第一轮中，第 $ 2$ 张卡牌发动技能；第二轮中，第 $ 3$ 张卡牌发动技能；概率为 $ 0.0675$，伤害为 $ 4$。

第一轮中，第 $ 2$ 张卡牌发动技能；第二轮不发动技能；概率为 $ 0.0075$，伤害为 $ 3$。

第一轮中，第 $ 3$ 张卡牌发动技能；第二轮中，第 $ 1$ 张卡牌发动技能；概率为 $ 0.1575$，伤害为 $ 3$。

第一轮中，第 $ 3$ 张卡牌发动技能；第二轮中，第 $ 2$ 张卡牌发动技能；概率为 $ 0.04725$，伤害为 $ 4$。

第一轮中，第 $ 3$ 张卡牌发动技能；第二轮不发动技能；概率为 $ 0.11025$，伤害为 $ 1$。

第一轮不发动技能；第二轮中，第 $ 1$ 张卡牌发动技能；概率为 $ 0.0175$，伤害为 $ 2$。

第一轮不发动技能；第二轮中，第 $ 2$ 张卡牌发动技能；概率为 $ 0.00525$，伤害为 $ 3$。

第一轮不发动技能；第二轮中，第 $ 3$ 张卡牌发动技能；概率为 $ 0.011025$，伤害为 $ 1$。

第一轮不发动技能；第二轮亦不发动技能；概率为 $ 0.001225$，伤害为 $ 0$。

造成伤害的期望值为概率与对应伤害乘积之和，为 $ 3.266025$。

数据范围与约定

对于所有测试数据， $ 1\le T\le 444, \ 1\le n\le 220, \ 0\le r\le 132, \ 0<p_i<1, \ 0\le d_i\le 1000$。

除非备注中有特殊说明，数据中 $ p_i$ 与 $ d_i$ 均为随机生成。

请注意可能存在的实数精度问题，并采取适当措施。

题解：

首先，如果直接一轮一轮地进行期望推导，会发现前面有冲突的情况。枚举第 $ i$ 轮第 $ j$ 张卡时既要保证前 $ i-1$ 轮都没有发动过第 $ j$ 张卡，又要保证第 $ i$ 轮没有发动过前 $ j-1$ 张卡，再乘 $ p_i$ 算概率。但是这样怎么算都算不对，其实感觉也是一个“意识”调题的过程吧，反正最终把样例调到 $ 3.21$ 左右发现概率对不上（样例解释），于是还是放弃了。

因此考虑建立无后效性的dp方程。因为需要满足 “如果发动了当前的卡”，那么就停止本轮，所以方程需要和前缀有关。令 $ f[i][j]$ 表示在所有的 $ r$ 轮里，前 $ i$ 张卡有 $ j$ 个发动了的概率。此时对于任意的第 $ k$ 张卡就可以用 $ f[k-1]$ 有关的数据推出来了。

考虑状态转移方程，对于 $ f[i][j]$，可以从 $ f[i-1][j-1]$ 或 $ f[i-1][j]$ 推过来。当从 $ f[i-1][j]$ 推过来时，表示第 $ i$ 张整场都没有发动，因此 $ f[i-1][j]$ 的贡献为 $ f[i-1][j]\times (1-p_i)^{r-j}$。

其中 $ (1-p_i)^{r-j}$ 表示在全部 $ r$ 轮中，由于在前 $ i-1$ 个中钦定了 $ j$ 个，占用了 $ j$ 轮，剩下的 $ r-j$ 轮中每次都没有发动第 $ i$ 张卡。

同时，为了便于理解，当我们dp做到 $ f[i]$ 时，如果认为第 $ i$ 张卡为此时的第一张卡，剩下的 $ r-j$ 轮里就只能选择下标为 $ [i,n]$ 的卡了。此时第 $ i$ 张卡的发动不受前 $ i-1$ 张的限制。

当从 $ f[i-1][j-1]$ 推过来时（首先要满足 $ j>0$），表示第 $ i$ 张被发动了，正难则反，被发动的概率就是用 $ 1$ 减去没有被发动的概率。而没有被发动的概率在上文中被提到了，是 $ (1-p_i)$ 的幂。此时由于只钦定了 $ j-1$ 张卡发动，所以指数为 $ r-j+1$。因此 $ f[i-1][j-1]$ 的贡献为 $ f[i-1][j-1]\times\left(1-(1-p_i)^{r-j+1}\right)$。

然后可以依次求出所有的 $ f$，此时我们再根据 $ f$ 推出每张卡被发动的概率 $ P_i$。

仿照上面 $ f[i-1][j-1]\to f[i][j]$ 的过程，我们可以直接算出
$$
P_i=\sum_{j=0}^{i-1}f[i-1][j]\times \left(1-(1-p_i)^{r-j}\right)
$$
答案是对每个 $ P_i$ 乘上伤害值 $ d_i$。

对每个 $ (1-p_i)$ 预处理幂后，时间复杂度为 $ O(nTr)$。

Code：

#include<cstdio>
#include<cstring>
#define db double
db f[233][233],p[233];
db q[233][233];//q[i][j]表示(1-p[i])^j
int d[233];
int main()
{
    int T;
    scanf("%d",&T);
    while(T--)
    {
        int n,r;
        scanf("%d%d",&n,&r);
        for(int i=1;i<=n;++i)
        {
            scanf("%lf%d",&p[i],&d[i]);
            q[i][0]=1;
            for(int j=1;j<=233;++j)
                q[i][j]=q[i][j-1]*(1-p[i]);
        }
        f[0][0]=1;
        for(int i=1;i<=n;++i)
            for(int j=0;j<=i&&j<=r;++j)
            {
                f[i][j]=j?f[i-1][j-1]*(1-q[i][r-j+1]):0;
                f[i][j]+=f[i-1][j]*q[i][r-j];
            }
        db ans=0;
        for(int i=1;i<=n;++i)
            for(int j=0;j<i&&j<r;++j)
                ans+=d[i]*(f[i-1][j]*(1-q[i][r-j]));
        printf("%.10lf\n",ans);
    }
    return 0;
}

DP 概率期望解题报告

wjyyy 博客

洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王题解【期望】【DP】

题目描述

输入输出格式

输入输出样例

数据范围与约定

题解：

Code：

说点什么

洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王 题解【期望】【DP】

题目描述

输入输出格式

输入输出样例

数据范围与约定

题解：

Code：

说点什么

洛谷 P3239 / loj 2112 [HNOI2015] 亚瑟王题解【期望】【DP】