V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mutelog
V2EX  ›  程序员

正态分布样本最大值服从什么分布

  •  1
     
  •   mutelog · 2021-02-10 01:11:47 +08:00 · 2835 次点击
    这是一个创建于 1143 天前的主题,其中的信息可能已经有所发展或是发生改变。
    从一个服从 N(μ, σ)的总体中抽取容量为 m 的样本,求 m 的最大值服从什么分布?
    25 条回复    2021-02-11 13:45:52 +08:00
    mutelog
        1
    mutelog  
    OP
       2021-02-10 01:24:39 +08:00
    更正:求样本的最大值服从什么分布
    Jooooooooo
        2
    Jooooooooo  
       2021-02-10 01:28:56 +08:00   ❤️ 2
    简单搜了一下似乎并不是一个简单的题目

    相关的帖子: math.stackexchange.com/questions/473229/expected-value-for-maximum-of-n-normal-random-variable
    noqwerty
        3
    noqwerty  
       2021-02-10 01:35:15 +08:00 via Android
    necomancer
        4
    necomancer  
       2021-02-10 02:12:31 +08:00   ❤️ 3
    如果是 iid 似乎很简单吧,对任意分布取 n 个值(X_i),则 P(max(X_i)<=x)=P(x)^n,P 是 cdf,pdf 的话求个导 q(x)=nP(x)^{n-1}p(x), 其中 p 是 P 对应的 pdf
    green15
        5
    green15  
       2021-02-10 03:01:09 +08:00 via iPhone
    看不明白楼主说什么……印象中统计有这么一说,只要样本数量增加到足够大,不管原来是什么分布,都会趋向于正态
    xupefei
        6
    xupefei  
       2021-02-10 03:55:54 +08:00 via iPhone
    拍了拍脑袋,应该是标准分布
    noqwerty
        7
    noqwerty  
       2021-02-10 04:35:27 +08:00
    @green15 #5 你说的中心极限定理 (CLT) 是说样本量足够大的时候变量均值的分布会接近正态分布,并不能推广到最大值 /最小值
    tankren
        8
    tankren  
       2021-02-10 09:00:15 +08:00
    高数?
    Mohanson
        9
    Mohanson  
       2021-02-10 09:13:18 +08:00 via Android
    和 m 有关,如果 m 无限大就是常数,m 为 1 就是高斯 其他的有请大佬
    northisland
        10
    northisland  
       2021-02-10 09:38:09 +08:00
    @Jooooooooo 简单说,是中大奖分布的期望。确实不简单。stackexhange 上牛人多。
    Nillouise
        11
    Nillouise  
       2021-02-10 09:54:31 +08:00
    写个程序模拟看看不就知道了吗?
    Nillouise
        12
    Nillouise  
       2021-02-10 09:57:13 +08:00
    @Mohanson,m 为 1 的时候不是正太分布吗?
    collery
        13
    collery  
       2021-02-10 10:02:39 +08:00
    正态分布是啥来着
    xelatex
        14
    xelatex  
       2021-02-10 10:20:01 +08:00
    留意到样本最大值小于某个数和所有样本小于那个数是等价的,假设独立,可以写出样本最大值的累积分布函数。这东西恐怕没有初等表示。画了两个图,可以感觉一下。
    i.loli.net/2021/02/10/KoupVg8G92lRj4Y.png
    i.loli.net/2021/02/10/YMbQF9PpyBxvmO2.png
    hsfzxjy
        15
    hsfzxjy  
       2021-02-10 10:20:57 +08:00 via Android   ❤️ 1
    同意 @necomancer #4 这其实就是第 m 顺序统计量 https://en.m.wikipedia.org/wiki/Order_statistic
    zst
        16
    zst  
       2021-02-10 10:41:12 +08:00
    这是次序统计量的分布问题吧
    superhxl
        17
    superhxl  
       2021-02-10 10:55:41 +08:00
    说正态分布的同学没看清楚吧,样本、总体都是正态分布,但楼主说的是最大值。
    Raven316
        18
    Raven316  
       2021-02-10 10:58:24 +08:00
    noqwerty
        19
    noqwerty  
       2021-02-10 11:43:54 +08:00
    @necomancer #4 问题应该就是求导这步,不像 Uniform distribution 这种很容易按公式推出解析解
    Harry1993
        20
    Harry1993  
       2021-02-10 12:13:00 +08:00
    這裏有關於指數分佈的一篇文章,類似的方法應該套用到高斯分佈。

    https://arxiv.org/abs/1307.3945
    zmx976508106
        21
    zmx976508106  
       2021-02-10 14:12:12 +08:00 via iPhone
    感觉是 beta 分布
    zmx976508106
        22
    zmx976508106  
       2021-02-10 14:12:54 +08:00 via iPhone
    @xelatex 这个应该是 beta 分布
    nuistzhou
        23
    nuistzhou  
       2021-02-10 15:30:34 +08:00 via iPhone
    @Nillouise 知识点:正态分布又叫高斯分布
    hemind
        24
    hemind  
       2021-02-11 13:22:28 +08:00
    @necomancer 你求的结果是 n 个值都比 x 小的概率,和 n 个值中的最大值为 x 不是一个概念。应该直接写 pdf,q(max(X_i) = x) = p(x) * P(x)^(n-1),意为一个值直接取 x,其他值都比 x 小。
    hemind
        25
    hemind  
       2021-02-11 13:45:52 +08:00
    我上面应该要乘以 n,q(max(X_i) = x) =n * p(x) * P(x)^(n-1),每个值都可能取到最大值 x 。后来仔细想了下 @necomancer 的结果和我的是一样的,我之前理解错了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1227 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 18:04 · PVG 02:04 · LAX 11:04 · JFK 14:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.