В теории вероятностей неравенство Гаусса даёт верхнюю границу вероятности того, что одномодальная случайная величина выходит за пределы интервала с центром в её моде.
Пусть X — одномодальная случайная величина с модой m и пусть τ 2 есть математическое ожидание (X − m)2. (τ2 может также быть выражено как (μ − m)2 + σ2, где μ и σ являются средним значением и стандартным отклонением X.)
![{\displaystyle \Pr(|X-m|>k)\leq {\begin{cases}\left({\frac {2\tau }{3k}}\right)^{2},&{\text{if }}k\geq {\frac {2\tau }{\sqrt {3}}};\\[6pt]1-{\frac {k}{\tau {\sqrt {3}}}},&{\text{if }}0\leq k\leq {\frac {2\tau }{\sqrt {3}}}.\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0c58b5e8bd39cdb4a1f23e9329e71808ef397b6b)
Эта теорема была впервые доказана Гауссом в 1823 году.
Без ограничения общности можно считать, что мода находится в нуле, то есть
.
Рассмотрим вероятность того, что выполняется неравенство
, как функцию от
:
![{\displaystyle p\left(x\right)=\int \limits _{-x}^{x}f\left(z\right)dz.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6410d43f00124569efa0d339aad21b9951dee4d2)
Так как
является неотрицательной функцией, то
растёт с ростом
.
Кроме того, по определению определённого интеграла:
![{\displaystyle p\left(0\right)=0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b06efca40460b4b5f2042989536d3b0242ebbcd5)
В силу формулы Лейбница:
![{\displaystyle {\frac {dp}{dx}}=f\left(x\right)+f\left(-x\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f61694bd2a21a38490b48474e7528e34a806cb63)
Рассмотрим обратную функцию (квантиль) распределения случайной величины
:
![{\displaystyle x=q\left(p\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bf31918500bf346d2bab8480b279f1a174da694d)
В силу теоремы о производной обратной функции:
![{\displaystyle q^{\prime }\left(p\right)={\frac {dx}{dp}}=\left[{\frac {dp}{dx}}\right]^{-1}={\frac {1}{f\left(x\right)+f\left(-x\right)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/13eedf0fdb2c971f00ae73ff1b8665da80c1709a)
Заметим, что с ростом
возрастает и
, в силу унимодальности с ростом по модулю
функция
не возрастает, значит с ростом
функция
не убывает.
Линеаризация функции
[править | править код]
Выберем произвольную точку
и линеаризуем
точке
, то есть рассмотрим уравнение касательной прямой к этой функции в данной точке:
![{\displaystyle L\left(p\right)=q\left(p_{0}\right)+q^{\prime }\left(p_{0}\right)\left(p-p_{0}\right)=q_{0}+q^{\prime }\left(p_{0}\right)\left(p-p_{0}\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f80c9e0115fbe5c26d193da76eef16ccb9ef5745)
Данное уравнение можно переписать следующим образом:
![{\displaystyle L\left(p\right)=q^{\prime }\left(p_{0}\right)\left(p-p_{1}\right),}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8ebb5b295d335ffff68e62ff1e41afe96ae2aeba)
где
![{\displaystyle p_{1}=p_{0}-{\frac {q_{0}}{q^{\prime }\left(p_{0}\right)}}=p_{0}\left(1-{\frac {q_{0}}{p_{0}\cdot q^{\prime }\left(p_{0}\right)}}\right)=g\cdot p_{0}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/79caef22bad7f34f57122a1d7237d04a274c36f6)
Поскольку величины
,
и
являются неотрицательными, то
![{\displaystyle 0\leq p_{1}\leq p_{0},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dffcd01e374d8162ee8be6d2b0b8bcf8eabb3f46)
а значит
![{\displaystyle 0\leq g\leq 1.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dd54635d7b294e3e3023beed064ce00db95666fb)
Так как
не убывает с ростом
, а
то разность
имеет тот же знак, что
. Из этого следует, что величина
всегда является неотрицательной, а следовательно:
![{\displaystyle q\left(p\right)\geq L\left(p\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/47948992d781e393a02e1127b766af2274944a17)
Поскольку
то из
(то есть из
) следует
.
Проинтегрируем последнее неравенство в пределах от
до
:
![{\displaystyle \int _{p_{1}}^{1}L^{2}\left(p\right)dp\leq \int _{p_{1}}^{1}q^{2}\left(p\right)dp\leq \int _{0}^{1}q^{2}\left(p\right)dp=\int _{-\infty }^{+\infty }x^{2}\cdot f\left(x\right)dx.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ed370015ba826e6a83427ab4da765425525ed21e)
Последнее выражение обозначим как
:
![{\displaystyle \tau ^{2}=\int _{-\infty }^{+\infty }x^{2}\cdot f\left(x\right)dx.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/94016710a6e994e759fc9b319c7ded9a505502ae)
Данная величина есть математическое ожидание квадрата случайной величины
. По свойствам дисперсии:
![{\displaystyle \tau ^{2}=\mu ^{2}+\sigma ^{2},}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7c18dcc90ae212e4f86494a7c2b30bfd797297a1)
где
— дисперсия случайной величины
,
— её математическое ожидание.
Вычислим теперь интеграл в левой части последнего неравенства:
![{\displaystyle \int _{p_{1}}^{1}L^{2}\left(p\right)dp=\int _{p_{1}}^{1}\left[q^{\prime }\left(p_{0}\right)\right]^{2}\left(p-p_{1}\right)^{2}dp=\left[q^{\prime }\left(p_{0}\right)\right]^{2}\left.{\frac {\left(p-p_{1}\right)^{3}}{3}}\right|_{p_{1}}^{1}=\left[q^{\prime }\left(p_{0}\right)\right]^{2}{\frac {\left(1-p_{1}\right)^{3}}{3}}\leq \tau ^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5a8b6535a5cd53d18f90f96117edc759f172f848)
![{\displaystyle p_{1}=p_{0}-{\frac {q_{0}}{q^{\prime }\left(p_{0}\right)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4b3ad3d1f2e4787d94562cbd5e53dc38be9ab4db)
![{\displaystyle p_{0}-p_{1}={\frac {q_{0}}{q^{\prime }\left(p_{0}\right)}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/00f816ae6bd8623f8fb61a720e116d30cafe4756)
![{\displaystyle q^{\prime }\left(p_{0}\right)={\frac {q_{0}}{p_{0}-p_{1}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40e07f7877b31b6ef72af61b996534a432e12625)
![{\displaystyle \left[{\frac {q_{0}}{p_{0}-p_{1}}}\right]^{2}{\frac {\left(1-p_{1}\right)^{3}}{3}}\leq \tau ^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/092740a9ab7e4f3cf1c220c48bbce43c9c1842a0)
Преобразуем это неравенство к виду
![{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq {\frac {3\left(p_{0}-p_{1}\right)^{2}}{\left(1-p_{1}\right)^{3}}}={\frac {3\left(p_{0}-gp_{0}\right)^{2}}{\left(1-gp_{0}\right)^{3}}}={\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/af277ae68aaedab8ea7a2ec67864a0247c6503c8)
Исследуем верхнюю границу на экстремальные значения (в зависимости от значения
). Начнём с нахождения корней производной:
![{\displaystyle {\begin{aligned}{\frac {\partial }{\partial g}}\left[{\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}\right]=\\&=3p_{0}^{2}\cdot {\frac {2\left(1-g\right)\cdot \left(-1\right)\cdot \left(1-gp_{0}\right)^{3}-\left(1-g\right)^{2}\cdot 3\left(1-gp_{0}\right)^{2}\cdot \left(-p_{0}\right)}{\left(1-gp_{0}\right)^{6}}}=\\&={\frac {3p_{0}^{2}\left(1-g\right)\left(1-gp_{0}\right)^{2}\left[-2\left(1-gp_{0}\right)+3\left(1-g\right)p_{0}\right]}{\left(1-gp_{0}\right)^{6}}}=\\&={\frac {3p_{0}^{2}\left(1-g\right)}{\left(1-gp_{0}\right)^{4}}}\left[-2+2gp_{0}+3p_{0}-3gp_{0}\right]=\\&=-{\frac {3p_{0}^{2}\left(1-g\right)}{\left(1-gp_{0}\right)^{4}}}\left[2-3p_{0}+gp_{0}\right]\\\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/08ed1a2a617e5a720c142b1f9c6c6b2540368944)
Множитель перед квадратными скобками всегда отрицателен. Определим, когда выражения в квадратных скобках обращается в нуль:
![{\displaystyle 2-3p_{0}+g_{0}\cdot p_{0}=0.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1cc8d0503e4cd0aa4cee987ef8340c23cf77d573)
Решая данное уравнение, получим:
![{\displaystyle g_{0}\cdot p_{0}=3p_{0}-2.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5717fa0ea6fd46d458b9586c83b8a07bb8cbaea9)
![{\displaystyle g_{0}=3-{\frac {2}{p_{0}}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0bb998f69b05ca12be534dec7d58eaaece9631e3)
Величина
также должно удовлетворять условию
:
![{\displaystyle 0\leq 3-{\frac {2}{p_{0}}}\leq 1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1314075a25cbdae37fb39740a8442ffb6b247d44)
Решая данное неравенство, получим:
![{\displaystyle -3\leq -{\frac {2}{p_{0}}}\leq -2}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4b6a1ed661e6b0ccf4279f9bdd15be87133734d9)
![{\displaystyle 2\leq {\frac {2}{p_{0}}}\leq 3}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d790358033256200f43e7596ac5437fe611880c6)
![{\displaystyle {\frac {1}{3}}\leq {\frac {p_{0}}{2}}\leq {\frac {1}{2}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4d4312022b9458757375cdf15b054cee0edd8fd3)
![{\displaystyle {\frac {2}{3}}\leq p_{0}\leq 1.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b3310be667e9d26998d707c6c50263db527b6916)
Правое неравенство не даёт дополнительной информации. Левое же говорит, что корень будет принадлежать
только при
Рассмотрим сначала случай
.
В этом случае всегда
![{\displaystyle {\frac {\partial }{\partial g}}\left[{\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}\right]\leq 0,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/04ec8f2c1add9417742fab0b8635268f4b0b6b81)
а следовательно максимум выражения в квадратных скобках достигается при
:
![{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq 3p_{0}^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7538468e37063832e59e55ed01e4bd2daa82d3e8)
или
![{\displaystyle p_{0}\leq {\frac {q_{0}}{\tau {\sqrt {3}}}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/55c665473512c2c7a9f427ab1622f71ea0967333)
Если же
, то максимум будет в точке
Вычислим необходимые нам величины:
![{\displaystyle 1-g_{0}=1-3+{\frac {2}{p_{0}}}={\frac {2}{p_{0}}}-2={\frac {2\left(1-p_{0}\right)}{p_{0}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2490328500c111bfd8419359e1341051ae1f510f)
и
![{\displaystyle 1-g_{0}p_{0}=1-\left(3p_{0}-2\right)=3\left(1-p_{0}\right).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a6040f2ffb9646d257396865b2c8e0b8e5fb2e96)
Подставляя эти выражения в исследуемое неравенство, получим:
![{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq {\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}={\frac {3p_{0}^{2}}{3^{3}\left(1-p_{0}\right)^{3}}}{\frac {2^{2}\left(1-p_{0}\right)^{2}}{p_{0}^{2}}}=\left({\frac {2}{3}}\right)^{2}{\frac {1}{1-p_{0}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fa4c6b766d998f6f540b9b04730d15e046a51bd2)
или
![{\displaystyle 1-p_{0}\leq \left({\frac {2}{3}}\right)^{2}{\frac {\tau ^{2}}{q_{0}^{2}}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7d6d42f0cb0d6b68eea89a2b9418aafffc839e44)
Объединим полученные неравенства:
![{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq {\begin{cases}3p_{0}^{2},&p_{0}\leq {\frac {2}{3}}\\{\frac {4}{9}}{\frac {1}{\left(1-p_{0}\right)}},&p_{0}>{\frac {2}{3}}\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/57dcdceac0827286e21df9814b97bda5924f84f3)
Извлекая квадратный корень, окончательно получим:
![{\displaystyle {\frac {q_{0}}{\tau }}\leq {\begin{cases}{\sqrt {3}}p_{0},&p_{0}\leq {\frac {2}{3}}\\{\frac {2}{3}}{\frac {1}{\sqrt {1-p_{0}}}},&p_{0}>{\frac {2}{3}}\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/27b7ebba2d114e5ae041628a31005d7d59f9f5ed)
Если
, то
![{\displaystyle {\frac {q_{0}^{2}}{\tau ^{2}}}\leq 3p_{0}^{2}\leq 3\left({\frac {2}{3}}\right)^{2}={\frac {4}{3}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/00a98689c267d0e70ccd13bbdec596e442eea4d1)
Откуда получаем
![{\displaystyle q_{0}\leq {\frac {2\tau }{\sqrt {3}}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e759da89f340c775fbf8d1518db0bf077c98ee95)
Это позволяет получить следующее неравенство:
![{\displaystyle 1-p_{0}={\begin{cases}1-{\frac {q_{0}}{{\sqrt {3}}\tau }},&q_{0}\leq {\frac {2\tau }{\sqrt {3}}}\\{\frac {4}{9}}{\frac {\tau ^{2}}{q_{0}^{2}}},&q_{0}\geq {\frac {2\tau }{\sqrt {3}}}\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8e84407008b1f63f14b34f1e73f9a7e208a14118)
Обозначая
и
, получим:
![{\displaystyle \Pr \left\{\left|X\right|>x\right\}={\begin{cases}1-{\frac {x}{{\sqrt {3}}\tau }},&x\leq {\frac {2\tau }{\sqrt {3}}}\\{\frac {4}{9}}{\frac {\tau ^{2}}{x^{2}}},&x\geq {\frac {2\tau }{\sqrt {3}}}\end{cases}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2fff88bcd012f41719182d58886211195cae43de)
Выше мы предполагали, что мода случайной величины
равна нулю. В случае произвольной моды
, нужно приведённые выше рассуждения применить к случайной величине
, мода которой, очевидно, равна нулю. Тогда последняя формула примет вид:
![{\displaystyle \Pr \left\{\left|X-m\right|>x\right\}={\begin{cases}1-{\frac {x}{{\sqrt {3}}\tau }},&x\leq {\frac {2\tau }{\sqrt {3}}}\\{\frac {4}{9}}{\frac {\tau ^{2}}{x^{2}}},&x\geq {\frac {2\tau }{\sqrt {3}}}\end{cases}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/697b00d00280ba30ffec3761e79a9c4bdfd6e42d)
Величина
перейдём, по свойствам математического ожидания и дисперсии, в
![{\displaystyle \tau ^{2}=\left(\mu -m\right)^{2}+\sigma ^{2}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f7d982d287be041206be26e12d8f058535d9c3de)
Таким образом, теорема полностью доказана.
- Gauss, C. F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae, Pars Prior (англ.) // Commentationes Societatis Regiae Scientiarum Gottingensis Recentiores : journal. — 1823. — Vol. 5.
- Gauss C. F. Gauss’s work 1803-1826) on the Theory of Least Squares / English translation by H. F. Trotter. — Princeton, NJ: Princeton University Press, 1957. — С. 10—13. Архивировано 24 декабря 2016 года. Архивная копия от 24 декабря 2016 на Wayback Machine
- Upton, Graham; Cook, Ian. Gauss inequality // A Dictionary of Statistics (англ.). — Oxford University Press, 2008.
- Sellke, T.M.; Sellke, S.H. Chebyshev inequalities for unimodal distributions (англ.) // American Statistician (англ.) (рус. : journal. — American Statistical Association, 1997. — Vol. 51, no. 1. — P. 34—40. — doi:10.2307/2684690. — JSTOR 2684690.
- Pukelsheim, F. The Three Sigma Rule (англ.) // American Statistician (англ.) (рус. : journal. — American Statistical Association, 1994. — Vol. 48, no. 2. — P. 88—91. — doi:10.2307/2684253. — JSTOR 2684253.