В теории вероятностей неравенство Гаусса даёт верхнюю границу вероятности того, что одномодальная случайная величина выходит за пределы интервала с центром в её моде.
Пусть X — одномодальная случайная величина с модой m и пусть τ 2 есть математическое ожидание (X − m)2. (τ2 может также быть выражено как (μ − m)2 + σ2, где μ и σ являются средним значением и стандартным отклонением X.)
![{\displaystyle \Pr(|X-m|>k)\leq {\begin{cases}\left({\frac {2\tau }{3k}}\right)^{2},&{\text{if }}k\geq {\frac {2\tau }{\sqrt {3}}};\\[6pt]1-{\frac {k}{\tau {\sqrt {3}}}},&{\text{if }}0\leq k\leq {\frac {2\tau }{\sqrt {3}}}.\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0c58b5e8bd39cdb4a1f23e9329e71808ef397b6b)
Эта теорема была впервые доказана Гауссом в 1823 году.
Без ограничения общности можно считать, что мода находится в нуле, то есть
.
Рассмотрим вероятность того, что выполняется неравенство
, как функцию от
:

Так как
является неотрицательной функцией, то
растёт с ростом
.
Кроме того, по определению определённого интеграла:

В силу формулы Лейбница:

Рассмотрим обратную функцию (квантиль) распределения случайной величины
:

В силу теоремы о производной обратной функции:
![{\displaystyle q^{\prime }\left(p\right)={\frac {dx}{dp}}=\left[{\frac {dp}{dx}}\right]^{-1}={\frac {1}{f\left(x\right)+f\left(-x\right)}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/13eedf0fdb2c971f00ae73ff1b8665da80c1709a)
Заметим, что с ростом
возрастает и
, в силу унимодальности с ростом по модулю
функция
не возрастает, значит с ростом
функция
не убывает.
Линеаризация функции
[править | править код]
Выберем произвольную точку
и линеаризуем
точке
, то есть рассмотрим уравнение касательной прямой к этой функции в данной точке:

Данное уравнение можно переписать следующим образом:

где

Поскольку величины
,
и
являются неотрицательными, то

а значит

Так как
не убывает с ростом
, а
то разность
имеет тот же знак, что
. Из этого следует, что величина
всегда является неотрицательной, а следовательно:

Поскольку
то из
(то есть из
) следует
.
Проинтегрируем последнее неравенство в пределах от
до
:

Последнее выражение обозначим как
:

Данная величина есть математическое ожидание квадрата случайной величины
. По свойствам дисперсии:

где
— дисперсия случайной величины
,
— её математическое ожидание.
Вычислим теперь интеграл в левой части последнего неравенства:
![{\displaystyle \int _{p_{1}}^{1}L^{2}\left(p\right)dp=\int _{p_{1}}^{1}\left[q^{\prime }\left(p_{0}\right)\right]^{2}\left(p-p_{1}\right)^{2}dp=\left[q^{\prime }\left(p_{0}\right)\right]^{2}\left.{\frac {\left(p-p_{1}\right)^{3}}{3}}\right|_{p_{1}}^{1}=\left[q^{\prime }\left(p_{0}\right)\right]^{2}{\frac {\left(1-p_{1}\right)^{3}}{3}}\leq \tau ^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5a8b6535a5cd53d18f90f96117edc759f172f848)



![{\displaystyle \left[{\frac {q_{0}}{p_{0}-p_{1}}}\right]^{2}{\frac {\left(1-p_{1}\right)^{3}}{3}}\leq \tau ^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/092740a9ab7e4f3cf1c220c48bbce43c9c1842a0)
Преобразуем это неравенство к виду

Исследуем верхнюю границу на экстремальные значения (в зависимости от значения
). Начнём с нахождения корней производной:
![{\displaystyle {\begin{aligned}{\frac {\partial }{\partial g}}\left[{\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}\right]=\\&=3p_{0}^{2}\cdot {\frac {2\left(1-g\right)\cdot \left(-1\right)\cdot \left(1-gp_{0}\right)^{3}-\left(1-g\right)^{2}\cdot 3\left(1-gp_{0}\right)^{2}\cdot \left(-p_{0}\right)}{\left(1-gp_{0}\right)^{6}}}=\\&={\frac {3p_{0}^{2}\left(1-g\right)\left(1-gp_{0}\right)^{2}\left[-2\left(1-gp_{0}\right)+3\left(1-g\right)p_{0}\right]}{\left(1-gp_{0}\right)^{6}}}=\\&={\frac {3p_{0}^{2}\left(1-g\right)}{\left(1-gp_{0}\right)^{4}}}\left[-2+2gp_{0}+3p_{0}-3gp_{0}\right]=\\&=-{\frac {3p_{0}^{2}\left(1-g\right)}{\left(1-gp_{0}\right)^{4}}}\left[2-3p_{0}+gp_{0}\right]\\\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/08ed1a2a617e5a720c142b1f9c6c6b2540368944)
Множитель перед квадратными скобками всегда отрицателен. Определим, когда выражения в квадратных скобках обращается в нуль:

Решая данное уравнение, получим:


Величина
также должно удовлетворять условию
:

Решая данное неравенство, получим:




Правое неравенство не даёт дополнительной информации. Левое же говорит, что корень будет принадлежать
только при
Рассмотрим сначала случай
.
В этом случае всегда
![{\displaystyle {\frac {\partial }{\partial g}}\left[{\frac {3p_{0}^{2}\left(1-g\right)^{2}}{\left(1-gp_{0}\right)^{3}}}\right]\leq 0,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/04ec8f2c1add9417742fab0b8635268f4b0b6b81)
а следовательно максимум выражения в квадратных скобках достигается при
:

или

Если же
, то максимум будет в точке
Вычислим необходимые нам величины:

и

Подставляя эти выражения в исследуемое неравенство, получим:

или

Объединим полученные неравенства:

Извлекая квадратный корень, окончательно получим:

Если
, то

Откуда получаем

Это позволяет получить следующее неравенство:

Обозначая
и
, получим:

Выше мы предполагали, что мода случайной величины
равна нулю. В случае произвольной моды
, нужно приведённые выше рассуждения применить к случайной величине
, мода которой, очевидно, равна нулю. Тогда последняя формула примет вид:

Величина
перейдём, по свойствам математического ожидания и дисперсии, в

Таким образом, теорема полностью доказана.
- Gauss, C. F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae, Pars Prior (англ.) // Commentationes Societatis Regiae Scientiarum Gottingensis Recentiores : journal. — 1823. — Vol. 5.
- Gauss C. F. Gauss’s work 1803-1826) on the Theory of Least Squares / English translation by H. F. Trotter. — Princeton, NJ: Princeton University Press, 1957. — С. 10—13. Архивировано 24 декабря 2016 года. Архивная копия от 24 декабря 2016 на Wayback Machine
- Upton, Graham; Cook, Ian. Gauss inequality // A Dictionary of Statistics (англ.). — Oxford University Press, 2008.
- Sellke, T.M.; Sellke, S.H. Chebyshev inequalities for unimodal distributions (англ.) // American Statistician (англ.) (рус. : journal. — American Statistical Association, 1997. — Vol. 51, no. 1. — P. 34—40. — doi:10.2307/2684690. — JSTOR 2684690.
- Pukelsheim, F. The Three Sigma Rule (англ.) // American Statistician (англ.) (рус. : journal. — American Statistical Association, 1994. — Vol. 48, no. 2. — P. 88—91. — doi:10.2307/2684253. — JSTOR 2684253.