II. Математическая модель лотереи СПОРТЛОТО.

Числовые лотереи появились в СССР с середины 70-х годов. Известно несколько их модификаций, из которых, в силу ряда причин и, прежде всего, уникальной по объему статистики, нами выбрана лотерея "Спортлото 5 из 36" (см. Приложение А). Далее, если иное специально не оговорено, мы будем подразумевать именно ее. Из описания игры очевидно, что она представляет из себя типичное испытание Бернулли которое подчиняется биномиальному распределению (см., например, [10, 11]). Количество выигравших вариантов, соответственно, должно совпадать с теоретически ожидаемым (в пределах допустимых отклонений) и вся ситуация, казалось бы, не может служить объектом далеко идущих исследований или недоумений.

Однако это АБСОЛЮТНО не так.

В соответствие с комбинаторикой, из конечного набора элементов можно составить лишь конечное число неповторяющихся вариантов определенной длины. Число всех возможных вариантов, состоящих из j произвольных неповторяющихся цифр, выбранных из множества цифр от 1 до i, равно:

n = C(i,j)= { i! } / { j!*(i-j)!}

, где i! = 1*2*3*...*i - факториал. В нашем случае, i = 36 - мощность множества, из которых составляются варианты, j = 5 - количество цифр в одном варианте.

Число вариантов, в которых с некоторым фиксированным вариантом "Z" совпадает ровно m цифр, равно:

n(m) = C(j,m) * C((i-j),(j-m))

и, в нашем случае:

n(m) = C(5,m) * C(31,(5-m))

, где m изменяется от 0 до 5 и равно числу цифр, совпадающих с цифрами в варианте "Z".

Поясним это на примере: пусть в тираже реализовался выигрышный вариант "Z", состоящий из цифр: (1, 3, 11, 27, 36). Тогда, если один из "играющих" (т.е. присланных к тиражу) вариантов состоит из цифр (1, 7, 12, 27, 36), то для этого варианта m=3, т.к. с "Z" совпали ТРИ цифры (1, 27, 36). Для другого "играющего" варианта, например (1, 3, 25, 27, 36), m=4, и т.д.

Договоримся о дальнейших постоянных обозначениях. Индекс "m" имеет смысл, разъясненный в предыдущем абзаце. "Играющее" число вариантов будем обозначать как N или V. Будем использовать везде, как равноценные, обозначения p(m) и pTeor(m) для теоретического значения вероятности удач и pEx(m) для ее экспериментального значения. В целях упрощения восприятия формул и переменных, мы будем часто записывать их для конкретного "m" без указания самого этого индекса. Таким образом вместо pEx(m), может быть записано pEx, и B(N,K,p) вместо B(N,K,p(m)). Подобное упрощение не может вызвать затруднений, т.к. по контексту всегда ясно о чем именно идет речь.

Очевидно, что теоретическая вероятность угадать ровно m цифр равна: p(m) = n(m) / n, а ожидаемое распределение числа удач (угадываний) описывается биномиальным распределением:

B(N,K,p(m))=C(N,K) * [ p(m)^k ] * [ q(m)^(N-K) ]

, где B(N,K,p(m)) - вероятность того, что из N участвующих в данном тираже вариантов, в K вариантах, ровно m цифр (т.е. или 0, или 1, ..., или 5) совпадут с входящими в выигрышный вариант "Z" цифрами, p(m) - вероятность угадать ровно m цифр, q(m) = 1 - p(m).

Для обозримости теоретические значения сведены в таблицу 1.

Математическое ожидание числа удач для биномиального распределения (т.е ожидаемое число вариантов, в которых произойдет угадывание m цифр), вычисляется как: M(m) = N * p(m) , а дисперсия выборки равна D(m) = N * p(m) * q(m). Максимум распределение достигается при значении К, находящемся в интервале [pTeor*(N+1)-1; pTeor*(N+1)] и, т.о. практически совпадает с M(m).