На этой странице Вы найдете интересную модификацию базисного понятия случайной выборки по функции распределения на основе предшествующих выпадений . Она подразумевает выборку с вероятностями, обратно пропорциональными к частотам. Предыдущая статья иллюстрировала процесс дискретизации, который уделяет внимание "горячим" числам: которые наиболее часто выпадали в прошлом. В этой статье речь пойдет о "холодных" числах: которые наименее часто выпадали в прошлом. Механизм, лежащий в основе этого подхода немного сложен, хотя и нетруден для понимания. Так что я не буду надолго останавливаться на том, почему это работает. Мы будем использовать тот же самый набор статистических данных частот Лото-Плюс, которые Вы видели прежде, но другие столбцы в таблице будут получены по-другому. Я настроил электронную таблицу для расчетов с точностью до 5 знаков после запятой. Записи в столбце с заголовком 1/F - это обратные величины частот: 1 к 15, 1 к 10, 1 к 11, и так далее. Это просто "рабочий столбец", предназначенный для вычисления полной суммы, которая и приведена внизу -4.79864. В следующем столбце с заголовком IRF расположены значения, соответствующие записям "1/F" поделенным каждый на 4.79864. Это число - коэффициент "нормализации", который преобразовывает числа столбца "1/F" к числам , подобно относительным частотам, которые составляют в сумме 1.00000. Название IRF здесь переводится как " обратная относительная частота", числа этого столбца, подобно относительным частотам, позволяют нам присвоить большую вероятность числу, которое встречается наименее часто. Наконец, записи в столбце с названием CIRF , обозначающим " накопительную обратную относительную частоту, " получены добавлением текущего значения в столбце IRF к предыдущему значению в столбце CIRF _N_ _F_ _1/F_ _IRF_ _CIRF_ 1 15 0.06667 0.01389 0.01389 2 10 0.10000 0.02084 0.03473 3 11 0.09091 0.01894 0.05368 4 11 0.09091 0.01894 0.07262 5 11 0.09091 0.01894 0.09157 6 5 0.20000 0.04168 0.13324 7 8 0.12500 0.02605 0.15929 8 6 0.16667 0.03473 0.19403 9 4 0.25000 0.05210 0.24610 10 8 0.12500 0.02605 0.27217 11 10 0.10000 0.02084 0.29301 12 12 0.08333 0.01737 0.31038 13 11 0.09091 0.01894 0.32932 14 16 0.06250 0.01302 0.34235 15 11 0.09091 0.01894 0.36129 16 7 0.14286 0.02977 0.39106 17 12 0.08333 0.01737 0.40843 18 9 0.11111 0.02315 0.43158 19 5 0.20000 0.04168 0.47326 20 9 0.11111 0.02315 0.49642 21 10 0.10000 0.02084 0.51726 22 9 0.11111 0.02315 0.54041 23 4 0.25000 0.05210 0.59251 24 8 0.12500 0.02605 0.61856 25 12 0.08333 0.01737 0.63592 26 12 0.08333 0.01737 0.65329 27 8 0.12500 0.02605 0.67934 28 11 0.09091 0.01894 0.69828 29 7 0.14286 0.02977 0.72805 30 11 0.09091 0.01894 0.74700 31 9 0.11111 0.02315 0.77015 32 6 0.16667 0.03473 0.80489 33 7 0.14286 0.02977 0.83466 34 6 0.16667 0.03473 0.86939 35 11 0.09091 0.01894 0.88833 36 8 0.12500 0.02605 0.91438 37 16 0.06250 0.01302 0.92741 38 13 0.07692 0.01603 0.94344 39 5 0.20000 0.04168 0.98511 40 _14_ _0.07143_ 0.01489 1.00000 Total: 378 SUM=4.79864 Крайний левый столбец в таблице - конечно набор чисел от 1 до 40, в то время как столбец справа теперь становится столбцом " накопительной относительной частотой ", который мы используем для сравнения с числами, полученными с помощью RAND() функции. Эти два столбца образуют "эффективную" функцию распределения, которая позволит нам случайным образом отобрать числа с вероятностями, обратно пропорциональными к частоте. Для разъяснения посмотрим результат выбора чисел Лото с помощью этого нового распределения, используя те же самые случайные равномерные числа, которые мы использовали в предыдущей статье. Они были: 0.2141___0.2963___0.9197___0.6417___0.5223___0.4543 В табличной форме имеются случайные равномерные числа и числа , которые мы выбрали бы из нашей новой функции распределения, которая подчеркивает "холодные" числа. _Uniform Number__Lotto Number_ 0.2141 9 0.2963 12 0.9197 37 0.6417 26 0.5223 22 0.4543 19 Здесь сравниваются два различных билета Лото, которые мы выбрали, сначала (см. предыдущую статью) билет с "горячими числами", затем билет с "холодными числами". Прямо пропорциональная выборка: 9, 13, 18, 21, 26, 38 Обратно пропорциональная выборка: 9, 12, 19, 22, 26, 37 Поскольку Вы можете видеть, эти два билета очень похожи, но в то же время существенно отличаются с точки зрения билетов лотереи, в которой вы хотите угадать все 6 отмеченных чисел. Мы не должны удивляться тому, что шесть чисел, выбранные в этих двух билетах являются столь похожими, если помнить, что мы используем тот же самый набор случайных равномерных чисел для их выбора. Мы использовали две различных функции распределения- да, но прежде всего главный фактор, влияющий на отбор чисел - набор чисел, выданных нам RAND() функцией. Каждое из распределений было накопительным распределением, и одиночное число из RAND () функции должно дать числа по каждому распределению, которые, как ожидается, будут одинаковыми или же близкими друг к другу. Как бы я выбрал два билета Лото чтобы сорвать джекпот? Так, как я показал Вам выше. Я выбираю набор тех 6 случайных равномерных чисел, использующих RAND () функцию, затем формировал один билет прямо пропорциональным способом и другой билет обратно пропорциональным способом. А почему бы и нет? Это - забава, но это и хобби.
|