Перепрыгнеть в содержание


- - - - -

Выявление умных денег в спортивном беттинге


226 ответов в эту тему

#81 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 12 June 2018 - 21:40

Мы имеем дело с исходами, которые характеризуются вероятностями - это вероятности единичного исхода. Совокупность таких исходов - случайная величина, подчиняющаяся определенному закону распределения.
Наши спортивные исходы рапределены по биномиальному ЗАКОНу (надеюсь, вам это доказывать не нужно)

Для определения самого закона в дифференциальном виде используют формулу

вероятность (m,n)=(количество сочетаний по m из n) *Р^m *(1-Р)^(n-m)

Если хотим определить как распределена реально наша случайная величина, то разбивают все результаты на группы по n элементов.
Подсчитывают в каждой группе количество сбывшихся результатов (то есть "1").
Находят среднее (МО) из всех групп.

Подсчитывают частоты

0 раз из n
1 раз из n
2 раз из n
.......
n раз из n

Находят дисперсию, беря значения в каждой группе относительно найденного среднего

А по найденным частотам строят ГИСТОГРАММУ распределения и сравнивают ее с теоретическим ЗАКОНОМ распределения

Если это вам не понятно, то сперва надо освоить...

У меня режим - пью и сплю по расписанию...
Если будет необходимость, продолжим в другой раз....

#82 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 12 June 2018 - 21:59

СообщенияДипломат, on 12 June 2018 - 21:40, сказал:

Мы имеем дело с исходами, которые характеризуются вероятностями - это вероятности единичного исхода. Совокупность таких исходов - случайная величина, подчиняющаяся определенному закону распределения.
Наши спортивные исходы рапределены по биномиальному ЗАКОНу (надеюсь, вам это доказывать не нужно)

Для определения самого закона в дифференциальном виде используют формулу

вероятность (m,n)=(количество сочетаний по m из n) *Р^m *(1-Р)^(n-m)

Если хотим определить как распределена реально наша случайная величина, то разбивают все результаты на группы по n элементов.
Подсчитывают в каждой группе количество сбывшихся результатов (то есть "1").
Находят среднее (МО) из всех групп.

Подсчитывают частоты

0 раз из n
1 раз из n
2 раз из n
.......
n раз из n

Находят дисперсию, беря значения в каждой группе относительно найденного среднего

А по найденным частотам строят ГИСТОГРАММУ распределения и сравнивают ее с теоретическим ЗАКОНОМ распределения

Если это вам не понятно, то сперва надо освоить...

У меня режим - пью и сплю по расписанию...
Если будет необходимость, продолжим в другой раз....
Я же написал что у меня есть где можно посмотреть не в окнах степ-бай-степ а когда окно сдвигают на позицию в последовательности (я думаю разницы не будет особой (просто окон больше) там всё показывает по частотам что вы говорите. Только что это нам даёт для игры? я вам предлагаю не определять факт что из разных
СВ составлена совокупность а раздербанить её при условии что в качестве свидетельства дан тока кефф . Ну вы ж сами понимаете что это невозможно... а то что вы предлагаете мы уже обсуждали тут на форуме...что надо брать окна там чего-то считать потом плясать с бубном итд итп....
Это всё сделать не проблема...а что потом-то? ну вот допустим я даже вам сказал что да там смесь и что далее? даже если я знаю с какой частотой я генерил то я один хрен не могу сказать не подсмотрев в формулу для ячейки из чего что произросло...а тогда как мы будем решение принимать по взятию сих и отвержению этих?
Вот как, с вашей точки зрения, должен игрок действовать(что берём-с а что в мусорную корзину)?

Отредактировано Bambuk, 12 June 2018 - 22:01.


#83 OFFLINE   sergei-777

    Специалист


  • mp
  • 1149 сообщения
116

Добавлено 12 June 2018 - 22:18

А у меня в excel`e получилось при фиксированной вероятности и изменяемых пропорций финпотоков - БК по каждому исходу в плюсе.
Правда на коленке сварганил и может чего-то намудрил...
Там ниже ещё 999 моделирований изменения финпотоков, вер-ти и столбец с движением линии фиксированы. Справа в углу под П1 и П2 убыток игроков (значит прибыль БК).
Прикрепленный файл  вер-ть + фин. потоки.png   48.04K   2 Количество загрузок

#84 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 13 June 2018 - 06:01

СообщенияBambuk, on 12 June 2018 - 21:59, сказал:

Я же написал что у меня есть где можно посмотреть не в окнах степ-бай-степ а когда окно сдвигают на позицию в последовательности (я думаю разницы не будет особой (просто окон больше) там всё показывает по частотам что вы говорите. Только что это нам даёт для игры? я вам предлагаю не определять факт что из разных
СВ составлена совокупность а раздербанить её при условии что в качестве свидетельства дан тока кефф . Ну вы ж сами понимаете что это невозможно... а то что вы предлагаете мы уже обсуждали тут на форуме...что надо брать окна там чего-то считать потом плясать с бубном итд итп....
Это всё сделать не проблема...а что потом-то? ну вот допустим я даже вам сказал что да там смесь и что далее? даже если я знаю с какой частотой я генерил то я один хрен не могу сказать не подсмотрев в формулу для ячейки из чего что произросло...а тогда как мы будем решение принимать по взятию сих и отвержению этих?
Вот как, с вашей точки зрения, должен игрок действовать(что берём-с а что в мусорную корзину)?
Бамбук, давайте начнем с того, что нужно действовать последовательно.
Мы только что обсуждали МО и дисперсию. От вас так ничего и не сказано по поводу того, согласны вы или нет, что нужно ориентироваться на биномиальное распределение и вычислять МО и дисперсию соответствующим образом - или нет. Это - принципиально, так как только последовательно принимая верность того или иного положения мы можем продвигаться вперед, а не топтаться на месте.

Ну, предположим, что вы согласились с биномиальным законом со всеми вытекающими.

Следующее, что нужно четко уяснить - мы имеем дело с ПОСЛЕДОВАТЕЛЬНОСТЬЮ независимых испытаний. Это означает, что кучу нужно рассматривать последовательно, и начально взятую последовательность не перетасовывать (нельзя вместо 101010 брать например 111000 - это разные последовательности, подчиняющиеся разным законам).

Далее. Есть определенные различия между реальной кучей и сгенерированной. Это очень большой и тонкий вопрос. Скажу только, что сгенерировать кучу из двух распределений (например с вероятностями 0.3 и 0.7) - задача не такая простая, как может показаться.

Следующее. Свойства статистического анализа таковы, что далеко не всегда можно однозначно давать точные ответы на конкретные вопросы. Даже скорее - никогда. Любой ответ здесь имеет вероятностный характер. Применительно к последнему вашему вопросу (что в дело, а что в мусорную корзину?) это означает, что взяв когкретный исход, мы с определенной вероятностью можем сказать, в дело или в корзину.

Ну и теперь о самой схеме разделения. Сперва замечание. 1) как я уже говорил - я не верю в то, что вы сможете найти кучу (достаточно большую), которая бы состояла из двух разных (мы это обсуждали, когда речь шла о нахождении каких-то критериев для такого разделения). И моя вера базируется на множесте анализов гистограмм распределений вероятностей для самых разных интервалов коэффициентов. Тем не менее - моя вера или не вера - это не постулат.

Схема разделения кучи достаточно проста. Но она применима только в том случае, если мы точно убедились в том, что это неоднородная куча (неоднородная выборка).

Простейший способ определения однородности выборки - сравнение гистограммы с теоретическим распределением (так вот, для любого кэфа - мы получим однозначный результат сравнения - выборка однородна, на этом и базируется моя вера).

Дальше - лучше на примере.
Имеем выборку из N исходов.
ПОСЛЕДОВАТЕЛЬНО разбиваем ее на интервалы по n значений и определяем частоты, среднее, дисперсию так , как я написал в предыдущем посте. Допусти, таких интервалов оказалось m. (для ваших 1000 значений взяли интервалы по 25 значений, всего 40 интервалов)
Строим гистограмму. Назовем эту гистограмму БАЗОВАЯ - она не будет никак меняться для заданных n и N.

Допустим, что определили - выборка неоднородная. И положим (для примера!!!), что состоит она из двух куч одинаковой величины (500 штук и 500 штук)

Тогда берем все возможные сочетания интервалов по m/2 штук из n штук, в пример - по 20 из 40 (вот и вычислительная проблема!!! потому, что 1000 элементов - это на самом деле мало).

Для каждого сочетания строим отдельно две гистограммы - для тех, кого перевели в 1-ю кучу и для тех, кого во 2-ю. Затем эти диаграммы складываем и сравниваем с БАЗОВОй. Когда попадется наилучшее совпадение (в смысле критерия кси-квадрат) - то оно и будет для НАИЛУЧШЕГО разделения куч.
Тем самым мы определим пока не какой исход в какой куче, а КАКОЙ ИНТЕРВАЛ ИСХОДОВ (в примере - какой из каждых 40 интервалов значений в какой куче).
Определить же какой не интервал, а конкретный исход в какой куче - можно только с некоторой вероятностью.

Где-то так...
И все же, хотелось бы периодически фиксировать те моменты согласия, к которым мы приходим, что бы не толочься на месте (я о среднем и дисперсии в частности)

#85 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 13 June 2018 - 06:34

Сообщенияsergei-777, on 12 June 2018 - 22:18, сказал:

А у меня в excel`e получилось при фиксированной вероятности и изменяемых пропорций финпотоков - БК по каждому исходу в плюсе.


Ну так:

СообщенияДипломат, on 12 June 2018 - 19:06, сказал:

Могу только написать, что коэффициенты на противоположные исходы К1=1.49 и К2=2,69 могут быть даны для равной прибыли независимо от финансовых потоков только если вероятности (частоты на длинной дистанции) распределяются в соотношении 0,643541 на первый исход и 0,356459 на второй исход. Тогда выплата каждый раз в случае первого исхода будет 1,49*0,643541=0,9589 от вложенных игроками денег и в случае второго исхода 2,69*0,356459=0,9589 от вложенных игроками денег, то есть выплаты (payout) равны в обоих случаях, а доход в среднем соответствует марже.


#86 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 13 June 2018 - 07:48

У меня вопрос а почему именно последовательно надо разбивать? Если мы сдвинем окно фиксированного объёма на позицию то что поменяется?
допустим для примера

выборка большого объёма 11010100011010001101011001
шоб много не писать возьмём 6 окно
тогда поехали его двигать
110101
..101010
....101000
у нас генерация исходов независима поэтому какая нам хрен разница ставим мы окна степ-бай-степ или тупо двигаем? С оной стороны может показаться что между средними в соседних окнах будет корреляция (ибо допустим понятно что если выпало 0001... то окна 000 и 001 завязаны на кусок последовательности в окне 00...)
но дело в том что чем дальше мы от зафиксированного окна тем меньше влияние.... тогда можно рассуждать и так---6 человек начали свой анализ с разных
начальных точек (пример в начале) первый берёт окна 1,7,13 ...итд второй чел 2, 8,14 и так далее эти окна стоят степ бай степ. а потом они просто данный сливают вместе вот и всё...

тогда просто делать ни чё ни надо так как я могу посмотреть распределения от окна =1 до 50 кусок можно взять около 1200 (ну просто у меня там уже вбито
под такой примерно размер "колбасы"..)

теперь вот я вам показываю для окна 12 частоты (умноженные на размер окна) по генерации с Р1=0.7 и Р2=0.3 Р=0.5

0,038834951 0,067961165 0,242718447 0,601941748 1,650485437 2,126213592 2,631067961 2,223300971 1,485436893 0,718446602 0,194174757 0,019417476 0

это бином расп с Р=0.5
0,002929688 0,03515625 0,193359375 0,64453125 1,450195313 2,3203125 2,70703125 2,3203125 1,450195313 0,64453125 0,193359375 0,03515625 0,002929688
это бином расп с Р=0.4
0,026121388 0,208971104 0,766227382 1,702727516 2,554091274 2,724364026 2,118949798 1,210828456 0,504511857 0,149484995 0,029896999 0,003623879 0,000201327

при этом принимаются и гипотеза для Р=0.5 и для Р=0.4 по критерию кси_квадрат ( в екселе правда там есть проблема связанная с тем что функция считает для другого числа степеней свободы и поэтому появляется вероятность большая принять нулевую гипотезу при её несостоятельности--т.е допустить ошибку 2-го рода)
разумеется что значение критерия для Р=0.5 выше чем для Р=0.4

Отредактировано Bambuk, 13 June 2018 - 07:51.


#87 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 13 June 2018 - 07:52

Ну а теперь, пока считаются сегодняшние игры и есть время, можно посмотреть как реальные коэффициенты соответствуют фактическим частотам исхода на примере той же таблицы изменений коэффициентов скрин фрагмента которой я уже давал. Из этой таблицы видно, что вероятности на П1 уменьшались (коэффициенты увеличивались ) примерно в 37% случаев. При этом, утренний фактический payout был равен 91%, а payout за 10 минут до начала игры был равен 97,8% Вероятности игр, коэффициенты на которые уменьшались (вероятности увеличивались), составляли примерно 39% от общего числа игр и их payout равны соответственно 105.1% утром и 98,2% перед началом игры. Payout по итогам всех 52490 игр равны утром- 98,4% и перед началом игр- 98,2%. Если учесть что средний расчетный payout в МАРАФОНЕ равен примерно 98%, то можно сделать вывод, что в среднем, по всем играм и утром и перед началом игр payout, а стало быть в среднем и коэффициенты, примерно соответствуют payout этой БК и фактическим вероятностям исходов. С другой стороны, видно, что по группам, где коэффициенты уменьшались или увеличивались, утром payout не соответствуют payout этой БК (значительно меньше или больше), а поэтому коэффициенты не соответствуют и фактическим вероятностям исходов. И только к началу матча коэффициенты в этих группах начинают более или менее соответствовать фактическим частотам исхода на П1. Обратите внимание. что утром в 76% случаев коэффициенты даже в среднем не соответствуют фактическим вероятностям исходов. А в таком случае БК далеко не безразлично какие денежные потоки идут на эти исходы. Более того, если рассматривать изменения коэффициентов не с утра дня игры. а с момента их появления, то разница будет еще больше. Если посмотреть скрин этой таблицы, который я здесь размещал выше, то видно, что даже при том, что в среднем коэффициенты, которые понижались примерно и соответствуют частоте фактических исходов перед началом игры, то при разбивке на группы по признаку величины их изменений, это далеко не так. Так что и внутри группы коэффициентов, которые изменялись, коэффициенты и перед началом игры только в среднем примерно соответствуют фактической частоте исходов. Можно показать (на форуме я уже показывал, что payout коэффициентов около 8,0 и утром и перед началом больше 1) , что и в разных диапазонах коэффициентов, даже коэффициенты перед началом игры могут не соответствовать фактической частоте исходов. Почему же БК терпят такое положение, когда они ставят коэффициенты не соответствующие фактическим частотам исходов настолько, что появляются исходы, где фактический payout больше 100%, и это относится к большому числу игр? Ведь если выявить такие игры , то БК будут на дистанции проигрывать, если не переложат этот проигрыш на тех, кто играет противоположный исход, где фактический payout значительно меньше не только 100%, но и расчетного payout БК (если на одном исходе payout большой, то на противоположном он всегда маленький при неизменной марже). Таким механизмом перекладывания проигрыша на одном исходе на игроков, которые играют противоположный исход, и является выравнивание коэффициентов по денежным потокам, который позволяет БК ставить коэффициенты не соответствующие фактическим частотам исходов, но соответствующие денежным потокам.

Attached File(s)

  • Прикрепленный файл  atim0.png   84.76K   1 Количество загрузок


#88 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 13 June 2018 - 08:00

СообщенияBambuk, on 13 June 2018 - 07:48, сказал:

У меня вопрос а почему именно последовательно надо разбивать? Если мы сдвинем окно фиксированного объёма на позицию то что поменяется?
допустим для примера

выборка большого объёма 11010100011010001101011001
шоб много не писать возьмём 6 окно
тогда поехали его двигать
110101
..101010
....101000
у нас генерация исходов независима поэтому какая нам хрен разница ставим мы окна степ-бай-степ или тупо двигаем? С оной стороны может показаться что между средними в соседних окнах будет корреляция (ибо допустим понятно что если выпало 0001... то окна 000 и 001 завязаны на кусок последовательности в окне 00...)
но дело в том что чем дальше мы от зафиксированного окна тем меньше влияние.... тогда можно рассуждать и так---6 человек начали свой анализ с разных
начальных точек (пример в начале) первый берёт окна 1,7,13 ...итд второй чел 2, 8,14 и так далее эти окна стоят степ бай степ. а потом они просто данный сливают вместе вот и всё...

тогда просто делать ни чё ни надо так как я могу посмотреть распределения от окна =1 до 50 кусок можно взять около 1200 (ну просто у меня там уже вбито
под такой примерно размер "колбасы"..)

теперь вот я вам показываю для окна 12 частоты (умноженные на размер окна) по генерации с Р1=0.7 и Р2=0.3 Р=0.5

0,038834951 0,067961165 0,242718447 0,601941748 1,650485437 2,126213592 2,631067961 2,223300971 1,485436893 0,718446602 0,194174757 0,019417476 0

это бином расп с Р=0.5
0,002929688 0,03515625 0,193359375 0,64453125 1,450195313 2,3203125 2,70703125 2,3203125 1,450195313 0,64453125 0,193359375 0,03515625 0,002929688
это бином расп с Р=0.4
0,026121388 0,208971104 0,766227382 1,702727516 2,554091274 2,724364026 2,118949798 1,210828456 0,504511857 0,149484995 0,029896999 0,003623879 0,000201327

при этом принимаются и гипотеза для Р=0.5 и для Р=0.4 по критерию кси_квадрат ( в екселе правда там есть проблема связанная с тем что функция считает для другого числа степеней свободы и поэтому появляется вероятность большая принять нулевую гипотезу при её несостоятельности--т.е допустить ошибку 2-го рода)
разумеется что значение критерия для Р=0.5 выше чем для Р=0.4
Если окна перекрывать, а не "в стык", то получаем зависимые результаты. Ведь значение в окне - это тоже случайная величина.

Но, в принципе, если сильно хочется.... Но я не знаю, на сколько в этом случае можно доверять результату.

#89 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 13 June 2018 - 08:17

СообщенияДипломат, on 13 June 2018 - 08:00, сказал:

Если окна перекрывать, а не "в стык", то получаем зависимые результаты. Ведь значение в окне - это тоже случайная величина.

Но, в принципе, если сильно хочется.... Но я не знаю, на сколько в этом случае можно доверять результату.
Я вам про 6 человек пояснил же ....ну представьте тогда что куски (длины 12) окон просто переставили иным образом и развернули в гигантскую последовательнось
которая на порядок больше исходной 1239
При этом вот эта последовательность начальная под которую я делал всё она была на кефы около 1.54 и была взята из БД ...это всё частично обсуждалось в теме про Мазаньеллу и там я пояснял что при отрицательном МО на дист. маза может дать положительный эффект только если распределение в окнах (вот по этим 0..1..)
отличается от биномиального---тогда будут размеры окон и число винов для мазы когда на дистанции будет +++ ибо там частота выше чем по бином расп
и вычислитель делался именно для поиска этих параметров окон (размер, минимум винов).... проблема состоит не в этом а в том что нет гарантии что у последовательности в будущем будут точно такие же свойства (и как следствие я рекомендовал мазу без наличия хоть небольшого перевеса над БК не использовать бездумно и повсеместно...)

#90 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 13 June 2018 - 08:44

Каждая БК вправе делать с кэфами всё, что ей заблагорассудится..

1) Можно вывалить кэфы 1.9/1.9, получить на них по 100р и спокойно поиметь 10р прибыли.
Но тут найдется сказочный инсайдер и вольет на к1 1000р. Контора вправе срочно подкорректироваь кэфы, пусть так: 1.3/3.0 - и считать, что теперь кэфы пропорциональны потокам (что естественно не так!!)
Но тут опять таки найдется некий совсем не инсайдер, а вероятнощник - и вольет 1000р на к2. Контора конечно же вправе выровнять кэфы по потокам и сделать 1.9/1.9. Только жопа уже реальная...
2) Можно вывалить 100, 1000 ... позиций в линии и плевать на финпотоки (если это позволяет запас финансов и если деньги этой самой БК нужны не сегодня, а нужны в принципе)

Я бы менял кэфы независимо ни от чего.... Просто от балды... Не сильно, конечно... Любое движение кэфов возбуждает попанов и увеличивает финпотоки, а значит - и прибыль....
Движение - это жизнь!

СообщенияBambuk, on 13 June 2018 - 08:17, сказал:

Я вам про 6 человек пояснил же ....ну представьте тогда что куски (длины 12) окон просто переставили иным образом и развернули в гигантскую последовательнось
которая на порядок больше исходной 1239
При этом вот эта последовательность начальная под которую я делал всё она была на кефы около 1.54 и была взята из БД ...это всё частично обсуждалось в теме про Мазаньеллу и там я пояснял что при отрицательном МО на дист. маза может дать положительный эффект только если распределение в окнах (вот по этим 0..1..)
отличается от биномиального---тогда будут размеры окон и число винов для мазы когда на дистанции будет +++ ибо там частота выше чем по бином расп
и вычислитель делался именно для поиска этих параметров окон (размер, минимум винов).... проблема состоит не в этом а в том что нет гарантии что у последовательности в будущем будут точно такие же свойства (и как следствие я рекомендовал мазу без наличия хоть небольшого перевеса над БК не использовать бездумно и повсеместно...)
Не совсем понимаю, к чему вы это...
Ну так количество данных (0 и 1, или окон) непосредственно связано (определяет ее) с надежностью выводов...
Вероятность того, что будет нужная последовательность, зависит от объема данных - как исходных, так и прогнозируемых.
Здесь ничего не понятного нет.

Всё же может, как-то системнее давайте... Только что говорили о МО и дисперсии, потом о разбивке кучи, теперь - новый базар....
Так - не эффективно. Нужно фиксировать выясненные обстоятельства. (например, если вы по прежнему собираетесь вычислять так дисперсию, как делали, то мой текущий пост просто бессмыслен...)

#91 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 13 June 2018 - 09:30

СообщенияДипломат, on 13 June 2018 - 08:44, сказал:

Каждая БК вправе делать с кэфами всё, что ей заблагорассудится..

1) Можно вывалить кэфы 1.9/1.9, получить на них по 100р и спокойно поиметь 10р прибыли.
Но тут найдется сказочный инсайдер и вольет на к1 1000р. Контора вправе срочно подкорректироваь кэфы, пусть так: 1.3/3.0 - и считать, что теперь кэфы пропорциональны потокам (что естественно не так!!)
Но тут опять таки найдется некий совсем не инсайдер, а вероятнощник - и вольет 1000р на к2. Контора конечно же вправе выровнять кэфы по потокам и сделать 1.9/1.9. Только жопа уже реальная...
2) Можно вывалить 100, 1000 ... позиций в линии и плевать на финпотоки (если это позволяет запас финансов и если деньги этой самой БК нужны не сегодня, а нужны в принципе)

Я бы менял кэфы независимо ни от чего.... Просто от балды... Не сильно, конечно... Любое движение кэфов возбуждает попанов и увеличивает финпотоки, а значит - и прибыль....
Движение - это жизнь!


Не совсем понимаю, к чему вы это...
Ну так количество данных (0 и 1, или окон) непосредственно связано (определяет ее) с надежностью выводов...
Вероятность того, что будет нужная последовательность, зависит от объема данных - как исходных, так и прогнозируемых.
Здесь ничего не понятного нет.

Всё же может, как-то системнее давайте... Только что говорили о МО и дисперсии, потом о разбивке кучи, теперь - новый базар....
Так - не эффективно. Нужно фиксировать выясненные обстоятельства. (например, если вы по прежнему собираетесь вычислять так дисперсию, как делали, то мой текущий пост просто бессмыслен...)
Как так вычислять дисперсии? Я же ни чего не придумываю сам а есть формулы для дисперсии хотите можете сделать оценку не смещённой..это вообще ни на что не повлияет. Я дал реальные данные по генерации и по бином расп. чего там нах вычислять? мо для распределений такого рода может вычисляться как частота
на значение случайной величины и суммируем по всем частотам. у нас Бином расп при Р=0.5 и при числе испытаний 12 мо будет 12*0.5=6
а в сгенерированном Мо=5.9539 (в силу малого объёма данных). Я тут не вижу нестыковок тем более что гипотеза принята по критерию..чё тут обсуждать?

Мне разделение смеси абсолютно по колено... нам же для ставок надо просто принять решение--ставим или не ставим на данный кефф а коли кефы одинаковые то я уже в 3-ий раз спрашиваю---по каким свидетельствам вы собираетесь принимать решение (их же нет)? Из сказанного следует---надо искать другие свидетельства вот и всё и не заниматься выяснением того что всем очевидно---бк не определяет точно Р а в полосе кефоф например таких 1.48...1.52 там есть игры где реально можно для модели закладывать Р и более 1.52 и менее 1.48 (и считать что это истинная Р.
тогда способ принятия решения по взятию и отвержению ставки создаст подкучу общей начальной кучи и там должны доминировать перевесы (тогда в выборке мы увидим+++) при этом это совершенно не значит что там все пары и исходы с перевесом (там просто доминируют исходы где БК чаще ошибается в нужную нам сторону и мы оказались точнее.) Всё остальное это умственный онанизьм с моей точки зрения... оценка Р это по сути измерение а измерения даже если они очень точные всё равно имеют погрешности!!!! У меня есть допустим пара измерительных приборов...если мы мерить будем напряжение то цифровой бедет точнее а стрелочныеприборы имеют свои классы точности...чего тут обсуждать? Можно модель делать для оценок ВНП частот пары по ВНП данным а можно по голам, потом можно взять нейросетевую модель и подать туда кучу всякого разного и так далее. При этом может оказаться так что при выделении полос по Р в своей модели вы увидите отклонение от реальных частот экспериментальных данных не более 0.5% однако это не позволит вам переиграть БК.... (именно по той причине что мы тут исследуем--там могут быть смеси с разной реальной частотой и модель просто не различает эти пары и события).

#92 OFFLINE   opus

    Специалист


  • Участник II
  • ПипПипПип
  • 290 сообщения
10

Добавлено 13 June 2018 - 09:47

Сообщенияandre48, on 13 June 2018 - 07:52, сказал:

....... только к началу матча коэффициенты..... фактическим частотам исхода на П1. Обратите внимание. что утром в 76% случаев коэффициенты даже в среднем не соответствуют фактическим вероятностям исходов....... если рассматривать изменения коэффициентов не с утра дня игры. а с момента их появления, то разница будет еще больше......коэффициенты перед началом игры могут не соответствовать фактической частоте исходов...... (БК терпят такое положение, когда они ставят коэффициенты не соответствующие фактическим частотам исходов настолько, что появляются исходы, где фактический payout больше 100%????????)......... Таким механизмом перекладывания проигрыша на одном исходе на игроков, которые играют противоположный исход, и является выравнивание коэффициентов по денежным потокам, который позволяет БК ставить коэффициенты не соответствующие фактическим частотам исходов, но соответствующие денежным потокам.
Не знаю как там в марафоне (никогда не был в марафоне), но подавляющее большинство начальных кофов в Пинке по вероятности совершенно не соответствуют фактическим частотам захода..
Что касается перевеса по payout больше 100% в начальных кофах или каких других, то в Пинке не бывает таких перекосов ...
Кофы в Пинке приводил примеры, часто ставят даже на глазок...так сказать на пробу (как правило, на форах и только потом расширяют роспись)
Как ставят кофы в Пинке, хорошо расписал Expari - все в точности так и происходит...(на смоллмаркетах или сомнительных для Пинки матчах....крупные рынки отшлифованны и не вызывают, видимо, уже проблем давным давно)....

Но это в Пинке, как формируют кофы в других конторах не представляю и не имею желания представлять...

Отредактировано opus, 13 June 2018 - 09:57.


#93 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 13 June 2018 - 09:52

СообщенияBambuk, on 13 June 2018 - 09:30, сказал:

Как так вычислять дисперсии? Я же ни чего не придумываю сам а есть формулы для дисперсии хотите можете сделать оценку не смещённой..это вообще ни на что не повлияет. Я дал реальные данные по генерации и по бином расп. чего там нах вычислять? мо для распределений такого рода может вычисляться как частота
на значение случайной величины и суммируем по всем частотам. у нас Бином расп при Р=0.5 и при числе испытаний 12 мо будет 12*0.5=6
а в сгенерированном Мо=5.9539 (в силу малого объёма данных). Я тут не вижу нестыковок тем более что гипотеза принята по критерию..чё тут обсуждать?


А как быть с этим?

СообщенияДипломат, on 12 June 2018 - 21:17, сказал:

вот два ряда
111000
и
101010
Каковы среднее и дисперсия в них?

СообщенияBambuk, on 12 June 2018 - 21:24, сказал:

0.5 и 0.3 средн и дисп.
По ссылке там про бином.расп. она тут с какого краю?

С чем мы имеем дело - давайте определимся. С биномиальным распределением или каким-то другим?

==============================================================

СообщенияBambuk, on 13 June 2018 - 09:30, сказал:

Мне разделение смеси абсолютно по колено... нам же для ставок надо просто принять решение--ставим или не ставим на данный кефф а коли кефы одинаковые то я уже в 3-ий раз спрашиваю---по каким свидетельствам вы собираетесь принимать решение (их же нет)? Из сказанного следует---надо искать другие свидетельства вот и всё и не заниматься выяснением того что всем очевидно---бк не определяет точно Р а в полосе кефоф например таких 1.48...1.52 там есть игры где реально можно для модели закладывать Р и более 1.52 и менее 1.48 (и считать что это истинная Р.
тогда способ принятия решения по взятию и отвержению ставки создаст подкучу общей начальной кучи и там должны доминировать перевесы (тогда в выборке мы увидим+++) при этом это совершенно не значит что там все пары и исходы с перевесом (там просто доминируют исходы где БК чаще ошибается в нужную нам сторону и мы оказались точнее.) Всё остальное это умственный онанизьм с моей точки зрения... оценка Р это по сути измерение а измерения даже если они очень точные всё равно имеют погрешности!!!! У меня есть допустим пара измерительных приборов...если мы мерить будем напряжение то цифровой бедет точнее а стрелочныеприборы имеют свои классы точности...чего тут обсуждать? Можно модель делать для оценок ВНП частот пары по ВНП данным а можно по голам, потом можно взять нейросетевую модель и подать туда кучу всякого разного и так далее. При этом может оказаться так что при выделении полос по Р в своей модели вы увидите отклонение от реальных частот экспериментальных данных не более 0.5% однако это не позволит вам переиграть БК.... (именно по той причине что мы тут исследуем--там могут быть смеси с разной реальной частотой и модель просто не различает эти пары и события).
И мне по колено... Тут совпадает.... Хоть и по разным причинам.

Напомню, с чего все началось.
Началось с того, что нужно найти критерии, по которым можно относить исход в кучу А или кучу Б
Вы даже некое уравнение регрессии приводили, предлагали кластеризацию....

А я утверждаю, что БК уже все учло, значимых критериев не осталось.
Подтверждением этого является однородность распределения, БИНОМИАЛЬНОГО распределения.
Если бы такие критерии еще остались - тогда распределения на отдельные кэфы (лиги, виды спорта....) были бы неоднородными.
А неоднородные можно разделить тупо математически.

Тут вы начали много говорить о том, что разделить неоднородные математически неовозможно, провели некое моделирование.
Я вам в ответ привел схему разделения. Простую, но трудо- и времяемкую.


В ответ, ничего не говоря о предложенной схеме, вы поднимаете вопрос о том (не как разделить уже сбывшиеся исходы) как разделить будущие исходы.

Ну нормально это?
Давайте вы сперва:
1) четко скажете о вычислении дисперсии, среднего, о применимости биномиального распределения
2) о возможности математически разделить неоднородной выборки
3) попробуете корректно сгенерировать неоднородную выборку.

А потом я выскажусь о том, как разделять БУДУЩИЕ исходы, если удалось разделить ПРОШЛЫЕ исходы.

Отредактировано Дипломат, 13 June 2018 - 09:53.


#94 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 13 June 2018 - 10:15

Бамбук, вот две гистограммы: для неоднородной выборки и для однородной.
Надеюсь понятно, что МО одинаковые, а дисперсии разные.
И надеючь понятно станет как именно можно разделить первую выборку.
(Гистограммы - теоретические, получены для биномиальных законов)

(зы. в подписЯх ошибки-опечатки, увы... Но они ясны)

Attached File(s)

  • Прикрепленный файл  1.PNG   4.45K   0 Количество загрузок


#95 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 13 June 2018 - 10:28

Цитата

naА как быть с этим?





А я утверждаю, что БК уже все учло, значимых критериев не осталось.
Подтверждением этого является однородность распределения, БИНОМИАЛЬНОГО распределения.
Если бы такие критерии еще остались - тогда распределения на отдельные кэфы (лиги, виды спорта....) были бы неоднородными.
А неоднородные можно разделить тупо математически.

Тут вы начали много говорить о том, что разделить неоднородные математически неовозможно, провели некое моделирование.
Я вам в ответ привел схему разделения. Простую, но трудо- и времяемкую.


В ответ, ничего не говоря о предложенной схеме, вы поднимаете вопрос о том (не как разделить уже сбывшиеся исходы) как разделить будущие исходы.

Ну нормально это?
Давайте вы сперва:
1) четко скажете о вычислении дисперсии, среднего, о применимости биномиального распределения
2) о возможности математически разделить неоднородной выборки
3) попробуете корректно сгенерировать неоднородную выборку.


Возьмите любую книжку по ТРВ или мат.статистике там даны формулы..нахрена мы тут бедем ликбезом заниматься (всё уже изобретено)
выборку можно разделить по разному--например выдвигая гипотезы о том или сём. можно допустим выдвинуть гипотезу что там смесь двух распределений а можно выдвинуть что трёх............... или одного и так далее. Потом вы просто фактически относите то или сё к определённому распределению с таким-то параметром а параметры в распределения можно подбирать допустим по максимуму правдоподобия и так далеее...да нах это нам надо я понять не могу ни как.
СМЕСЬ СГЕНЕРИРОВАНА КОРРЕКТНО с точки зрения метода Моте-Карло (и абсолютно случайно что приблизило её к реальному положению дел...как она сформирована уже писал...генерим три столбца с Р1 с Р2 и с Р потом по формуле формируем рез "1" или "0" получим смесь с пропорциями определяемыми Р)

Что бы показать вам на реалове что вы имеете свойство--заблуждаться приведу некоторые данные.
берём БД, выделяем узкую полосу (пусть в ущерб объёму но для близости к фиксированному кефу)
1.68...1.72 смотрим какова средняя оценка конторы по частоте (делаем через 1/Кбк --находим там среднее=частоте БК и смотрим обратную величину этой средней Р --это и есть средний кефф конторы на полосу.)
это по конторе данные
0,587602344
1,701831196

теперь смотрим реально по экспериментальным данным частоту(кефф)

0,582089552
1,717948718

на сами данные--то что расход внимание не обращаем сильно так как там объём выборки не очень большой (335 пар..ну просто если шире полосу сделаем там конечно ближе будет к частоте эксперимента но потеряем факт что кефф фиксированный у нас по идее надо).

далее...у меня в этой базе есть маленькая нейросеть для экспериментов и для этой полосы она обучена для П1 (кефы вообще на П1 по бет365)
обучена она для диапазона 1.6...1.8 ну в целом около 1.7...

там данные по вероятности такие (сеть даёт оценку Р на исход П1)

0,5759341
-1,057475206 % --это отклонение в % от реальной экспериментальной частоты
1,736309763

теперь если вы говорите что контора всё учла до что бы мы не делали с нашими оценками они не должны изменять состав выборки и следовательно мы не можем выделить подкучи с другими свойствами (частоты, мо чего-то там итд) и переиграть БК не сможем!!!!
я делаю элементарную вещь---- накладываю ограничение на свою оценку Р и беру выше 0.57 например

тогда имеем

по модели
0,610147 -0,36126
1,638948

Экспериментальная


0,612359551
1,633027523

конторы (по 1/К)
0,587582 1,70189
НЕТ ИЗМЕНЕНИЯ А В РЕАЛОВЕ ЕСТЬ!!!
ВАША ТЕОРИЯ НЕ ПОДТВЕРЖДАЕТСЯ ЭКСПЕРИМЕНТАЛЬНЫМИ ДАННЫМИ

СообщенияДипломат, on 13 June 2018 - 10:15, сказал:

Бамбук, вот две гистограммы: для неоднородной выборки и для однородной.
Надеюсь понятно, что МО одинаковые, а дисперсии разные.
И надеючь понятно станет как именно можно разделить первую выборку.
(Гистограммы - теоретические, получены для биномиальных законов)

(зы. в подписЯх ошибки-опечатки, увы... Но они ясны)
СМЕШИВАТЬ НАДО НЕ ТАК!!!

#96 OFFLINE   ZeroTolerance

    Специалист


  • Участник II
  • ПипПипПип
  • 219 сообщения
30

Добавлено 13 June 2018 - 10:50

Сообщенияandre48, on 13 June 2018 - 07:52, сказал:

Ну а теперь, пока считаются сегодняшние игры и есть время, можно посмотреть как реальные коэффициенты соответствуют фактическим частотам исхода на примере той же таблицы изменений коэффициентов скрин фрагмента которой я уже давал. Из этой таблицы видно, что вероятности на П1 уменьшались (коэффициенты увеличивались ) примерно в 37% случаев. При этом, утренний фактический payout был равен 91%, а payout за 10 минут до начала игры был равен 97,8% Вероятности игр, коэффициенты на которые уменьшались (вероятности увеличивались), составляли примерно 39% от общего числа игр и их payout равны соответственно 105.1% утром и 98,2% перед началом игры. Payout по итогам всех 52490 игр равны утром- 98,4% и перед началом игр- 98,2%. Если учесть что средний расчетный payout в МАРАФОНЕ равен примерно 98%, то можно сделать вывод, что в среднем, по всем играм и утром и перед началом игр payout, а стало быть в среднем и коэффициенты, примерно соответствуют payout этой БК и фактическим вероятностям исходов. С другой стороны, видно, что по группам, где коэффициенты уменьшались или увеличивались, утром payout не соответствуют payout этой БК (значительно меньше или больше), а поэтому коэффициенты не соответствуют и фактическим вероятностям исходов. И только к началу матча коэффициенты в этих группах начинают более или менее соответствовать фактическим частотам исхода на П1. Обратите внимание. что утром в 76% случаев коэффициенты даже в среднем не соответствуют фактическим вероятностям исходов. А в таком случае БК далеко не безразлично какие денежные потоки идут на эти исходы. Более того, если рассматривать изменения коэффициентов не с утра дня игры. а с момента их появления, то разница будет еще больше. Если посмотреть скрин этой таблицы, который я здесь размещал выше, то видно, что даже при том, что в среднем коэффициенты, которые понижались примерно и соответствуют частоте фактических исходов перед началом игры, то при разбивке на группы по признаку величины их изменений, это далеко не так. Так что и внутри группы коэффициентов, которые изменялись, коэффициенты и перед началом игры только в среднем примерно соответствуют фактической частоте исходов. Можно показать (на форуме я уже показывал, что payout коэффициентов около 8,0 и утром и перед началом больше 1) , что и в разных диапазонах коэффициентов, даже коэффициенты перед началом игры могут не соответствовать фактической частоте исходов. Почему же БК терпят такое положение, когда они ставят коэффициенты не соответствующие фактическим частотам исходов настолько, что появляются исходы, где фактический payout больше 100%, и это относится к большому числу игр? Ведь если выявить такие игры , то БК будут на дистанции проигрывать, если не переложат этот проигрыш на тех, кто играет противоположный исход, где фактический payout значительно меньше не только 100%, но и расчетного payout БК (если на одном исходе payout большой, то на противоположном он всегда маленький при неизменной марже). Таким механизмом перекладывания проигрыша на одном исходе на игроков, которые играют противоположный исход, и является выравнивание коэффициентов по денежным потокам, который позволяет БК ставить коэффициенты не соответствующие фактическим частотам исходов, но соответствующие денежным потокам.


Всё чётко расписано. Видно, что человек делает реальные ставки, в отличие от словоблудов. Дальнейшие споры теоретиков можно выпилить, от них пользы на копейку

#97 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 13 June 2018 - 10:53

Вы мне поясните--как вы смешали распределения. из вашего "художества" можно умозаключить при тупом сложении и делении на 2 или хз на сколь-ко там делилось...
что допустим 40 испытаний в теории если по отдельности брать у Р=0.7 и у Р=0.3 может выпасть 35 винов и 15 винов а в сумме это не 40 ка вы понимаете
там другое распределение нужно для последовательности 1010011...итд что мы обсуждаем.

#98 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 13 June 2018 - 10:59

СообщенияBambuk, on 13 June 2018 - 10:28, сказал:

Возьмите любую книжку по ТРВ или мат.статистике там даны формулы..нахрена мы тут бедем ликбезом заниматься (всё уже изобретено)
выборку можно разделить по разному--например выдвигая гипотезы о том или сём. можно допустим выдвинуть гипотезу что там смесь двух распределений а можно выдвинуть что трёх............... или одного и так далее. Потом вы просто фактически относите то или сё к определённому распределению с таким-то параметром а параметры в распределения можно подбирать допустим по максимуму правдоподобия и так далеее...да нах это нам надо я понять не могу ни как.
СМЕСЬ СГЕНЕРИРОВАНА КОРРЕКТНО с точки зрения метода Моте-Карло (и абсолютно случайно что приблизило её к реальному положению дел...как она сформирована уже писал...генерим три столбца с Р1 с Р2 и с Р потом по формуле формируем рез "1" или "0" получим смесь с пропорциями определяемыми Р)
Положим, книжки я почитываю. А то, что вы написали - это не разделение выборки, а лишь вывод о ее структуре.
Так я и не отрицаю, что именно так и нужно делать (через выдвижение гипотез о - равестве В ТОМ ЧИСЛЕ ДИСПЕРСИЙ).

О корректности я говорил именно: надо проверять корректность. То, что с точки зрения Монте-Карло - это замечательно.
Но, если вы не получите соответствующий вид распределения (например в виде гистограмм) - то это будет говорить о некорректности.
Если получите - значит можно говорить о корректности.


СообщенияBambuk, on 13 June 2018 - 10:28, сказал:

ВАША ТЕОРИЯ НЕ ПОДТВЕРЖДАЕТСЯ ЭКСПЕРИМЕНТАЛЬНЫМИ ДАННЫМИ

Какая теория? Я никакой теории не выдвигал. Я лишь утверждаю, что выборки однородны и основные значимые факторы буки учли.
Что вы сделали со своим Р - не понял совершенно.
Если опровергли мое утверждение, то совсем не обязательно кричать об этом крупным красным тексом. Я ведь тоже так могу озвучить (например ваш способ расчета дисперсии)


СообщенияBambuk, on 13 June 2018 - 10:28, сказал:

СМЕШИВАТЬ НАДО НЕ ТАК!!!

А вы знаете как я смешал????
Пипец! Это даже не смесь!!!!! Это теоретические гистограммы - вы читайте внимательно!!!!


Не, Бамбук, так не пойдет....
Пока вы не примете условие пошагового движения к истине, а будете расписывать огромные посты сомнительного содержания, у нас ничего не получится....

СообщенияBambuk, on 13 June 2018 - 10:53, сказал:

Вы мне поясните--как вы смешали распределения. из вашего "художества" можно умозаключить при тупом сложении и делении на 2 или хз на сколь-ко там делилось...
что допустим 40 испытаний в теории если по отдельности брать у Р=0.7 и у Р=0.3 может выпасть 35 винов и 15 винов а в сумме это не 40 ка вы понимаете
там другое распределение нужно для последовательности 1010011...итд что мы обсуждаем.
Не-а... После вас... Как там с дисперсией?

#99 OFFLINE   Дипломат

    Специалист


  • mp
  • 2150 сообщения
67
  • МестоположениеДнепр

Добавлено 13 June 2018 - 11:11

СообщенияBambuk, on 13 June 2018 - 10:28, сказал:

Возьмите любую книжку по ТРВ или мат.статистике там даны формулы..
Вот именно!!!

И в каждой книжке написано: любая случайная величина определяется законом распределения вероятностей ее значений.
Сам закон может быть представлен по разному:
- в виде полного перечисления всех значений СВ и соответствующих вероятностей
- в виде ряда распределения
- в виде гистограмм распределения
- в виде графиков (дифференциального или интегрального)
- в виде формул
.........

Если речь идет не о теории, а о вычислениях (анализе данных, то есть не о тервере, а о матстатистике), то все перечисленные способы возможны, кроме "в виде формул".

Пожалуйста, покажите в виде графиков или в виде ряда распределения - что вы получили, взяв молоток и гвоздь Метод Монте-Карло

#100 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 13 June 2018 - 11:21

Р=0.5

0,4932-мо
0,249978758--дисп.


Р1=0.7 Р2=0.3 Р=0.5

0,4953
0,25000291

поменям Р=0.3 (генерим с другими пропорциями)


для Р*=0.42

0,4264
0,244607501

Р1=0.7 Р2=0.3 р=0.3

0,4216
0,243877828
распределения по МО и дисп неразличимы. (для генерации брал 10000 точек лучше 50000 конечно для монте-карло но можно считать --всё совпадает)

Отредактировано Bambuk, 13 June 2018 - 11:22.