Советы новичкам в ставках
#601 OFFLINE
Добавлено 24 May 2013 - 07:24
#602 OFFLINE
Добавлено 24 May 2013 - 11:45
Sector, on 24 May 2013 - 07:24, сказал:
Я разные варианты пересмотрел что лучше взять для футбола. Выясняется что нет в мире ни чего универсального на все случаи жизни (кроме стакана и пузыря)....
Остановился на модели которая более менее описывает ставки 1Х2 и даёт приемлимые оценки по форам (тоталы воше не прут, счета еле-еле укладываются в рамки распределений).
На прямую модели использовать нельзя--я только группировки формирую на основе этих оценок потом смотрю совпадения с экспериментом потом кефы БК. Есть лиги которые плохо описываются такими моделями. А рейтинги я вообще ни какие не использую--я просто ввел пару гипотез (без доказательства) и на этой основе построил модели (в некоторых лигах совпадение приемлимое в любом направлении прогнозирования--вперёд или назад.... ) Ну а в целом модели конечно не решают ни чего в том объёме как хотелось бы--по идее команды лиги надо поделить как минимум на 3-4 подгруппы(можно даже с перекрытиями по командам), а потом только приписывать параметры моделям в зависимости какая группировка задействована и какая дома.....но так невозможно сделать---данных очень мало (поэтому туфта получается с моделированием--мы не учитываем факт что на встречных распределениях от команды к куче по сути смесь распределений а модели их рассматривают как одно распределение и потом эти данные переносят определённым образом на пару А-Б). А---> <----- куча---> <-----Б вот это мы формально имеем а потом получаем А---> <-----Б (на дугах формально оценки вероятностей забить Х-голов это как и в Вашей Пуассоновской модели....а потом просто делаем аналогичные расчёты вероятностей событий как в ТФМ......)
Ни какой Америки я тут собственно не открываю---одна из моделей вообще очень примитивно работает----берём параметры н, з (нападения и защиты) приписываем командам и постулируем что они неизменны (хотя это не так на самом деле и надо оперировать условными какими-то параметрами зависящими от соперника)....потом тупо подбираем
по всем имеющимся исходам по счёту в лиге на данный момент эти параметры так чтоб минимизировать квадраты отклонений от исх. по счёту пар. Задача решается похожим образом как для поиска корня уравнения COS(X)=X
ДЛЯ НАЧИНАЮЩИХ МАТЕМАТИКОВ (считаем что используется биномиальное распределение с числом голов не более 5)
Рассмотрим для некоторого общего представления
способы решения нелинейных уравнений.
Рассмотрим уравнение F(x)=0 где u=F(x) некоторый непрерывный(или дифференцируемый)
оператор. Решение уравнения как правило не может быть найдено в общем виде поэтому
для решения применяются итерационные методы основанные на приведении уравнения к
виду x=Ф(х) где Ф(х)—оператор сжатия. Тогда задавшись произвольным значением х
последовательно определяют векторы (х может быть многомерным) х1 х2 …xn
по формуле xn=Ф(xn-1) Предел этой последовательности и является решением.
Для нашей задачи будем исходить в первую очередь из свойств целевой функции и не
вдаваясь в строгость рассуждений будем исходить из следующих умозаключений. ai-параметр нападения bi-параметр защиты.
Рассмотрим нашу ЦФ F(ai,bj)=∑(ai*bj-sij/5)^2 sij-значение которое забила команда i(по строке) команде j (по столбцу).
Предположим что мы имеем некоторые значения bj, тогда в точке оптимума должно
выполняться ∂ F(ai,bj)/∂ai=0 аналогично для ai
∂ F(ai,bj)/∂bj=0
Откуда следует ai(d)= ∑bj(g)*sij/5*∑bj(g)^2 bj(g)= ∑ai(d)*sij/5*∑ai(d)^2
ai(g)= ∑bj(d)*sij/5*∑bj(d)^2 bj(d)= ∑ai(g)*sij/5*∑ai(g)^2
таким образом наша задача распадается как бы на две независимых задачи оптимизации.
И нам надо создать две матрицы где все дома (по строке) и все в гостях (по строке)
Соответственно столбцы будут по умолчанию в гостях и дома(где строки в гостях).
Тогда для случая например где по строкам дома мы двигаясь по строке(сумма по j) будем вычислять
ai(d)= ∑bj(g)*sij/5*∑bj(g)^2 для D матрицы и для неё же bj(g)= ∑ai(d)*sij/5*∑ai(d)^2 двигаясь по
столбцу(сум по i)….итд для второго случая(G-матрица). (замечание: 5*∑… надо в скобках (5*∑…) )
В качестве начальной точки логичнее взять ai=bj=0,5 и по этим значениям вычислить
новые точки, потом по этим точкам вычислить следующие и так далее. (такая модель имеет много недостатков останавливаться на этом не будем)Эту задачу можно решить в ексель и "поиском решения", но скорости вычислений несоизмеримы--тут данные получаются почти мгновенно, а "поиск решения" у меня например считал секунд 15-20 (алгоритм я придумал чтоб в любую прогу можно было забить и быстро считалось)
Другие модели там позамороченее но всё крутится вокруг одних и тех же принципов.
Отредактировано Bambuk, 24 May 2013 - 11:58.
#603 OFFLINE
Добавлено 24 May 2013 - 12:30
индексы дома-гость соответствуют состоянию команд (например-- i дома j гость тогда для построения встречных распределений мы возьмём для команды i вероятность ai(d)*bj(g)
а для j aj(g)*bi(d) )
по этим данным для n=5 для бином распр. получим вот такую хрень
Распределения—вероятности голов
0 ..................... 1..................... 2 ............. ...... 3..................... 4 ............ ..... 5
i--0,046820614 0,197733769 0,334029309 0,282135873 0,119152195 0,020128239
j--0,386027504 0,404742685 0,169746083 0,035595124 0,003732083 0,000156521
Далее смотри ТФМ (как расчитывать вероятности исходов по этим данным там доходчиво описано)
Ещё следует заметить следующее для параметров нападения и защиты существуют границы (ибо они суть вероятности) [0;1] алгоритм в приведённом виде может вывести параметры за границы (не все но часть может вывести)...на это можно не обращать внимание и в конце скорректировать значения хотя и это необязательно так как произведения которые мы по сути используем будут всё равно приемлимыми оценками в рамках поставленной задачи.
Отредактировано Bambuk, 24 May 2013 - 12:45.
#604 OFFLINE
Добавлено 24 May 2013 - 14:16
Bambuk, on 24 May 2013 - 11:45, сказал:
А может уже? А Юлия ваш агент, уж больно она любит Вас расшифровывать...
#605 OFFLINE
Добавлено 24 May 2013 - 14:39
бостон, on 24 May 2013 - 14:16, сказал:
Бамбук, зачем Вам ставки, Вы можете устроиться на работу шифровальщиком в любую разведку мира....
А может уже? А Юлия ваш агент, уж больно она любит Вас расшифровывать...
#606 OFFLINE
Добавлено 24 May 2013 - 14:40
Отредактировано Sector, 24 May 2013 - 14:41.
#607 OFFLINE
Добавлено 24 May 2013 - 14:51
#608 OFFLINE
Добавлено 24 May 2013 - 14:55
Отредактировано Bambuk, 24 May 2013 - 14:57.
#609 OFFLINE
Добавлено 24 May 2013 - 15:02
Bambuk, on 24 May 2013 - 14:55, сказал:
#610 OFFLINE
Добавлено 24 May 2013 - 15:22
Sector, on 24 May 2013 - 15:02, сказал:
#611 OFFLINE
Добавлено 24 May 2013 - 15:39
Отредактировано Sector, 24 May 2013 - 15:40.
#612 OFFLINE
Добавлено 24 May 2013 - 18:08
#613 OFFLINE
Добавлено 24 May 2013 - 18:56
Для футбола нужен очевидно совершенно иной подход….есть определённые формулы
для рейтинга Эло для футбола, но математическая подоплёка там непонятна—это фактически означает слепо что-то делать. Я сомневаюсь что потяну теоретическую основу
такого подхода. Но очевидно что там есть здравое зерно—переоценка рейтинга (а значит и вероятностей).
Я честно говоря плохо знаком со всякими рейтинговыми «замесами»…можно поковыряться конечно в этом (главное время сыскать).
#614 OFFLINE
Добавлено 24 May 2013 - 19:07
Bambuk, on 24 May 2013 - 18:56, сказал:
Для футбола нужен очевидно совершенно иной подход….есть определённые формулы
для рейтинга Эло для футбола, но математическая подоплёка там непонятна—это фактически означает слепо что-то делать. Я сомневаюсь что потяну теоретическую основу
такого подхода. Но очевидно что там есть здравое зерно—переоценка рейтинга (а значит и вероятностей).
Я честно говоря плохо знаком со всякими рейтинговыми «замесами»…можно поковыряться конечно в этом (главное время сыскать).
#615 OFFLINE
Добавлено 24 May 2013 - 20:01
andre48, on 24 May 2013 - 18:08, сказал:
W^2-P^2 W,P--число выигрышей и проигрышей отнесённое к числу игр ) связан с разностью забитых и пропущенных мячей а она в свою очередь связана с разностью мат ожиданий...
и так далее...короче говоря всё очень сильно взаимосвязано. Во всех этих теоретических посылах есть исключения--комынды которые не вписываются в модель...но они тогда вообще ни куда не вписываются (это например команды которые достигают лучших показателей на более сильных командах или равных но не на более слабых как того требует зравый смысл)
У нас вообще нет механизма которой бы позволял без оговорок и противоречий делать прогноз на какой-то период манипулируя только историческими данными. Давайте предположим что мы наложили все значимые влияющие факторы на пару и сравниваем её с похожей в базе данных....но а сама-то пара один хрен получена в текущем сезоне например на основе 15
туров так отбросим хоть дома-гость получим 7 -8 игр формируют показатели для пары...ну и какая там статистическая значимость этих показателей? Там даже две игры прошли не так как надо и параметры съедут на достаточно большой интервал и мы уже их будем в базе высматривать.....Я вообще что хочу сказать---нет ни чего идеального и безоговорочного ибо у нас априорно данных мало. Но вопрос конечно главный--как лучше обрабатывать эти данные...но вопрос этот спорный и зависит и от лиг и от самих механизмов получения оценок и принятия решений.
Я ещё раз повторюсь--ни каки оценок по тем данным которые получены моделью не делаем, а только формируем множества со сходными свойствами и их уже дальше анализируем (хотим можем и в базе смотреть что-то или ещё там как) и на эти множества уже можно наложить дополнительные критерии (значимые а может и нет)......
Матрица на самом деле содержит информации достаточно много, её только надо как-то грамотно извлеч...к сожалению внятных исследований в этой области я как-то не особо наблюдаю.
Приведу простой пример (может кому-то интересно будет)
Между командами А и Б можно проложить огромное количество маршрутов через другие команды (возьмём для краткости 5 команд+ А+Б)
А-1-2-3-4-5-Б А-2-1-5-4-3-Б ну и так далее для 12-13 команд число таких цепочек колосальное и даже если тупо образовать случайные выборки и случайные последовательности
из общего числа (ограничив число этих цепочек) то задавшись каким-то параметром и на основе принципа Монте-Карло можно считать это приближением к истинному значению (формально мы получим некое распределение). Ну например давайте попробуем создать поток фор в матрице---разность З-П в игре и занесём в клетку i-j...Далее постулировав что в кольце из 3-х команд сумма фор равна нулю мы можем последовательно найти фору для каждой цепочки-выборки потом просуммировать это и получить распределение....Это конечно очень примитивный пример возможно не носящий прикладного характера но тем не менее показывающий разнообразие подходов.
#616 OFFLINE
Добавлено 24 May 2013 - 20:43
Sector, on 24 May 2013 - 19:07, сказал:
Я там собственно не понимаю что откуда берётся (вот хоть кефы G) Базовая формула там как для шахмат но всё равно она не очень понятная....так-то собственно простая, но что там откуда и почему именно такая? Надо может первоисточник посмотреть откуда он вывел сее.
#617 OFFLINE
Добавлено 24 May 2013 - 21:17
Bambuk, on 24 May 2013 - 20:43, сказал:
Я там собственно не понимаю что откуда берётся (вот хоть кефы G) Базовая формула там как для шахмат но всё равно она не очень понятная....так-то собственно простая, но что там откуда и почему именно такая? Надо может первоисточник посмотреть откуда он вывел сее.
ОМГ, до чего мы дошли в теме про советы новичкам...
Бамбук может ты лучше тему создашь наподобии ТФМ, только для моделей оценок команд?
Отредактировано Sector, 24 May 2013 - 21:24.
#618 OFFLINE
Добавлено 25 May 2013 - 00:18
С коэффициентами там конечно перемудрили---если команда в чемпионате мира 10-0 сыграла, то это вообще пипец получиться. Крайность конечно, но всё равно так не должно быть в модели. 4-3 и 1-0 тут с одной стороны Вы правы, но в футболе наверно на счёт всё ж сложно ориентироваться--на фору проще. Нам же допустим даже для прогноза курса рубля или бакса проще определить направление, чем значение этого изменения. Тут есть ещё одна подводная часть айсберга которую как-то частенько ободят стороной--случайные выбросы в рядах данных. Это утрированно так--играла команда А 0-0 1-0 0-1... с похожими какими-то командами Б1 Б2 Б3....а потом 5-0 сыграла. Тут можно подумать как сглаживать выбросы такого рода.
С Эло немного разобрался
мы принимаем, что m/n = at,
где основание а экспоненты аt – некоторое число, большее единицы, а t=r (U) – r(V).
P(победа U)= m/(m+n)=at/(1+at)
Эло взял а=1,0055
Сектор, а так часом тенисистов нельзя рейтинговать? Я правдо в тенисе не секу ну а какая разница--тенисист ты или шахматист? Да и воЩе чем отличается шахматист от лошади? Я так лично понял что допустим мы можем совокупность игроков-лошадей Б, С, Д,.... с рейтингами Ri заменить одним со средним рейтингом или не можем?
Отредактировано Bambuk, 25 May 2013 - 00:33.
#619 OFFLINE
Добавлено 25 May 2013 - 00:30
Теперь что касается выбросов - если какая-то команда выиграла 5-0, да еще и у сильного соперника, то это определенно значит, что команда значительно улучшила свою форму, что сразу же отображается на ее рейтинге. В этом и есть вся суть ЭЛО - это же самосогласованная самоподстраивающаяся система.
#620 OFFLINE
Добавлено 25 May 2013 - 00:33