Перепрыгнеть в содержание


* * * * * 148 голосов

Теория футбольного матча


6097 ответов в эту тему

#5441 OFFLINE   google

    Новичок


  • Участник
  • Пип
  • 14 сообщения
1

Добавлено 30 March 2015 - 20:47

 dweep, on 26 March 2015 - 08:13, сказал:

Я читаю иногда куски этой темы с середины, и у меня возник комментарий для сектора.
Одно из принципиальный отличий наших взглядов на теорию матча, что я считаю что статистика нужна обязательно, а вы - что она не нужна вообще.
Нюанс в том, что ею нужно правильно пользоваться.
...
Прелесть в том, что так как матчи начинались с похожими кефами, и у них были похожие потоки голов - то и суммы в результате будут похожи.
...
Лично меня вообще не интересуют формулы подгона лямбды под сложившиеся коэффициенты. Я прекрасно получаю лямбды из статистики.

Вот походу поэтому Сектор и не любит статистиков... Как человек знающий матчасть, а ты ее безусловно знаешь, ты должен понимать, что берешь лямбды не из статистики, а из распределения Пуассона.

#5442 OFFLINE   dweep

    Пунтер


  • Участник II
  • ПипПип
  • 64 сообщения
7

Добавлено 31 March 2015 - 09:44

 google, on 30 March 2015 - 20:47, сказал:

Вот походу поэтому Сектор и не любит статистиков... Как человек знающий матчасть, а ты ее безусловно знаешь, ты должен понимать, что берешь лямбды не из статистики, а из распределения Пуассона.

Вот к примеру есть у меня 1000 матчей, на каждый из которых в начале матча были похожие коэффициенты.
Я суммирую голы, и получаю, что первая команда забила в суме, например, 3000 голов, а вторая - 2500 голов.
Отсюда получаю лямды: L1 = 3000 / 1000 матчей / 94 минуты = 0.03191489361
L2 = 0.02659574468
Вот так я получаю лямбды, чем мне тут помог Пуассон - лично мне непонятно.

L1 и L2 - это интенсивность потока голов в минуту. Из этих лямбд, с некоторой погрешностью, можно получить начальные коэффициенты. И в то же время эти лямбды будут похожи на те, которые получит сектор.

Зачем мне свои собственные лямбды?
Я верю что в начала матча есть некий баланс коэффициентов, который отвечает вероятностям исходов.
Но в процессе игры, после того как забьют несколько голов - этот баланс нарушается, так как обычные игроки не успевают адекватно оценить шансы, а ботам которые формирую линию - я как то не очень верю.
Мой метод позволяет мне получить лямбды, которые зависят от коэффициентов в начале матча, от текущей минуты матча и от счета, и не зависят от текущих коэффициентов.


Да, кстати, кто не знает, сообщаю: Лямбда - это математическое ожидание количества голов

Отредактировано dweep, 31 March 2015 - 09:49.


#5443 OFFLINE   google

    Новичок


  • Участник
  • Пип
  • 14 сообщения
1

Добавлено 31 March 2015 - 11:22

 dweep, on 31 March 2015 - 09:44, сказал:

Вот к примеру есть у меня 1000 матчей, на каждый из которых в начале матча были похожие коэффициенты.
Я суммирую голы, и получаю, что первая команда забила в суме, например, 3000 голов, а вторая - 2500 голов.
Отсюда получаю лямды: L1 = 3000 / 1000 матчей / 94 минуты = 0.03191489361
L2 = 0.02659574468
Вот так я получаю лямбды, чем мне тут помог Пуассон - лично мне непонятно.

Ты безусловно на правильном пути в своих изысканиях, мое уточнение напрвавлено на то, чтобы ты корректно понял что именно считаешь. А то как у Шарикова получается - взять все и поделить. Исходя из теории, что игра является пуассоновским процессом, у тебя есть возможность в принципе получить лямбды команд таким путем, иначе это не имело бы смысла (это не статистика!). Исходя из свойства суперпозиции процесса, есть основания полагать что общая лямбда встречи будет = L1+L2 и посчитать тоталы.

#5444 OFFLINE   Fedorok

    Специалист


  • mp
  • 2128 сообщения
297

Добавлено 31 March 2015 - 11:54

 google, on 31 March 2015 - 11:22, сказал:

Ты безусловно на правильном пути в своих изысканиях, мое уточнение напрвавлено на то, чтобы ты корректно понял что именно считаешь. А то как у Шарикова получается - взять все и поделить. Исходя из теории, что игра является пуассоновским процессом, у тебя есть возможность в принципе получить лямбды команд таким путем, иначе это не имело бы смысла (это не статистика!). Исходя из свойства суперпозиции процесса, есть основания полагать что общая лямбда встречи будет = L1+L2 и посчитать тоталы.
А какие ваши доказательства, что надо всё взять и поделить/сложить свойством суперпозиции? Вот dweepa сам АТЕЦ назначил ГУРУ, ему вера есть :)

#5445 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 31 March 2015 - 11:56

 dweep, on 31 March 2015 - 09:44, сказал:

Зачем мне свои собственные лямбды?
Я верю что в начала матча есть некий баланс коэффициентов, который отвечает вероятностям исходов.
Но в процессе игры, после того как забьют несколько голов - этот баланс нарушается, так как обычные игроки не успевают адекватно оценить шансы, а ботам которые формирую линию - я как то не очень верю.
Мой метод позволяет мне получить лямбды, которые зависят от коэффициентов в начале матча, от текущей минуты матча и от счета, и не зависят от текущих коэффициентов.

Пока не совсем понятно зачем же Вам лямбды. Допустим я хочу поставить на главную экспоненту (тек счёт) на 75 минуте при 2-1, а закрыться на 80 ну например я играю в полосе начальных кефоф П1=1.8-2.2 а кефф на 0-0 Коо=13-15 тогда я допустим могу по Вашему методу взять похожие матчи счёт 2-1 к 75 минуте подсчитать голы в интервале 75-80
потом я найду лямбды...возникает вопрос--а нах..я они мне? ........Я же могу просто посмотреть баланс моей игры бак-лей и сделать какие-то выводы.

Мне кажется надо искать метод максимально приблизить оценку модели к линии БФ тогда если нет допустим данных по кефам на какой-то минуте можно делать расчёт (пусть даже грубоватый и с запасом и смотреть +++ там или ----) потом при плюсе уточнять на реальных наблюдениях.

Это конечно хорошее дело--смастерить адекватную модель описывающую реальный процесс во времени но это достаточно трудоёмкая задача которая упирается в многие проблемы (например такие как ограниченность данных и специфика лиг..итд) и потом если Вы говорите что процесс нестационарный, то сразу возникает например вот такое----
в том примере что я привёл со счётом 2-1 во-первых рассмотрим переход например вот в такое состояние 3-1 (которое даст мне луз).
в состояние 2-1 можно было прийти например на 10-той минуте а можно на 65-той причём можно прийти по пути 0-1-->1-1-->2-1 1-0--->2-0--->2-1 итд.
то есть надо как-то эти вопросы обговорить в модели (допустим можно сказать что путь не влияет)..а вот это 10 и 55 мин? надо наверно изучать тогда возможности переходов в 3-1 при разных вариантах получения 2-1 или опять постулировать что НЕ ВЛИЯЕТ итд итп.......гиморно очень всё это.

Отредактировано Bambuk, 31 March 2015 - 12:01.


#5446 OFFLINE   dweep

    Пунтер


  • Участник II
  • ПипПип
  • 64 сообщения
7

Добавлено 31 March 2015 - 12:55

 Bambuk, on 31 March 2015 - 11:56, сказал:

Пока не совсем понятно зачем же Вам лямбды. Допустим я хочу поставить на главную экспоненту (тек счёт) на 75 минуте при 2-1, а закрыться на 80 ну например я играю в полосе начальных кефоф П1=1.8-2.2 а кефф на 0-0 Коо=13-15 тогда я допустим могу по Вашему методу взять похожие матчи счёт 2-1 к 75 минуте подсчитать голы в интервале 75-80
потом я найду лямбды...возникает вопрос--а нах..я они мне? ........Я же могу просто посмотреть баланс моей игры бак-лей и сделать какие-то выводы.

Мне кажется надо искать метод максимально приблизить оценку модели к линии БФ тогда если нет допустим данных по кефам на какой-то минуте можно делать расчёт (пусть даже грубоватый и с запасом и смотреть +++ там или ----) потом при плюсе уточнять на реальных наблюдениях.

Это конечно хорошее дело--смастерить адекватную модель описывающую реальный процесс во времени но это достаточно трудоёмкая задача которая упирается в многие проблемы (например такие как ограниченность данных и специфика лиг..итд) и потом если Вы говорите что процесс нестационарный, то сразу возникает например вот такое----
в том примере что я привёл со счётом 2-1 во-первых рассмотрим переход например вот в такое состояние 3-1 (которое даст мне луз).
в состояние 2-1 можно было прийти например на 10-той минуте а можно на 65-той причём можно прийти по пути 0-1-->1-1-->2-1 1-0--->2-0--->2-1 итд.
то есть надо как-то эти вопросы обговорить в модели (допустим можно сказать что путь не влияет)..а вот это 10 и 55 мин? надо наверно изучать тогда возможности переходов в 3-1 при разных вариантах получения 2-1 или опять постулировать что НЕ ВЛИЯЕТ итд итп.......гиморно очень всё это.

Если честно, я пока считаю себя теоретиком, и торгую редко, зато много в базу записываю то что хотелось бы купить.
Пока решаю проблемы как точно узнать счет матча, и как узнать текущую минуту игры, а то часто мои виртуальные ставки дают минус из за неточных данных.
Поэтому вопрос зачем мне лямбды с практической точки зрения - я еще не раскрыл для себя, в том плане что я пока не могу сказать как именно я их буду применять на практике.

Голы в интервале 75-80 я не считаю, так как для маленького периода могут получится неадекватные данные. А стараюсь расширить период, в данному случае считаю голы с 75-й минуты до конца матча.

По поводу путей для счета, например, 2-1, я иследовал этот вопрос.
Пришел к выводу что восновном путь значения не имеет. Имеет значение какая команда забила пол последней в этом пути.
Я это назвал инициативой. То есть если счет был 2-0, а стал 2-1, то инициатива у второй команды.
Если счет был 1-1, а стал 2-1 - то инициатива у первой команды. и при этом разницы между путями 1-0 1-1 2-1 и 0-1 1-1 2-1 - нету.
То есть в моей модели еще есть флаг инициативы. Она достается команде, которая забила гол последней. Я єтот фактор раньше не вспомнил, так как он слабо влияет на формирование лямбд.


По поводу "а вот это 10 и 55 мин?". Такую информацию я не анализировал, так как предполагаю что она мало влияет на лямбды. Да и у меня всего 100 000 матчей, для которых есть полная информация.
Если наложить слишком много фильтров при поиске похожих матчей - не останется данных для репрезентативной выборки.

#5447 OFFLINE   sergei7000

    Специалист


  • mp
  • 2043 сообщения
180

Добавлено 31 March 2015 - 14:57

dweep , по ходу , становится еретиком :D :D :D :D

(не в том смысле что несешь ересь , то бишь глупость , а в том , что отходишь от учения сэнсэя - сан , нарушаешь незыблемые правила темы)

#5448 OFFLINE   ingener

    Специалист


  • Участник II
  • ПипПипПипПип
  • 530 сообщения
62
  • МестоположениеКрым, Симферополь

Добавлено 31 March 2015 - 16:05

 sergei7000, on 31 March 2015 - 14:57, сказал:

dweep , по ходу , становится еретиком :D :D :D :D

(не в том смысле что несешь ересь , то бишь глупость , а в том , что отходишь от учения сэнсэя - сан , нарушаешь незыблемые правила темы)

Не хочется флудить, но что-то не припомню, чтобы в этой теме были какие-то правила, тем более незыблемые. Кроме того, не забываем, что тема находится в подфоруме "Идей, тестов систем и стратегий".

#5449 OFFLINE   val64rus

    Специалист


  • Участник II
  • ПипПипПип
  • 470 сообщения
66
  • МестоположениеГород-герой Ленинград

Добавлено 31 March 2015 - 18:35

 google, on 31 March 2015 - 11:22, сказал:

поэтому Сектор и не любит статистиков...

Ты безусловно на правильном пути в своих изысканиях
Окей, Гугл, как принимать роды?))) Фу, блин, не про это... хотел написать, что статистика - полумертвая вещь. Потому что собрав статистику, например, по 1000 матчей, можно рассчитывать (относительно оптимистично) в нее попасть, только если сыграть еще 1000 матчей хотя бы примерно на тех же условиях, что нереально. Это еще Гераклит усвоил, а любители статистики до сих пор не въедут)))

#5450 OFFLINE   dweep

    Пунтер


  • Участник II
  • ПипПип
  • 64 сообщения
7

Добавлено 31 March 2015 - 20:58

 val64rus, on 31 March 2015 - 18:35, сказал:

Окей, Гугл, как принимать роды?))) Фу, блин, не про это... хотел написать, что статистика - полумертвая вещь. Потому что собрав статистику, например, по 1000 матчей, можно рассчитывать (относительно оптимистично) в нее попасть, только если сыграть еще 1000 матчей хотя бы примерно на тех же условиях, что нереально. Это еще Гераклит усвоил, а любители статистики до сих пор не въедут)))

Гераклит, конечно, человек уважаемый, но к сожалению он умер раньше чем появился футбол и чем появилась статистика как наука. Не мог он этого усвоить, поэтому зря вы на него ссылаетесь.

#5451 OFFLINE   val64rus

    Специалист


  • Участник II
  • ПипПипПип
  • 470 сообщения
66
  • МестоположениеГород-герой Ленинград

Добавлено 31 March 2015 - 21:07

 dweep, on 31 March 2015 - 20:58, сказал:

Гераклит, конечно, человек уважаемый, но к сожалению он умер раньше чем появился футбол и чем появилась статистика как наука. Не мог он этого усвоить, поэтому зря вы на него ссылаетесь.
А как же "Все течет, все изменяется. В одну реку нельзя войти дважды."? На то она и философия, чтобы предвосхищать и появление футбола, и появление статистики))

#5452 OFFLINE   Иванн

    Новичок


  • Banned
  • Пип
  • 29 сообщения
-4

Добавлено 31 March 2015 - 22:08

 Fedorok, on 31 March 2015 - 11:54, сказал:

А какие ваши доказательства, что надо всё взять и поделить/сложить свойством суперпозиции? Вот dweepa сам АТЕЦ назначил ГУРУ, ему вера есть :)

АТЕЦ наверняка прикольнулся а все повелись)))

#5453 OFFLINE   Иванн

    Новичок


  • Banned
  • Пип
  • 29 сообщения
-4

Добавлено 31 March 2015 - 22:30

 Иванн, on 31 March 2015 - 22:08, сказал:

АТЕЦ наверняка прикольнулся а все повелись)))
хотя бы потому что он никогда не смотрит на прошлые счета) и я с ним согласен...

#5454 OFFLINE   google

    Новичок


  • Участник
  • Пип
  • 14 сообщения
1

Добавлено 01 April 2015 - 06:56

 val64rus, on 31 March 2015 - 21:07, сказал:

А как же "Все течет, все изменяется. В одну реку нельзя войти дважды."? На то она и философия, чтобы предвосхищать и появление футбола, и появление статистики))

Воу..воу.. Кидать какашками в статистику это одно, а вот за цитировать за Гераклита это уже массированный удар ниже пояса по всем сторонам. У dweep все норм. выходит, только он делае вид что не понимает почему его результат совпадает с расчетами по формулам Сектора и называет его матожиданием, будто любое матожидание для формул сгодится. Только потом кто-то полный энтузиазма начнет делить суперпозиции, мячики на футболистов, угловые на карточки, там тоже прикольные матожидания, кто ж им запретит то.

Мы все тут ставим деньги против своего идиотизма, ставку за еще никто не придумал (Гераклит)

#5455 OFFLINE   dweep

    Пунтер


  • Участник II
  • ПипПип
  • 64 сообщения
7

Добавлено 01 April 2015 - 08:07

dweep утверждает что то что сектор называет "интенсивность потока голов" и есть "математическое ожидание количества голов", но собственно мне ничего не мешает придерживаться той терминологии, которая сложилась в теме.

#5456 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 01 April 2015 - 08:08

 dweep, on 31 March 2015 - 12:55, сказал:

Голы в интервале 75-80 я не считаю, так как для маленького периода могут получится неадекватные данные. А стараюсь расширить период, в данному случае считаю голы с 75-й минуты до конца матча.
Если наложить слишком много фильтров при поиске похожих матчей - не останется данных для репрезентативной выборки.
Чем больше период, тем вероятнее, что накопится ошибка. При большой базе данных можно попытаться сначала определить какие факторы могут в большей степени влиять на коэффициенты в заданном интервале времени по отклонению от среднего значения коэффициентов в конце интервала при одинаковом коэффициенте на входе и "вес" (процент) различных факторов, которые присутствуют в играх с малыми отклонениями от средней и в играх с большими отклонениями от средней в матчах, где не было забито мячей, не было красных карточек и пенальти за этот отрезок времени . При этом может оказаться, например, что изменение коэффициентов на отрезке больше зависит не от начальных коэффициентов на тотал, а от начальных коэффициентов на результат.

#5457 OFFLINE   sergei7000

    Специалист


  • mp
  • 2043 сообщения
180

Добавлено 01 April 2015 - 09:35

 ingener, on 31 March 2015 - 16:05, сказал:

Не хочется флудить, но что-то не припомню, чтобы в этой теме были какие-то правила, тем более незыблемые. Кроме того, не забываем, что тема находится в подфоруме "Идей, тестов систем и стратегий".

А ! Вот вы как теперь . Значит вы изменили свое мнение , взгляды , правила . Скажем вот эти:

 ingener, on 26 December 2013 - 08:43, сказал:

Уважаемый Бамбук, на мой взгляд здесь изначально неверный посыл. Уже сто тыщ пятьсот раз было сказано, что неверно проецировать результаты прошедших матчей (т.е. историю, статистику, если хотите) в будущее. Если Голландия забивала много после 85-й мин пять предыдущих лет, это совершенно не значит, что так же будет и в текущем сезоне, и в следующем, и в следующие пять лет. И отсеивание пар не поможет тоже. Команда, которая всю жизнь ни разу не забивала в добавленное время, в этом сезоне начинает хреначить по 2 гола. Разве это невозможная ситуация?

Ведь dweep рассчитывает лямбды на том основании , что если "Голландия" забивала много после 85-й мин пять предыдущих лет, это значит, что так же будет и в текущем сезоне, и в следующем, и в следующие пять лет… Иначе говоря на статистике . Прощай Пуасон ! Виват статистика ! Хотя dweep пытается их поженить как я понял . Если признать что статистика рулит в футболе главную роль , прийдется переписать ТФМ .

Если вы свое мнение не меняли , тогда зачем мне возражать ?

#5458 OFFLINE   dweep

    Пунтер


  • Участник II
  • ПипПип
  • 64 сообщения
7

Добавлено 01 April 2015 - 10:14

 sergei7000, on 01 April 2015 - 09:35, сказал:

Ведь dweep рассчитывает лямбды на том основании , что если "Голландия" забивала много после 85-й мин пять предыдущих лет, это значит, что так же будет и в текущем сезоне, и в следующем, и в следующие пять лет… Иначе говоря на статистике . Прощай Пуасон ! Виват статистика ! Хотя dweep пытается их поженить как я понял . Если признать что статистика рулит в футболе главную роль , прийдется переписать ТФМ .


Хочу отметить что я не привязываюсь к тому как играла Голландия при поиске лямбд. Я привязываюсь к результату игр, у которых в начале были похожие коэффициенты.
Допустим я хочу найти лямбды для какого то матча, пусть это будет Голландия - Португалия.
1. Я смотрю какие коэффициенты на рынке на этот матч. То есть первичным есть коэффициенты, которые сформировали тысячи экспертов.
2. Я подбираю матчи, которые уже завершились, и на которые в начале игры были похожие коэффициенты. Вполне возможно что среди участников этих матчей не будет ни команды Голландия ни команды Португалия.
3. Я анализирую счет, с которым закончились эти матчи, и с него получаю две лямбды.

Общая идея тут простая - если с лямбды можно получить какой то набор результатов (статистику счетов) - то и со статистики счетов можно получить лямбду.
Сектор получил лямбду одним способом, я другим. Лямбды эти не особо различаются, ТФМ при этом остается прежней. Всего то добавился пункт, что можно получить лямбду альтернативным способом.

#5459 OFFLINE   sergei7000

    Специалист


  • mp
  • 2043 сообщения
180

Добавлено 01 April 2015 - 10:42

 dweep, on 01 April 2015 - 10:14, сказал:

Хочу отметить что я не привязываюсь к тому как играла Голландия при поиске лямбд. Я привязываюсь к результату игр, у которых в начале были похожие коэффициенты.
Допустим я хочу найти лямбды для какого то матча, пусть это будет Голландия - Португалия.
1. Я смотрю какие коэффициенты на рынке на этот матч. То есть первичным есть коэффициенты, которые сформировали тысячи экспертов.
2. Я подбираю матчи, которые уже завершились, и на которые в начале игры были похожие коэффициенты. Вполне возможно что среди участников этих матчей не будет ни команды Голландия ни команды Португалия.
3. Я анализирую счет, с которым закончились эти матчи, и с него получаю две лямбды.

Общая идея тут простая - если с лямбды можно получить какой то набор результатов (статистику счетов) - то и со статистики счетов можно получить лямбду.
Сектор получил лямбду одним способом, я другим. Лямбды эти не особо различаются, ТФМ при этом остается прежней. Всего то добавился пункт, что можно получить лямбду альтернативным способом.

Голландия - у меня в кавычках - это образное выражение . Имеется в виду если какая-то команда забивает во втором тайме в 60% случаев , больше голов чем в первом , на дистанции 100-200 матчей , то это следует ожидать и в последующих матчах . Соответственно с этим выставляются и кэфы букмекерами на этот рынок .

Формулы же Сектора привязаны ко времени . Имеется в виду то , что может произойти в одну из минут матча , например гол , может произойти с той же вероятностью и в любую другую минуту матча . Что противоречить вами приведенной статистике : вероятность того , что во второй минуте матча будут забиваться голы , не равна той вероятности которая является , для этого , для 80 минуте . Если признать , что вы правы (а с статистикой не поспоришь) , тогда надо править формулы Сектора (то бишь переписать ТФМ) .

#5460 OFFLINE   dweep

    Пунтер


  • Участник II
  • ПипПип
  • 64 сообщения
7

Добавлено 01 April 2015 - 11:19

 sergei7000, on 01 April 2015 - 10:42, сказал:

Формулы же Сектора привязаны ко времени . Имеется в виду то , что может произойти в одну из минут матча , например гол , может произойти с той же вероятностью и в любую другую минуту матча . Что противоречить вами приведенной статистике : вероятность того , что во второй минуте матча будут забиваться голы , не равна той вероятности которая является , для этого , для 80 минуте . Если признать , что вы правы (а с статистикой не поспоришь) , тогда надо править формулы Сектора (то бишь переписать ТФМ) .

Переписать много чего можно.
Сектор написал базовую теорию приняв некоторые упрощения. И даже с этими упрощениями мало кто разобрался с теорией настолько что б понять как самостоятельно искать аналогичные дыры на других рынках.
При этом его теория довольно точно описывает движение линии и позволяет зарабатывать.

Матч событие сложное, и теорию можно усложнять очень долго. Вот только есть ли смысл это делать, если может так получится что сложную теорию не поймет вообще никто из прочитавших ее.
Я написал свой алгоритм поиска лямбд, вот только он сложный и подходит только для программистов. Поэтому практическая ценность такой теории для широких масс - минимальна.