Конечно, всем и всяким искателям уравнения-грааля с тысячами параметров - удачи и удовольствия!!
Тем не менее, вряд ли стОит игнорировать то, что уже известно и проверено:
Дипломат, on 10 May 2018 - 07:24, сказал:
Если строить всяческие регрессии (множественные, нелинейные) или даже стохастические зависимости, то хорошо потренироваться на прогнозе погоды.
И вот тогда проясниться, что регрессия работает только если есть малое количество СИЛЬНО влияющих факторов и масса неучитываемых (по невозможности) помех, а также станет ясно, что регрессией для таких условий можно ВСЁ оправдать В ПРОШЛОМ, но нельзя прогнозировать на БУДУЩЕЕ. Другими словами, коэффициент корреляции для множественной нелинейной зависимости можно довести почти (а часто и точно) до 1, но это не имеет никакого отношения к связи изучаемых параметров.
И это не мои выдумки. Это классика корреляционного анализа: "нелинейная" зависимость должна быть максимально простой (функции не более 2-го порядка), "множественная" зависимость должна быть ограниченная (1-5 параметров, не более). Но, увы, в беттинге таких работающих зависимостей нет.
Отсюда простой вывод, который каждый сам должен сделать.
Если взять тысячи факторов и и такие же тысячи матчей, то не составит никакого труда (применив многие из известных математических аппаратов) получить чуть-ли не функциональную зависимость счета в прогнозируемом матче от значений этих самых тысяч факторов. Но прогноз окажется справедлив с точностью до правила 3-х сигм.
Простой пример. В замечательной теме ТФМ на самом деле не рассматривается теория футбольного матча, а лишь теория совместного проявления двух распределений Пуассона. В любом футбольном матче не работает та логарифмическая кривая, что лежит в основе рассматриваемого материала. То есть - на самом деле вероятность забития гола (и соответственно кэф ) меняются значительно отличаясь от того, что соответствует двум Пуассонам.
Хотя при этом, безусловно, сам футбольный матч с его голами - как раз и видится процессом с редкими явлениями (голами).
Сектор прекрасно изложил теорию двух Пуассонов, но она не соответствует ТФМ. И это соответствие на столько очевидно, что каждый может это обнаружить, промониторив кэфы лтча.
Так вот, можно не брать двух Пуассонов, а попробовать найти 90 "факторов" (по количеству минут в матче) или тысячи, которые контролируют изменение кэфа в течение матча. Можно даже добиться корреляции факторов и кэфов почти 1. Это - по ПРОШЛОМУ. Но каждый новый матч в БУДУЩЕМ даст прогнозную вероятность, которая на длинной дистанции не выведет так называемый пэй-аут за пределы 1.
Это как 2х2=4, только чуток сложнее....