Перепрыгнеть в содержание


* * * * * 2 голосов

Погоня за литрами


332 ответов в эту тему

#1 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 11:36

Лёд тронулся, лёд тронулся.....как и мозг у некоторых игроков в погоне за прогнозированием тоталов. Вот если поставить вопрос ребром--
если спрогнозировал ТБ2.5 правильно--получаешь 2.5 литра водки если нет--отдаёшь...то дела вероятно пошли бы лучше...деньги по нынешним временам--вода...а водка она и в Африке водка (херово что наверно тёплая)!!!!

Решил создать тему чтоб всё такие ещё раз пройтись по вершкам и корешкам вопроса о прогнозировании тотала и собственно даже не о прогнозировании как таковом(ибо хуле там прогнозировать когда БК уже всё спрогнозировало по сути-то с некими погрешностями конечно...но тем не менее на дистанции кефа неплохо соотносятся с частотой захода событий если снести маржу немного)....
Поводом послужило вот что--походил по разным сайтам посмотрел что там предлагают на этот счёт так и ни чего достойного не нашёл.

Хочу послушать мнение форума на сей счёт...
А пока решил предложить возможный экспериментальный вариант возможной реализации идеи "что-то там спрогнозировать"

Перед тем как попробую залить картинку дам некоторые пояснения чтоб понятнее было что из чего возникает.
Во-первых встаёт вопрос о достоверности исходных данных--ясно что по 5-6 матчам очень проблемно говорить насколько случаен или закономерен результат в целом и в конкретном матче в частности. Другой момент--понятно что в доме и в гостях команды играют не совсем одинаково ко всему прочему могут накладываться всякие обстоятельства связанные с погодой и возможным участием команд в каких-то более значимых для них матчах в ближайшее время ну и так далее. Конечно учесть все параметры проблематично, поэтому можно начать с каких-то определённых характеристик игры а потом по мере разруливания существа вопроса и понимании что там и как (плохо или нормально) пробовать добавлять что-то дополнительное.
Обычно в примитивном подходе используют показатели или по тоталам или по забитым-пропущенным мячам (какие-то средние берут потом там мудазвонскими примитивными формулами что-то вычисляют)...
Я думаю можно пойти частично путём учёта забитых и пропущенных мячей но несколько в иной плоскости---дело в том что если допустим взять даже 20 игр команды то показатели средние за игру как забитые и пропущенные они не очень информативны, а точнее менее информативны чем скажем распределения по голам. Теперь как можно взять и применить распределения----можно ограничиться например 4 мячами максимум и тогда при большем счёте допустим 5-1 или 6-2 переносить мячи из 5 и 6 в позицию 4
тогда допустим для забитых так со счетом забито 0-1 игра забили 1мяч--5 игр 2м--10 игр 3м- 3игры и 5м-1 игра
тогда распределение будет в виде вектора (1/20 5/20 10/20 3/20 1/20) 5-ть перенесли в 4
Группу из набора команд назовём эталоном L эталон тоже забил (это пропущенные мячи команды) и имеет распределение RL1
соответственно распределение для забитых команды будем обозначать R1L (от 1 к эталону)
При таком подходе мы имеем для 2-ух команд 4-распределения.
Теперь можно ра..с-с-с-с-у....ждать так допустим брать для дом.ком распределения для игр дома а для гостевой в гостях...но тут мы режем объём в 2 раза и понижаем достоверность информации (для распределений такое не есть хорошо...так можно было бы поступить при оперировании скажем средними показателями--типа МО за матч по всем играм)....

Долее можно потребовать ещё одной тонкости---мы будем всегда ставить на первое место более сильную команду силу которой можно в принципе определять по разному но я могу предложить такой вариант---берём показатели по ВНП потом делим всю эту бодягу на (В+Н+П)
получаем размерность вероятности и нам в целом по барабану становится количество игр (так как лиги имеют разную размерность и чтоб не потерять общности можно так поступить) можно по аналогии и по очкам делать (но тоже отнести к общему числу игр тогда)..
обозначим наши псевдо вероятности Рв Рн Рп теперь команда сильнее если Рв1^2-Рп1^2>Рв2^2-Рп2^2
далее чтоб разрулить кто дома а кто в гостях можно ввести некий код Д/Г так как далее будем использовать нейросеть то можно так например 0,4 считать что подаём при команде дома а 0,3 что в гостях (тогда если это смотреть в клетках одна под другой то в клетках будет 0,4 0,3 --это когда сильная в доме или 0,3 0,4--это сильная в гостях (но она по позициям распределений всегда на первом месте)

Прикрепленный файл  Как спрогнозировать тотал.jpg   200.86K   25 Количество загрузок

На картинке вместо значка суммирования стоит знак вопроса (прога просто сама так сука инвертирует сумму)

Отредактировано Bambuk, 07 December 2016 - 11:37.


#2 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 12:10

От чего можно отказаться и что целесообразно "довернуть" в чёрный ящик? Можно в общем-то вычисления в калькуляторе не делать а просто использовать обычную архитектуру сети которую часто приводят--подвать тупо сигналы с распределений и код Д/Г на нейроны...это можно поэкспериментировать с архитектурой сети...
Более рациональным будет подход, состоящий в том что предварительно надо поделить общие данные на группы которые бы отражали ситуацию по тоталам.
Самый простой способ конечно состоит просто в использовании оценок БК--поделить кефы на ТБ или ТМ на интервалы...но можно поступить и иначе---допустим используя алгоритмы кластеризации поделить по числу З1 П1 З2 П2 (это средние по забитым пропущенным...там можно по общим данным поделить а можно и попробовать по З1дП1д З2гП2г...... можно и попробовать ввести такие дополнительные параметры для деления----вычислить предварительно вот такую величину
З1*П2 и З2*П1 и делить по этим двум показателям и так далее можно там ещё что-то довернуть при желании...но чем проще тем пока лучше будет я так думаю).

Потом для каждой группировки строим свою сеть. Есть ещё один способ (но это когда база конечно есть со всеми нашими данными)---каждый вектор распределения окружаем некой оболочкой (шаром) в евклидовом пространстве, контролируем чтоб выборка была представительная и по этой выборке учим сеть для конкретного матча.

#3 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 12:41

Теперь по поводу эталона(общего набора команд)---совершенно очевидно что правильно что-то сравнить можно только через одну общую "гирю" или одинаковые гири. Идеальным конечно вариантом было бы--догружать шахматки играми предыдущего сезона, но можно я думаю с внесение доп. погрешностей обойтись и последними играми равными примерно числу команд в лиге---так проще будет программно я думаю...

#4 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 13:10

Думаю можно в целом попробовать и распределения для дом. ком. по домашним играм а для гостевой по гостевым...там же в принципе тоже около 20 матчей (19), а по общаку 38 это если типа лига 20 ком... тогда можно Д/Г код не подавать по идее если допустим дом--ставим на первое место, а если опять принять что на первое место сильную, то надо чёта подавать... лучше конечно пробовать разные варианты. По идее если есть распределения для дом. состояния и для гостевого то там общее из них можно легко найти---сложить вектора да поделить на 2 (это если там и сям по полностью заполненной шахматке делается)....

#5 OFFLINE   eeww

    Пунтер


  • Участник II
  • ПипПип
  • 70 сообщения
3

Добавлено 07 December 2016 - 13:24

что за бред

#6 OFFLINE   Remis

    Специалист


  • Модератор
  • 1606 сообщения
349
  • МестоположениеEU

Добавлено 07 December 2016 - 14:20

Бамбук,постулат интересен и сама идея,но после перехода на формул приходится нюхать нашатырный спирт,чтобы уловить суть вычисления на скрине.

#7 OFFLINE   sergei7000

    Специалист


  • mp
  • 2043 сообщения
180

Добавлено 07 December 2016 - 14:44

Тут не хватает еще и с кем команды забивали голы. Если сильные команды встречались с дном и наколотили им голов это не значит, что с командами с глухой обороной произойдет тоже самое. Хоть и убираются шумы с 5-6 голов, но это не достаточно. Наверно надо создать рейтинг атаки и рейтинг обороны команд. Если команда умудрилась забить 2-3 гола команде которая не пропускает, тогда начисления рейтинга за эти голы должно быть больше, чем за голы с командой со слабой обороной. Но все это должно быть более-менее стабильно у команд.

Второе. Что ожидается в матче на исходы? Если ничья то вероятен ТМ, а если команды не любят ничьих, тогда ТБ, если команды конечно забивают.

Смотреть по коэффициентам букмекеров не стоит. Лучше искать валуй, чтоб на дистанции был плюс. А это значит надо рассчитывать свою вероятность. Если мы рассчитаем что в матче вероятность ТБ2,5 60% а букмекеры дали коэффициент 1,6 стоит ли брать такую игру? Однозначно нет!

Если рассматривать статистику игр тогда надо брать для анализа не больше 7. Из 7 игр брать 5 игр в соответствие для дом/гости и последние 2 игры когда играли наоборот. То есть для домашней команды 5 последних игр дома и две последних на выезде и наоборот для гостей. Желательно этого сезона. У более 7 игр статистики, в то время, у команд часто были другие цели в чемпионате. Вот взять чемпионат Чили, сначала сезона играли на ничью и любимый счет у них был 1-1, а теперь на ТБ3,5. А в чемпионате Дании наоборот, сначала забивали много а потом стали играть на ничью и ТМ1,5.

Надо наверно подходить к вычислению тоттала не только основываясь на предыдущие голы, но и вероятность исхода матча и коэффициенты. Найдя валуйную игру можно потом будет посмотреть и по составам и календарь игр команд.

Я делаю так, смотрю статистику голов, вычисляю средний тотал. Смотрю частоту последних игр на этот тотал, частота является и вероятностью на этот тотал. Смотрю на коэффициенты если валуй смотрю дальше по командам, с кем играли. С кем у них заходил тотал а с кем нет. И тогда решаю стоит брать или нет.

#8 OFFLINE   Конь в пальто

    Специалист


  • mp
  • 1765 сообщения
176

Добавлено 07 December 2016 - 16:28

Главное ведь оно что? Чтобы погоня за литрами не превратилась в погоню за клитрами. Засим откланиваюсь, узбеков вам, судари

#9 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 16:46

СообщенияRemis, on 07 December 2016 - 14:20, сказал:

Бамбук,постулат интересен и сама идея,но после перехода на формул приходится нюхать нашатырный спирт,чтобы уловить суть вычисления на скрине.
На самом деле НС как работают объяснить можно и ученику 5-го класса...но форум не очень приспособлен для распальцовок и пояснений...есть много публикаций по НС поэтому-то тут проблем нет..Я просто свёл может быть к слишком замороченной формуле но по идее-то я ж написал--можно замудить обычную НС.
\\тут ещё есть много нюансов как упростить начальное экспериментаторство---по идее-то надо в БД всё впихивать и там потом брать данные но можно тупо использовать шахматки для формирования множеств для обучения сети. Какая нам хрен разница в начальной стадии когда если предположить что выходная функция гладкая (то есть близко расположенные входные вектора для двух пар дадут и близкий ответ сети)---можно взять и уже в закрытых полностью сезонах
сформировать из шахматок наборы тогда по логике если допустим учитывать Д/Г то для дома--двигаемся по строке а для гостевого состояния по столбцу.
тогда вот как будет в этих упрощённых потугах---вектор Д например для команды А будет постоянным по забитым и пропущенным (RaL RLa) а остальные там команды будут менять свои гостевые наборы распределений...для гостевого похожая ситуация...
Если на классических алгоритмах учить то вектора надо как-то перемешать будет случайным образом (на край если со случайным перемешиванием туго можно брать как в сезонном календаре всё идёт) думаю сезона 3-4 можно пробовать залить в данные (можно конечно и лиги похожие собрать в кучу по каким-то соображениям). Потом поделить как я говорил на кластеры (да можно тупо начать по кефам на ТБ-ТМ делить...потом сразу бедет понятно в какой полосе и какая сеть переигрывает БК)....
Если в екселе делать самому и использовать "поиск решения" то там перемешивать не надо---там целевой функцией для минимизации будет сумма квадратов отклонений от выходного сигнала. Потом конечно надо определиться с процедурой принятия решения---выше какого значения и в каком кластере брать исход.
Может даже оказаться что выходной сигнал обученной сети лучше брать в каком-то его диапазоне значений для некоторых полос кефоф бк...это всё надо на тесте проверять (тестовое множество в обучении не должно участвовать (ну можно для начала пол сезона 0.75сезона или сезон оставить последнего).
Я собственно почему к распределениям обратился--может кому-то пригодится...я строил сети и по средним показателям и по распределениям так вот для ВНП лини бК по распределениям поточнее получается ну и вот подумал мож и на тотал оно лучше покатит...Это надо проверять ...точно ни чё сказать не могу так как тоталы я не юзал.... кроме того потом можно и не использовать сигнал сети в голом виде а прикрутить ещё чё нить--ну или тотал там за последние матчи+лички+хз надо тоже смотреть чё там влияет на профит ( я подчёркиваю именно на профит по нашим ставкам...дело вот тут в чём програм по идее дохрена которые строят разные разделяющие поверхности и могут показывать что влияет на увеличение проходимости но дело в том что часто и достаточно движение в эту сторону совершают и конторы и режут там кефы и получается вот как---идём в полосе или кластере в сторону повышения частоты захода по какому-то критерию(или их набору) а вместо повышения профита видим более сильный дрейф в убытки...это надо учесть при построении экспертной системы)...

Отредактировано Bambuk, 07 December 2016 - 16:48.


#10 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 17:04

вот тут нашёл старые какие-то данные как пример кусок покажу--как получается если делать по матрицам сезонов.
Прикрепленный файл  примерНДНС.jpg   511.87K   4 Количество загрузок

что-то не могу загрузить изображение...ща подумаю...пойду покурю для начала...

Отредактировано Bambuk, 07 December 2016 - 17:13.


#11 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 17:22

Дубль 2
Прикрепленный файл  примерНДНС.jpg   210.51K   1 Количество загрузок

тут конечно не по теме но просто чтоб понятно было что вот идут данные и они там одинаковые для Марселя, а для гостя будут меняться и так всё проходим до конца..получится набор чё нам порёт для начала.

Отредактировано Bambuk, 07 December 2016 - 17:26.


#12 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 18:01

Сообщенияeeww, on 07 December 2016 - 13:24, сказал:

что за бред
Я бред вижу на всех форумах, где идут дискуссии по прогнозированию тоталов(этот не исключение) ещё один бред не будет я думаю существенной помехой в общей картине мира...
тем более что подобного "высокохудожественного бреда" я как-то не узрел на просторах форума.

Вообще лучше писать конкретно--в чём видится бред...ибо без этого бред не обоснованный какой-то...возможно доктор узревший бред у пациента сам в состоянии не стоянии... нет-с раскрытия этиологии заболевания породившего бред.....
Видно что доктор плохо знаком с ОБЩИМИ ПОНЯТИЯМИ ЭТИОЛОГИИ, ПАТОЛОГИИ, ПАТОГЕНЕЗА, ПАТОЛОГИЧЕСКИХ ПРОЦЕССОВ И СИМТОМОВ... :)

Отредактировано Bambuk, 07 December 2016 - 18:03.


#13 OFFLINE   felixx

    Специалист


  • mp
  • 1842 сообщения
199
  • МестоположениеМосква

Добавлено 07 December 2016 - 20:42

eeww знаменит патологическим неумением делать предложения более чем из десяти букв.

#14 OFFLINE   Антон Рогов

    Специалист


  • Участник II
  • ПипПипПип
  • 172 сообщения
28

Добавлено 07 December 2016 - 21:45

Бамбук это все охуительно!!!! Я за тебя всегда!!! ты просто скажи куда ставить и все!!!!!!!!!!!!!!!!!!!!!!!Ткни пальцем на команду (лошадь)(ракетку)(президента) и тут же пихаю 100 баксов без разговоров.

СообщенияRemis, on 07 December 2016 - 14:20, сказал:

Бамбук,постулат интересен и сама идея,но после перехода на формул приходится нюхать нашатырный спирт,чтобы уловить суть вычисления на скрине.
Ремис это типа ты так признался что ни куя не понял???))))

У нас препод в институте типа тебя Бамбук был)))не в обиду тебе будет сказано.Раздал методички-мы обрадовались-всего пара страниц...Открываешь-вроде по русски написано....но ни ХУЯ НЕ ПОНЯТНО.

#15 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 21:51

Сообщенияfelixx, on 07 December 2016 - 20:42, сказал:

делать предложения более чем из десяти букв.
Тут достаточно и 10-ти ...если считать что в каждую клетку пишем букву то не так сложно понять что две клетки или 4-ре несут меньше информации чем 20-ть
исходя из сего можно надеятся что использование неких средних показаателей по заб. пропущ. менее информативно и обладает более высокой энтропией чем распределения. Хотя конечно в самих распределениях степень достоверности по одной координате конечно ниже чем МО в виде некого среднего но тут есть некое обоснование для некоторых простых моделей прогнозирования где например предлагается использовать средние показатели по заб.-проп. с последующим использованием стандартных распределений типа биномиального или пуассона итд.....дело в том что для такой концепции необходимо чтоб команда играла не с неким абстрактным эталоном а с одной конкретной командой....дело в том что если рассматривать вот такую конструкцию==игра А с Б и сумма игра с Б С Д Е
то понятно что Б+С+Д+Е с натяжкой можно представить в виде одной команды и там по сути будет смесь распределений (которую не плохо бы различать..но в лиге это проблематично сделать так как там и так с данными--беда по объёму)..факт состоит в том что при проверке гипотезы о виде распределения достаточно много смесей которые формально рассматриваются как одна команда не дают кривую по распред. которая бы согласовывалась с гипотезой о таком-то виде распределения (биномиальное например или Пуассона)..там можно в лучшем случае заменить двумя распределениями которые сложены...тогда там расчёты совершенно не такие как обычно там пишут (на Пинакле кстати описана такая хрень--модель по средним заб-проп дома и в гост..... в статьях про ставки).

Чё тут обсуждать я не знаю---вот допустим два вектора ( пусть 0 1 или 2 гола ) пусть 7 игр вот инфа (0 5/7 2/7) и вектор (1/7 3/7 3/7) мат. ожидания (это и есть средние) у них одинаковые и равны 9/7..... понятно ж что вектора более нас информируют чем это 9/7

#16 OFFLINE   mixey

    Пунтер


  • Участник II
  • ПипПип
  • 86 сообщения
7

Добавлено 07 December 2016 - 21:54

СообщенияBambuk, on 07 December 2016 - 17:04, сказал:



что-то не могу загрузить изображение...ща подумаю...пойду покурю для начала...

Мое почтение! Вопрос один, кто Ваш поставщик этой забористой "махорки"
Прочитал Ваш пост от корки до корки, сознаюсь с трудом, да че там я чуть не ох.ел, посему я отступлюсь в борьбе за нобелевскую премию. Приз Ваш, а я пойду ка пожалуй за салфеткой, маргарин с ушей бежать не прекращает.

#17 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 22:02

СообщенияАнтон Рогов, on 07 December 2016 - 21:45, сказал:

ты просто скажи куда ставить и все!!!!!!!!!!!!!!!!!!!!!!!
Я рад за вас если вас пока волнует вопрос на что ставить а не что ставить....значит у вас всё норм....
Ставьте на красивых!!!!!!!!!!

Сообщенияmixey, on 07 December 2016 - 21:54, сказал:

я пойду ка пожалуй за салфеткой, маргарин с ушей бежать не прекращает.
Куда же Вы? Я еще не спел свою лебединую песню про регуляризацию при обучении :)

#18 OFFLINE   mixey

    Пунтер


  • Участник II
  • ПипПип
  • 86 сообщения
7

Добавлено 07 December 2016 - 22:14

СообщенияBambuk, on 07 December 2016 - 22:02, сказал:



Куда же Вы? Я еще не спел свою лебединую песню про регуляризацию при обучении :)/>

Не не, я вот он я, меня хоть и торкнуло Ваше творчество, но считать его неверным не имею права, почему следить буду и все таки жду когда уже начнут наливать обещанное.

#19 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 December 2016 - 22:36

Можно бегло вот тут например почитать у кого заморочки с пониманием https://www.mql5.com/ru/articles/497 вообще-то сейчас куча всяких публикаций по этой хрени.... такое ощущение что народ с луны прилетел и кроме кайла для добычи лунного грунта не видел ни чё...так нах вам НС если есть кайло? Вот с ним и в контору за баблом....самое то...могу бензопилу дать кому надо (но это ближе к весне сейчас самому нужна..а то мля кайла-то нет у мене.... :) )

Отредактировано Bambuk, 07 December 2016 - 22:37.


#20 OFFLINE   mixey

    Пунтер


  • Участник II
  • ПипПип
  • 86 сообщения
7

Добавлено 07 December 2016 - 22:48

СообщенияBambuk, on 07 December 2016 - 22:36, сказал:

Можно бегло вот тут например почитать у кого заморочки с пониманием https://www.mql5.com/ru/articles/497 вообще-то сейчас куча всяких публикаций по этой хрени.... такое ощущение что народ с луны прилетел и кроме кайла для добычи лунного грунта не видел ни чё...так нах вам НС если есть кайло? Вот с ним и в контору за баблом....самое то...могу бензопилу дать кому надо (но это ближе к весне сейчас самому нужна..а то мля кайла-то нет у мене.... :)/> )

А Вы опасный человек! Но вот же она железобетонная стратегия, в контору с бензопилой, профит обеспечен :-):-):-)