Перепрыгнеть в содержание


* * * * * 1 голосов

Объединение усилий по сбору и организации БД по футболу


222 ответов в эту тему

#81 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 11 May 2015 - 00:21

Сообщенияtester.nt, on 10 May 2015 - 22:45, сказал:

Вы говорите, что маркер - это выполнение набора условий. Если мы условия знаем, то какая проблема их запрограммировать в формулу?
Сейчас попробую объяснить проблему допустим каждая команда имеет 3 характеристики Х1 Х2 Х3 представьте что мы указали начальный диапазон для команды А по характеристике Х1--допустим окружили значение Х1а интевалом у нас получилась первичная выборка предположим что надо вычислить что-то при условии что мы разделим диапазон Х2 на несколько частей число которых зависит от размерности множества Х2. Если Вы для Х1 зададите для другой команды Б Х1б и тоже окружите границами (которые могут в общем случае быть даже по дельте вправо-влево от знач. разные и зависеть от него. так Вы тогда получите другое множество Х2 и другой мощности...а там допутим ещё какие-то пироги по расчётам которые зависят от среднего значения Х2 ну и так далее.... я тут намутил конечно но общий смысл он вот такой как описано---априорно можно в ряде случаев ни чего не знать а алгоритм будет зависеть от того что выбрано...... Всю эту бадягу можно конечно исключить задавая априорно какие-то интервалы, создавая унифицированные кластеры и с ними работать но тогда мы не сможем работать конкретно по паре (или конкретной команде) ттак как она уникальна и чтоб повысить точность оценок мы можем только окружать её характеристики оболочками но мы как я уже ранее говорил не можем задать интервалы для всех параметров в БД потому как их может быть и 200 и 250 шт а данные за 1905 год мы не можем обработать и поэтому надо применять алгоритмы выбора характеристик которые наиболее влиятельны на профит (временно заменяя их влиянием на рез) потом смотреть как изменение параметра(по влиянию на рез) влияет на профит.... проблема с этими критериями в том что они нелинейно влияют на профит и при этом влияние на рез может возрастать и тоже быть нелинейной функцией).
Вот простой пример---если взять число забиваемых командой голов дома для дом.ком. ну допустим З1 среднее [2.3-2.7] так вот если вы будете смотреть влияние на на тотал среднего
по гостю (сколько он в гостях в среднем забивает) то там по логике--раз больше гость забивает а первый интервал мы фиксируем должен тб2.5 расти при возрастании и уменьшаться если брать меньше...но там ситуация совершенно иная чем я написал, а какая вот и посмотрите и допустим вам надо разбить теперь вторую характеристику З2 на характерные участки и смысл в том что взяв одно З1 мы не понимаем как задать второе (или рассчитать что-то чтоб дальше-то как-то осмысленно двигаться). Если мы конечно уже всё знаем и понимаем то там разумеется бей в базу и смотри-выбирай, а вот на начальном-то этапе...мы ж ни чего не знаем не понимаем и нам надо исследовать, добавлять-убирать переделывать характеристики итд (а их можно миллион придумать).... и по тоталу можете посмотреть профиты сразу (можно взять окно-интервал и им потихоньку двигаться по параметру З2 вычисляя частоты(или типа справедливе кефы появления ТБ в окне и профиты).

#82 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 11 May 2015 - 00:31

Сообщенияtester.nt, on 10 May 2015 - 23:07, сказал:

Там, скорее всего, макросы не прокатят. А что за вычисления? Формулами не пойдёт?
А как допустим если Вы вдруг захотите унифицировать некоторые множества задав жёстко кластеры относить пару или команду к этим кластерам? там функциями не получится---это например может понадобиться если Вы сделаете штук 15 неросетей под каждое унифицированное множество или там допустим можно жёстко тогда и задать какие-то решающие правила. А в кластере там например может быть так что известен центройд---центр кластера (это вот допустим наши Х1 Х2 Х3 типа трёх мерный вектор и таких 15 или 20 шт
тогда если пара есть с параметрами Х1 Х2 Х3 пары вы тогда должны отнести её к ближайшему центройду а если вектор центройда имеет большую размерность? там формулы будут громоздкие....да мало ли чё в башку может прийти сделать....)

Отредактировано Bambuk, 11 May 2015 - 00:32.


#83 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 11 May 2015 - 01:57

Я думаю на текущем этапе надо просто расширить базу на предмет пихания туда всего "ценного-по влиянию" и побольше---вот кстати раньше я работал с распределениями по голам и именно по ним находил среднее для моделей а не по среднему арифметическому....это получается два распределения от команды к куче и от кучи к команде для общих данных или 4 если брать Д/Г
потом они аппроксимируются биномиальным распределением параметры которого и берём для расчёта при этом рассчитываем дисперсии по найденному МО бином.расп
и реальным частотам при этом МО можно получить формально и из этой дисперсии...и если при решении получаем комплексные корни то команду маркируем по соответствующему распределению (или от команды к куче или от кучи к команде типа забитые--пропущенные)---такую тупизну можно использовать вместо проверки гипотезы на соответствие распределения биномиальному (в рамках наших задач так как такого критерия проверки в статистике нет но маркер просто говорит нам что команда будет хуже описываться моделью чем без маркера(ров)).
Далее берём тупо формулу с пинакла и находим МО1 МО2 пары по которым можем что угодно рассчитать для линии БК +распределения команд пары при их встрече между собой
так как такие параметры получаются стандартным алгоритмом то любую величину нами просчитанную можно формально рассматривать как критерий со всеми вытекающими последствиями поэтому в базу можно по идее нахерачить столько что файл просто не откроется(потому как всю куйню что я описал можно сделать и по таймам ) :) . Поэтому надо конечно что-то поактуальнее туды (а не вот это вот что я настрочил...хотя у меня есть МО в базе но там совсем просто как на пинке только для построения распределений где можно накладывать ограничения).... В базу можно и рейтинги напихать какие-то...это дело добровольное...главное чтоб работало...

Отредактировано Bambuk, 11 May 2015 - 02:04.


#84 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 11 May 2015 - 08:50

Для простых критериев можно посчитать и записать в базу данных метки, но для сложных критериев нужно рассчитывать и записывать метки в таблицу текущих игр, а затем добавлять в общую базу. Если вы будете рассчитывать данные по всей базе, а не только по предшествующим играм, то вы лишите себя возможности определить стабильность критериев во времени.
По поводу наполнения базы. Если вы работаете только со статистикой внутри лиг, то, скорее всего, вам будет очень не хватать данных для получения статистически достоверных результатов, да и стабильность игры менее квалифицированных команд ниже. Понятно, что нельзя сравнивать игры проводимые по круговой системе с играми на вылет. Кроме того, если вы попытаетесь создать общую систему обработки информации, то для многих низших лиг нужная и важная информация просто отсутствует в интернете.

#85 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 11 May 2015 - 09:30

Bambuk, учитывая то, что сейчас только начальный этап создания инструмента, не кажется ли Вам, что мы немного залезли в дебри абстракций. Реальное создание инструмента и наполнение базы все равно идет шаг за шагом, как ни крути. Сидишь и думаешь как рассчитывается тот или иной критерий, как его удобнее интегрировать в базу, занимаешься оптимизацией формул и существующих алгоритмов, переделываешь одно и то же по несколько раз для того чтобы работало как надо.

Я пока хочу показать как создается данный инструмент с самого нуля, постепенно усложняя задачи и наращивая количество расчетов. Еще раз повторюсь, что речь будет идти о разных этапах работы с данными, начиная от сбора и загрузки данных, и заканчивая отображением конечных расчетов. Если столкнемся с необходимостью проведения расчетов в других программах, то будем решать эту задачу, но уже конкретно. Даже если все расчеты надо будет перенести в другую программу (а может надо будет еще ее и написать), то Excel со сводными таблицами останется удобным инструментом навигации по данным. Потому что это удобство ничем кроме него или программ подобных ему не обеспечить.

Так что, предлагаю немного подождать с описанием разных сложностей. Мы уже по ним прошлись. Но если так и будем говорить о том, что нас впереди ждут большие неприятности, то с места не сдвинемся. Так что давайте что-то конструктивное. Например, предлагаю составить список критериев, который будем интегрировать в базу. Хотите начинайте Вы, а нет, то я начну. В любом случае наличие списка не помешает да и будет полезным другим читателям.

Сообщенияandre48, on 11 May 2015 - 08:50, сказал:

Для простых критериев можно посчитать и записать в базу данных метки, но для сложных критериев нужно рассчитывать и записывать метки в таблицу текущих игр, а затем добавлять в общую базу. Если вы будете рассчитывать данные по всей базе, а не только по предшествующим играм, то вы лишите себя возможности определить стабильность критериев во времени.

Что вы имеете ввиду под выражением "рассчитывать данные по всей базе, а не только по предшествующим играм"?

Сообщенияandre48, on 11 May 2015 - 08:50, сказал:

По поводу наполнения базы. Если вы работаете только со статистикой внутри лиг, то, скорее всего, вам будет очень не хватать данных для получения статистически достоверных результатов, да и стабильность игры менее квалифицированных команд ниже. Понятно, что нельзя сравнивать игры проводимые по круговой системе с играми на вылет. Кроме того, если вы попытаетесь создать общую систему обработки информации, то для многих низших лиг нужная и важная информация просто отсутствует в интернете.

Здесь тоже хочу уточнить по поводу "статистики внутри лиг". А где она может быть еще? Товарищеские матчи, кубки и т.д.? Вы это имели ввиду или что-то другое?

По поводу отсутствия информации, то на данном этапе планирую работать только с теми лигами, по которым информация присутствует.

Отредактировано tester.nt, 11 May 2015 - 09:38.


#86 OFFLINE   Vladislove

    Специалист


  • Участник II
  • ПипПипПип
  • 165 сообщения
53
  • МестоположениеРоссия

Добавлено 11 May 2015 - 10:38

Сообщенияtester.nt, on 10 May 2015 - 21:36, сказал:

Видео 1: Введение в работу со сводными таблицами Excel (на примере данных с football-data.co.uk)
Ссылка на видео

Большое спасибо за видео, мне как человеку осваивающему эксель, было очень интересно узнать какие то новые фишки для себя и понять, как всё можно упростить с помощью сводных таблиц. Буду с нетерпением ждать новых ваших скринкастов :)

Кстати, хочу уточнить.....обязательно ли должна быть установлена 2013 версия экселя? Я вот в инете помониторил и узнал, что например надстройка PowerPivot уже идет вместе с ним. У меня установлена 2010 версия (не лицензионная), но очень стабильно и хорошо работающая, которую мне ни особо хотелось бы сносить.....вот эти вот надстройки PowerQuery и PowerPivot они вообще как, работают ли с 2010 версией и они вообще являются бесплатными или их нужно покупать?

#87 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 11 May 2015 - 10:55

Сообщенияtester.nt, on 11 May 2015 - 09:30, сказал:

Что вы имеете ввиду под выражением "рассчитывать данные по всей базе, а не только по предшествующим играм"?

Здесь тоже хочу уточнить по поводу "статистики внутри лиг". А где она может быть еще? Товарищеские матчи, кубки и т.д.? Вы это имели ввиду или что-то другое?

По поводу отсутствия информации, то на данном этапе планирую работать только с теми лигами, по которым информация присутствует.
Я имел ввиду то, что если вы собираетесь искать соответствия для французских команд только в чемпионате Франции, то будет очень мало статистики для углубленных критериев. Более того, при малом количестве игр в выборке, появляются ошибочные данные для игры за счет статистических выбросов.С другой стороны, в свое время, мне пришлось отказаться от некоторых лиг из-за того, что командам в этих лигах не находилось соответствия в остальной базе данных. В выбранном вами сайте для получении информации о характере (качестве) игры она дана только на ведущие чемпионаты. Например, даже на итальянскую серию B ее там нет. А если работать только с ведущими чемпионатами, то это уменьшит базу, что, в свою очередь, затруднит получение статистически достоверных результатов анализа.

Отредактировано andre48, 11 May 2015 - 10:57.


#88 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 11 May 2015 - 11:47

СообщенияVladislove, on 11 May 2015 - 10:38, сказал:

Большое спасибо за видео, мне как человеку осваивающему эксель, было очень интересно узнать какие то новые фишки для себя и понять, как всё можно упростить с помощью сводных таблиц. Буду с нетерпением ждать новых ваших скринкастов :)/>

Кстати, хочу уточнить.....обязательно ли должна быть установлена 2013 версия экселя? Я вот в инете помониторил и узнал, что например надстройка PowerPivot уже идет вместе с ним. У меня установлена 2010 версия (не лицензионная), но очень стабильно и хорошо работающая, которую мне ни особо хотелось бы сносить.....вот эти вот надстройки PowerQuery и PowerPivot они вообще как, работают ли с 2010 версией и они вообще являются бесплатными или их нужно покупать?

Благодарю за обратную связь! Это важно для меня, особенно на первых порах)

Что касается надстроек, то они полностью бесплатны. Я уже писал, что они обе работают как с 10 так и с 13 офисом. Но, для PowerQuery необходим 7 виндовс, а для PowerPivot можно и висту. И да, PowerPivot с 13 офисом поставляется в комплекте, а на 10-ку надо устанавливать. PowerQuery надо устанавливать в любом случае. Но Майкрософт активно развивает BI-направление, так что в будущих версиях возможно что и PowerQuery будет встроено в программу.
Но, независимо от того, что надстройки работают в обеих версиях офиса, файлы созданные в разных версиях несовместимы.

#89 OFFLINE   Vladislove

    Специалист


  • Участник II
  • ПипПипПип
  • 165 сообщения
53
  • МестоположениеРоссия

Добавлено 11 May 2015 - 12:09

Сообщенияtester.nt, on 11 May 2015 - 11:47, сказал:

Что касается надстроек, то они полностью бесплатны. Я уже писал, что они обе работают как с 10 так и с 13 офисом. Но, для PowerQuery необходим 7 виндовс, а для PowerPivot можно и висту. И да, PowerPivot с 13 офисом поставляется в комплекте, а на 10-ку надо устанавливать. PowerQuery надо устанавливать в любом случае. Но Майкрософт активно развивает BI-направление, так что в будущих версиях возможно что и PowerQuery будет встроено в программу.
Но, независимо от того, что надстройки работают в обеих версиях офиса, файлы созданные в разных версиях несовместимы.
Винда 7-ая у меня, офис 2010, в общем имеющиеся ресурсы пригодны, осталось теперь освоить надстройки) Спасибо за ответ)

#90 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 11 May 2015 - 12:12

Рассчитывать показатели можно по всей базе, в том числе и по играм, которые были после той игры для которой считаются показатели. В этом случае увеличивается база для расчетов, а отсюда и статистическая достоверность результата, но при этом теряется информация о стабильности показателей во времени. Кстати, метки важны не только для выявления зависимости показателей от времени, но и для выявления влияния ошибки определения вероятности внутри диапазона вероятностей(коэффициентов) на результат. Как правило эта усредненная вероятность занижена для маленьких коэффициентов диапазона и завышена для больших коэффициентов диапазона. В результаты, делаются ставки на высокие коэффициенты диапазона и не делаются ставки на низкие коэффициенты диапазона, что может привести к систематическим проигрышам, несмотря на то, что для этих коэффициентов получается высокая эффективность игры, то есть K*Pсред. по диапазону>1 .

Отредактировано andre48, 11 May 2015 - 12:13.


#91 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 11 May 2015 - 13:11

Сообщенияandre48, on 11 May 2015 - 10:55, сказал:

Я имел ввиду то, что если вы собираетесь искать соответствия для французских команд только в чемпионате Франции, то будет очень мало статистики для углубленных критериев. Более того, при малом количестве игр в выборке, появляются ошибочные данные для игры за счет статистических выбросов.С другой стороны, в свое время, мне пришлось отказаться от некоторых лиг из-за того, что командам в этих лигах не находилось соответствия в остальной базе данных. В выбранном вами сайте для получении информации о характере (качестве) игры она дана только на ведущие чемпионаты. Например, даже на итальянскую серию B ее там нет. А если работать только с ведущими чемпионатами, то это уменьшит базу, что, в свою очередь, затруднит получение статистически достоверных результатов анализа.
Я считаю, что для начала исследований по формализации качаства игры этой информации более чем достаточно. Там в общей сложности детальных сезонов где-то около 40 есть. Это около 10-15 тысяч матчей. А за какое-то время обязательно найдутся и другие источники.

А у вас как дела обстоят с определением качества игры?

Сообщенияandre48, on 11 May 2015 - 12:12, сказал:

Рассчитывать показатели можно по всей базе, в том числе и по играм, которые были после той игры для которой считаются показатели. В этом случае увеличивается база для расчетов, а отсюда и статистическая достоверность результата, но при этом теряется информация о стабильности показателей во времени.
Почему-же это теряется? Сделал сводку по годам или месяцам и смотришь на колебания значений.

#92 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 11 May 2015 - 13:39

Сообщенияtester.nt, on 11 May 2015 - 13:11, сказал:

Я считаю, что для начала исследований по формализации качаства игры этой информации более чем достаточно. Там в общей сложности детальных сезонов где-то около 40 есть. Это около 10-15 тысяч матчей. А за какое-то время обязательно найдутся и другие источники.

А у вас как дела обстоят с определением качества игры?


Почему-же это теряется? Сделал сводку по годам или месяцам и смотришь на колебания значений.
Насколько я понял, детальная информация там только на 11 лиг, флажки которых видны в заголовке. Например, по чемпионату Украины такой информации нет. Я стараюсь не использовать статистику с подобных абсолютно безответственных сайтов. И меня интересуют только опасные моменты у ворот, а не сколько времени команды держали мяч в центре поля. Я пользуюсь информацией с сайта William Hill. Информация теряется потому, что нужны не какие-то общие показатели за сезон, а информация о том как работает какой-то конкретный ваш критерий во времени, рассчитанный по данным, которые у вас были на момент игры, без учета тех, что появятся позже.

Отредактировано andre48, 11 May 2015 - 13:40.


#93 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 11 May 2015 - 14:20

Сообщенияandre48, on 11 May 2015 - 13:39, сказал:

Насколько я понял, детальная информация там только на 11 лиг, флажки которых видны в заголовке. Например, по чемпионату Украины такой информации нет. Я стараюсь не использовать статистику с подобных абсолютно безответственных сайтов. И меня интересуют только опасные моменты у ворот, а не сколько времени команды держали мяч в центре поля. Я пользуюсь информацией с сайта William Hill. Информация теряется потому, что нужны не какие-то общие показатели за сезон, а информация о том как работает какой-то конкретный ваш критерий во времени, рассчитанный по данным, которые у вас были на момент игры, без учета тех, что появятся позже.
По поводу безответственного сайта - в данном случае необоснованная претензия в сторону OptaSports.
По поводу качества игры - на опасных моментах далеко не заедешь.
По поводу потери информации - её не происходит. Возможность просматривать критерий во времени сохраняется не зависимо от наличия данных о последующих играх.

#94 OFFLINE   Vladislove

    Специалист


  • Участник II
  • ПипПипПип
  • 165 сообщения
53
  • МестоположениеРоссия

Добавлено 11 May 2015 - 14:33

Сообщенияandre48, on 11 May 2015 - 12:12, сказал:

Кстати, метки важны не только для выявления зависимости показателей от времени, но и для выявления влияния ошибки определения вероятности внутри диапазона вероятностей(коэффициентов) на результат. Как правило эта усредненная вероятность занижена для маленьких коэффициентов диапазона и завышена для больших коэффициентов диапазона. В результаты, делаются ставки на высокие коэффициенты диапазона и не делаются ставки на низкие коэффициенты диапазона, что может привести к систематическим проигрышам, несмотря на то, что для этих коэффициентов получается высокая эффективность игры, то есть K*Pсред. по диапазону>1 .

Уважаемые форумчане, не сочтите за наглость пожалуйста, но не могли бы Вы изъясняться более простым языком и желательно приводить примеры к своим рассуждениям. Эту просьбу я адресую ни только Вам - andre48, но и пользователю Bambuk и всем остальным. Мне безусловно очень интересно почитать ваши мысли, рассуждения, но я честно говоря половину не понимаю о чем написано, поскольку уж очень бывает заумно расписано и пока всё сообщение прочитаешь, становится каша в голове. Вам между собой конечно понятно о чем идет речь, но мне вот как гуманитарию, много чего не ясно, а я очень хочу тоже во всё вникать и учиться, потому что относительно с недавнего времени понял на сколько математика рулит в ставках. К своему стыду наверное, я хоть человек и интересующийся ставками, но имею достаточно примитивные математические познания, поскольку в школе мне это было не интересно, а в универе покупал, в общем сейчас в математике пытаюсь разбираться и изучаю активно сам.
Конечно вы можете сказать, мол твои проблемы....изъясняемся как нам удобно.....иди учи сынок.....выучишь, вернешься в ветку и поймешь.....,но тем не менее был бы очень благодарен вам, если вы бы всё же изъяснялись более понятно или хотя бы свои мысли подкрепляли какими то реальными простыми примерами, чтобы хоть визуально было понятно, о чем шла речь. Вот к примеру Вы andre48 говорили следующее: " В результаты, делаются ставки на высокие коэффициенты диапазона и не делаются ставки на низкие коэффициенты диапазона, что может привести к систематическим проигрышам, несмотря на то, что для этих коэффициентов получается высокая эффективность игры, то есть K*Pсред. по диапазону>1 ". Высокие....низкие кэфы диапазона....я вот совсем не понял что к чему....а вот был бы какой приведен пример реальный, то думаю, была бы совсем другая картина.

P.S. Не судите строго, просто хочу вникнуть во всё и набираться опыта от толковых игроков в ставках.

#95 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 11 May 2015 - 15:15

Сообщенияtester.nt, on 11 May 2015 - 09:30, сказал:

Bambuk, учитывая то, что сейчас только начальный этап создания инструмента, не кажется ли Вам, что мы немного залезли в дебри абстракций. Реальное создание инструмента и наполнение базы все равно идет шаг за шагом, как ни крути. Сидишь и думаешь как рассчитывается тот или иной критерий, как его удобнее интегрировать в базу, занимаешься оптимизацией формул и существующих алгоритмов, переделываешь одно и то же по несколько раз для того чтобы работало как надо.

Я пока хочу показать как создается данный инструмент с самого нуля, постепенно усложняя задачи и наращивая количество расчетов. Еще раз повторюсь, что речь будет идти о разных этапах работы с данными, начиная от сбора и загрузки данных, и заканчивая отображением конечных расчетов. Если столкнемся с необходимостью проведения расчетов в других программах, то будем решать эту задачу, но уже конкретно. Даже если все расчеты надо будет перенести в другую программу (а может надо будет еще ее и написать), то Excel со сводными таблицами останется удобным инструментом навигации по данным. Потому что это удобство ничем кроме него или программ подобных ему не обеспечить.

Так что, предлагаю немного подождать с описанием разных сложностей. Мы уже по ним прошлись. Но если так и будем говорить о том, что нас впереди ждут большие неприятности, то с места не сдвинемся. Так что давайте что-то конструктивное. Например, предлагаю составить список критериев, который будем интегрировать в базу. Хотите начинайте Вы, а нет, то я начну. В любом случае наличие списка не помешает да и будет полезным другим читателям.



С Вашими словами конечно трудно не согласиться, но с другой стороны я хочу чтоб Вы меня правильно поняли к чему я веду---дело в том что уровень подготовки игроков разный и поэтому у многих может возникнуть мнение (и оно есть и не раз на форуме высказывалось особенно вилочниками) что это всё бесполезная трата времени...а такое умозаключение например может возникнуть в банально простой ситуации когда человек не корректно накладывает ограничения и не корректно оценивает полученный рез как по его значимости (в зависимости от объёма обработки) так и по устойчивости показателя во времени (например посезонно). Вот представьте что влияние какого-то критерия (в купе с ещё какими-то) таково что внутри самой выборки при изменении этого критерия профит имеет вид синусойды к которой прибавили некоторую константу...тогда по всей выборке вы и получите эту константу а дальше допустим вам попалась лига и вы её играете допустим (а критерий смотрели по набору лиг ну или тут и по совокупности лиг может быть похожая ситуация если вы то играете,то выпиваете, то в бане--за одно и помыться...ну итд) тогда если пары попадут в область синусойды с впадиной, то вы по идее можете получить убытки, хотя формально будете брать команды в критерий попавшие. Это если априорно критерий создан...а если по конкретным данным пары то там может похожая быть ситуация если вы не понимаете
как характеристики пары которые взяты для умозаключений (даже например 4-5 признаков) расположены в пространстве тех же признаков всей выборки-оболочки...так как там внутри профиты могут быть "изрезаны" лагунами и пиками профита совершенно так же как и в предыдущем примере......

Если Вы понимаете сию проблему то это хорошо но пусть и прочитав хоть данное сообщение и другие понимают некоторые сложности которые имеют место при работе с критериями.

#96 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 11 May 2015 - 15:21

Сообщенияtester.nt, on 11 May 2015 - 14:20, сказал:

По поводу безответственного сайта - в данном случае необоснованная претензия в сторону OptaSports.
По поводу качества игры - на опасных моментах далеко не заедешь.
По поводу потери информации - её не происходит. Возможность просматривать критерий во времени сохраняется не зависимо от наличия данных о последующих играх.
На подобных сайтах достаточно часто появляется информация, которая не может быть правильной. Например, число ударов в створ ворот меньше, чем число забитых мячей даже в отсутствии автоголов. На один такой сайт (scoresway), который сотрудничает как раз с OptaSports, я даже посылал письмо, но не получил ответ. У меня получилось по статистике, что именно опасные моменты у ворот самый значимый показатель из характеристик качества игр, возможно вы найдете какие-то другие показатели, более значимые. Если вы будете рассчитывать показатель с учетом последующих игр,то вы учтете при его расчете все возможные изменения, которые могли произойти в исходных данных для расчета, произошедшие после того как игра уже состоялась.

Отредактировано andre48, 11 May 2015 - 15:21.


#97 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 11 May 2015 - 15:41

СообщенияVladislove, on 11 May 2015 - 14:33, сказал:

Вот к примеру Вы andre48 говорили следующее: " В результаты, делаются ставки на высокие коэффициенты диапазона и не делаются ставки на низкие коэффициенты диапазона, что может привести к систематическим проигрышам, несмотря на то, что для этих коэффициентов получается высокая эффективность игры, то есть K*Pсред. по диапазону>1 ". Высокие....низкие кэфы диапазона....я вот совсем не понял что к чему....а вот был бы какой приведен пример реальный, то думаю, была бы совсем другая картина.
Когда рассчитываются показатели, то обычно они считаются в какой-то полосе коэффициентов, например могут считаться в полосе коэф. 1,7-2,1 Если окажется, что в среднем в этой полосе выигрывают 55% исходов с этими коэффициентами, то получится, что если БК даст коэф 1,7 эффективность игры равна 0,55*1,7=0,935, то есть меньше 1, и делать ставку нельзя, а при коэффициенте 2,1 эффективность игры равна 0,55*2,1=1,155 и нужно делать ставку. В реальности, внутри диапазона коэффициентов процент выигрыша не равен среднему значению (в данном случае 55%), а, обычно, он уменьшается с увеличением коэффициентов. Поэтому, делая ставки на большие коэффициенты диапазона, в данном случае 2,1 и рассчитывая на средний выигрыш +15,5%, можно в результате получить проигрыш.

#98 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 11 May 2015 - 15:43

Сообщенияandre48, on 11 May 2015 - 15:21, сказал:

Если вы будете рассчитывать показатель с учетом последующих игр,то вы учтете при его расчете все возможные изменения, которые могли произойти в исходных данных для расчета, произошедшие после того как игра уже состоялась.
Такого не бывает. Показатели считаются на момент игры, а будущие изменения не учитываются.

#99 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 11 May 2015 - 15:59

СообщенияBambuk, on 11 May 2015 - 15:15, сказал:

С Вашими словами конечно трудно не согласиться, но с другой стороны я хочу чтоб Вы меня правильно поняли к чему я веду---дело в том что уровень подготовки игроков разный и поэтому у многих может возникнуть мнение (и оно есть и не раз на форуме высказывалось особенно вилочниками) что это всё бесполезная трата времени...а такое умозаключение например может возникнуть в банально простой ситуации когда человек не корректно накладывает ограничения и не корректно оценивает полученный рез как по его значимости (в зависимости от объёма обработки) так и по устойчивости показателя во времени (например посезонно). Вот представьте что влияние какого-то критерия (в купе с ещё какими-то) таково что внутри самой выборки при изменении этого критерия профит имеет вид синусойды к которой прибавили некоторую константу...тогда по всей выборке вы и получите эту константу а дальше допустим вам попалась лига и вы её играете допустим (а критерий смотрели по набору лиг ну или тут и по совокупности лиг может быть похожая ситуация если вы то играете,то выпиваете, то в бане--за одно и помыться...ну итд) тогда если пары попадут в область синусойды с впадиной, то вы по идее можете получить убытки, хотя формально будете брать команды в критерий попавшие. Это если априорно критерий создан...а если по конкретным данным пары то там может похожая быть ситуация если вы не понимаете
как характеристики пары которые взяты для умозаключений (даже например 4-5 признаков) расположены в пространстве тех же признаков всей выборки-оболочки...так как там внутри профиты могут быть "изрезаны" лагунами и пиками профита совершенно так же как и в предыдущем примере......

Если Вы понимаете сию проблему то это хорошо но пусть и прочитав хоть данное сообщение и другие понимают некоторые сложности которые имеют место при работе с критериями.

Поэтому-то и хорошо иметь кроме табличного (текстового) способа отображения данных еще и графический. Сделав сводку выбранного критерия по времени сразу увидишь динамику его изменения - он растет или колеблется или имеет другое поведение. Я уже приводил картинки по ROI, которые могут служить демонстрацией данного примера.

Что касается полезности таких разговоров для других, то я склоняюсь к мнению, что разбор и демонстрация конкретного примера делают эту информацию более доступной для восприятия, нежели чистое абстрагирование.

#100 OFFLINE   Vladislove

    Специалист


  • Участник II
  • ПипПипПип
  • 165 сообщения
53
  • МестоположениеРоссия

Добавлено 11 May 2015 - 18:06

Сообщенияandre48, on 11 May 2015 - 15:41, сказал:

Когда рассчитываются показатели, то обычно они считаются в какой-то полосе коэффициентов, например могут считаться в полосе коэф. 1,7-2,1 Если окажется, что в среднем в этой полосе выигрывают 55% исходов с этими коэффициентами, то получится, что если БК даст коэф 1,7 эффективность игры равна 0,55*1,7=0,935, то есть меньше 1, и делать ставку нельзя, а при коэффициенте 2,1 эффективность игры равна 0,55*2,1=1,155 и нужно делать ставку. В реальности, внутри диапазона коэффициентов процент выигрыша не равен среднему значению (в данном случае 55%), а, обычно, он уменьшается с увеличением коэффициентов. Поэтому, делая ставки на большие коэффициенты диапазона, в данном случае 2,1 и рассчитывая на средний выигрыш +15,5%, можно в результате получить проигрыш.
Вот теперь более чем понятно, большое спасибо, что объяснили)