Перепрыгнеть в содержание


- - - - -

Data Mining для прогнозирования результатов в теннисе.


67 ответов в эту тему

#1 OFFLINE   Credo

    Специалист


  • Участник II
  • ПипПипПип
  • 190 сообщения
49

Добавлено 21 June 2013 - 10:46

Чтобы сразу было понятно, предлагаю прочесть вот это www.basegroup.ru/download/edu/konkurs/2011/05molkin.pdf
Для ленивых приведу некоторые выдержки. Файл pdf, поэтому скрины.

Прикрепленный файл  01.JPG   128.83K   20 Количество загрузок

Прикрепленный файл  02.JPG   35.17K   12 Количество загрузок

Прикрепленный файл  03.JPG   36.78K   10 Количество загрузок

Студент использовал бесплатную версию(Academic) аналитической платформы Deductor Studio, скачать которую можно с сайта www.basegroup.ru/

Для Sector`a, Bambuk`a и иже с ними разобраться и применить на практике не составит труда. Для меня же все эти OLAP-кубы, кросс-диаграммы, POC-кривые, нейросети 3:5:5:1 и т. д. совершенно непреодолимы. Я честно пытался два дня что-то загружать/извлекать в программе, но на то, что "являлось мне" смотрел как баран на новые ворота.
Для сбора данных парень парсил вот этот сайт www.stevegtennis.com/statistics-tennis/
Если не применять парсинг, то подойдет вот это www.tennis-data.co.uk/alldata.php
Также, можно вытащить что нужно из ОнКорт - кладовой теннисной статистики.
Достаточно ли данных в Аннотации к конкурсной работе, чтобы воспроизвести его изыскания? Чтобы было от чего отталкиваться.
ИМХО, теннис лучше поддается анализу, чем футбол. Давайте попробуем заняться теннисом для выявления "рейтинга" в матче. От меня постоянно обновляемая БД ОнКорт, если нужно.
Коллеги, тема ведь интересная. Ведь, смог же студент кулинарного архитектурного что-то. А здесь "профильный ВУЗ", так сказать.
Или же все это безперспективно?

#2 OFFLINE   chepicov

    Специалист


  • Участник II
  • ПипПипПип
  • 354 сообщения
23

Добавлено 21 June 2013 - 11:58

На первые 2 круга прогноз не делался, но правильно спрогнозировано 99 игр... 2 первых круга это 64+32=96 игр. Кроме того, в сезоне 2010, как впрочем и в любом другом, на турнирах Большого Шлема может быть только 127 игр...

#3 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 21 June 2013 - 13:10

СообщенияCredo, on 21 June 2013 - 10:46, сказал:


Достаточно ли данных в Аннотации к конкурсной работе, чтобы воспроизвести его изыскания? Чтобы было от чего отталкиваться.
ИМХО, теннис лучше поддается анализу, чем футбол. Давайте попробуем заняться теннисом для выявления "рейтинга" в матче. От меня постоянно обновляемая БД ОнКорт, если нужно.
Коллеги, тема ведь интересная. Ведь, смог же студент кулинарного архитектурного что-то. А здесь "профильный ВУЗ", так сказать.
Или же все это безперспективно?


Организация записей www.stevegtennis.com/statistics-tennis/
Date

Type

Name

Category

Wining Player

Losing Player

Score



2013-06-11

Men's Doubles

Prague Challenger

80

Hsin-Han Lee
Hsien-Yin Peng

Vahid Mirzadeh
Denis Zivkovic

6-4 4-6 10-5



2013-06-11

Men's Singles

Prague Challenger

80

Oleksandr Nedovyesov

Javier Marti

6-0 6-1



2013-06-10

Men's Singles

Halle

250

Roger Federer

Mikhail Youzhny

6-7(5) 6-3 6-4


2013-06-10

Men's Doubles

Italy F12 Futures

Futures

Andres Molteni
Walter Trusendi

Alex Bolt
Sami Reinwein

6-7(10) 6-3 [10-5]

Я например в теннисе полный нуль.
Что такое Category?
Что означают данные в круглых скобках и квадратных?
И как по сим данным (записей) понять ход игры—выигранные подачи и так далее
ну в общем внутреннюю составляющую.

Из тех данных что опубликованы непонятно собственно какая цель достигается. Получен результат допустим 70% ну и что? Берём тупо кефф БК 10/7 и имеем тотже результат фактически. Нам же не это совсем надо. Потом как я понял там вообще пара как таковая не рассматривается а берётся конкретный игрок и ведётся этот долбаный куб как суть временной ряд. А куб это тупо структура порождающая результат. Очень много буржуйской терминологии а нам колхозникам надо чё попроще и главное понятнее чисто по процедурам обработки. А суть примерно такая---можно это всё заманить алгоритмами сортировки-группировки и выборки по каким-то параметрам и так далее.
То что представлено это просто способ обработки данных. Причём там же структуру организации куба как я понял исследователь задаёт самостоятельно.
Можно попробовать сделать например нейронную сеть, а точнее несколько сетей под несколько групп данных. Надо просто определиться с входными сигналами (что подавать на вход) и что мы хотим определить--выход (лучше брать более устойчивый показатель для тенниса например победа или что там ещё можно? какие ставки более предсказуемы и устойчивы?).
Входные сигналы должны быть значимыми.
Вообще какую можно регулярно получать информацию чтоб составить базу?

#4 OFFLINE   chepicov

    Специалист


  • Участник II
  • ПипПипПип
  • 354 сообщения
23

Добавлено 21 June 2013 - 13:16

СообщенияBambuk, on 21 June 2013 - 13:10, сказал:

Получен результат допустим 70% ну и что? Берём тупо кефф БК 10/7 и имеем тотже результат фактически.

Именно. Без привязки к кэфам эта цифра - 77,3% - абстрактна и никак не характеризует наличие/отсутствие перевеса.

#5 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 21 June 2013 - 14:51

Начнём с простейшего.
Есть пара из игроков А-Б
Давайте определим общих игроков с которыми они встречались
А встречался с С, Д, Е, Ж,З….. и Б встречался с С, Д, Е, Ж,З…..
С, Д, Е, Ж,З….. назовём общей кучей размерности N (число игроков в куче).
Далее—эта куча соответствует некоторому временному интервалу и нам с одной стороны желательно собрать больше игроков в кучу а с другой –выбрать интервал где мы с некоторой натяжкой можем считать форму игроков неизменной(хотя бы пока).
Далее вот наши данные допустим для
Игр А с кучей (6-4 2-6 6-5) (6-0 6-1) (3-6 6-2 4-6)….. пусть для простоты 3 игрока в куче чтоб меньше писать. Тогда давайте сложим вот так
А=6+2+6+6+6+3+6+4=39 К=4+6+5+0+1+6+2+6=30 М=А+К=69
Определим псевдо вероятности Р(а-к)=39/69=0.57 Р(к-а)=30/69=0.43
Для Б делаем тоже самое и допустим имеем Р(б-к)=0.35 Р(к-б)=0.65

Теперь перенесём это на пару следующим образом
Р(а-б)= Р(а-к)+( Р(к-б)- Р(б-к) )/2
Р(б-а)= Р(к-а)- ( Р(к-б)- Р(б-к) )/2
При этом считаем что А сильнее Б по соотношению Р(а-к)-Р(к-а)> Р(б-к)-Р(к-б)
(В противном просто меняем формально местами А с Б –переобозначаем грубо говоря)
Чтобы получить не количественные а качественные умозаключения по динамике
Мы можем просто взять последние временные интервалы и сделать кучу меньше и провести аналогичный расчёт и сравнить данные всевдовероятностей.
Р(а-б)—псевдовер. выигрыша А у Б , Р(б-а)—вер. выигрыша Б у А.
Теперь эти данные можно использовать как критерии для принятия решения.
По сути надо проанализировать соотношения кефоф и псевдовероятностей каким-либо способом, но тут могут быть и дополнительные критерии для выборок.
Можно перенести сюда формально формулу для рисков. Смотри Ссылка Здесь

Для риска можно задавать интервалы или совокупность интервалов для выборки и +
Можно добавить дополнительные критерии. Но пока вот можно хоть посмотреть—на сколько псевдовероятности отличны от оценок БК тогда можно чёта там дальше думать. В куче желательно иметь больше 20 игроков...ну если нет то скока там вообще есть?

Отредактировано Bambuk, 21 June 2013 - 14:57.


#6 OFFLINE   Sert

    Специалист


  • mp
  • 1412 сообщения
298

Добавлено 21 June 2013 - 14:58

Читал где-то эту статью. Сразу возьник вопрос - 77% это по какому кэфу :) ?

#7 OFFLINE   Sert

    Специалист


  • mp
  • 1412 сообщения
298

Добавлено 21 June 2013 - 15:17

Кстати, уже год пытаюсь попасть на курсы Oracle Data Mining в Москве, но кроме меня желающих нет :( , соответственно курсы не проводят...
Может кого-нибудь еще хочет, тогда вместе сгоняем, заодно в офлайне пообщаемся и пива попьем?

#8 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 21 June 2013 - 15:34

СообщенияSert, on 21 June 2013 - 15:17, сказал:

Кстати, уже год пытаюсь попасть на курсы Oracle Data Mining в Москве, но кроме меня желающих нет :( , соответственно курсы не проводят...
Может кого-нибудь еще хочет, тогда вместе сгоняем, заодно в офлайне пообщаемся и пива попьем?
Про добычу данных можно почитать тут для начала www.statistica.ru/home/textbook/default.htm

#9 OFFLINE   slamdunk

    Специалист


  • Участник II
  • ПипПипПип
  • 160 сообщения
15

Добавлено 21 June 2013 - 17:18

СообщенияBambuk, on 21 June 2013 - 13:10, сказал:


Andres Molteni
Walter Trusendi

Alex Bolt
Sami Reinwein

6-7(10) 6-3 [10-5]

Я например в теннисе полный нуль.
Что такое Category?
Что означают данные в круглых скобках и квадратных?
И как по сим данным (записей) понять ход игры—выигранные подачи и так далее
ну в общем внутреннюю составляющую.

Из тех данных что опубликованы непонятно собственно какая цель достигается. Получен результат допустим 70% ну и что?

Category - категория турнира. Большие шлемы и мастерсы - это топ-турниры,есть также в перерыве между ними турниры категорией пожиже, куда часто топ-игроки не едут, примерно как сейчас прямо перед Уимблдоном. Надаль, Федерер, Джокович, Серена, Шарапова и некоторые другие top-10 отдыхают. В круглых скобках количество очков набранных игроком проигравшим тай-брейк, те игрок А выиграл у игрока B на тай-брейке 7-5 - будет запись A-B 7-6 (5). В квадратных скобках результат укороченного тай-брейка или 3-го сета у пар. Пары особенно не жалуют в туре, и на обычных турнирах ( не шлемах) часто играют третий сет как подобие тай-брейка. До 10 набранных очков, если дошли до 9-9 то на больше-меньше, те перевес в 2 очка должен быть, чтоб нивелировать фактор подачи. Про цель согласен. На шлеме дофига будет матчей с кэфами ниже 1,1. Вспомнить прошедший Гаррос и туже Серену и Машу. Серена на победу турнира была ниже 2 еще до 7 матчей, которые ей надо сыграть было.

#10 OFFLINE   Credo

    Специалист


  • Участник II
  • ПипПипПип
  • 190 сообщения
49

Добавлено 21 June 2013 - 18:42

СообщенияBambuk, on 21 June 2013 - 14:51, сказал:

Начнём с простейшего.
Есть пара из игроков А-Б
Давайте определим общих игроков с которыми они встречались
А встречался с С, Д, Е, Ж,З….. и Б встречался с С, Д, Е, Ж,З…..
С, Д, Е, Ж,З….. назовём общей кучей размерности N (число игроков в куче).
Далее—эта куча соответствует некоторому временному интервалу и нам с одной стороны желательно собрать больше игроков в кучу а с другой –выбрать интервал где мы с некоторой натяжкой можем считать форму игроков неизменной(хотя бы пока).
Далее вот наши данные допустим для
Игр А с кучей (6-4 2-6 6-5) (6-0 6-1) (3-6 6-2 4-6)….. пусть для простоты 3 игрока в куче чтоб меньше писать. Тогда давайте сложим вот так
А=6+2+6+6+6+3+6+4=39 К=4+6+5+0+1+6+2+6=30 М=А+К=69
Определим псевдо вероятности Р(а-к)=39/69=0.57 Р(к-а)=30/69=0.43
Для Б делаем тоже самое и допустим имеем Р(б-к)=0.35 Р(к-б)=0.65

Теперь перенесём это на пару следующим образом
Р(а-б)= Р(а-к)+( Р(к-б)- Р(б-к) )/2
Р(б-а)= Р(к-а)- ( Р(к-б)- Р(б-к) )/2
При этом считаем что А сильнее Б по соотношению Р(а-к)-Р(к-а)> Р(б-к)-Р(к-б)
(В противном просто меняем формально местами А с Б –переобозначаем грубо говоря)
Чтобы получить не количественные а качественные умозаключения по динамике
Мы можем просто взять последние временные интервалы и сделать кучу меньше и провести аналогичный расчёт и сравнить данные всевдовероятностей.
Р(а-б)—псевдовер. выигрыша А у Б , Р(б-а)—вер. выигрыша Б у А.
Теперь эти данные можно использовать как критерии для принятия решения.
По сути надо проанализировать соотношения кефоф и псевдовероятностей каким-либо способом, но тут могут быть и дополнительные критерии для выборок.
Можно перенести сюда формально формулу для рисков. Смотри Ссылка Здесь

Для риска можно задавать интервалы или совокупность интервалов для выборки и +
Можно добавить дополнительные критерии. Но пока вот можно хоть посмотреть—на сколько псевдовероятности отличны от оценок БК тогда можно чёта там дальше думать. В куче желательно иметь больше 20 игроков...ну если нет то скока там вообще есть?
Спасибо за ссылку на Учебник. Читаю, изучаю, что не понятно спрошу.
Про рейтинги теннисных турниров можно почитать здесь ru.wikipedia.org/wiki/%D0%90%D1%81%D1%81%D0%BE%D1%86%D0%B8%D0%B0%D1%86%D0%B8%D1%8F_%D1%82%D0%B5%D0%BD%D0%BD%D0%B8%D1%81%D0%B8%D1%81%D1%82%D0%BE%D0%B2-%D0%BF%D1%80%D0%BE%D1%84%D0%B5%D1%81%D1%81%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D0%BE%D0%B2
Бамбук, отталкиваться от выигранных и проигранных геймов наверное нельзя. Нередки такие счета в матче А-В: 7-5 0-6 6-4. Или 2-1 по сетам(матч выиграл А), и 13-17 по геймам.
По, моему мнению то, что может применяться в футболе не работает в теннисе. И вот почему. Теннисист "как потопает, так и полопает" в отличие от "контрактника"-футболиста. Если можно так выразиться, то теннисист "на сделке", а футболист "на окладе".
С чего начать. Ведь с чего-то нужно начинать. Почему-то меня привлекает, по моему единственный параметр не зависящий от соперника - % первой подачи. Дальше можно искать зависимости от скорости подачи, погодных условий, под крышей/на воздухе ....
Зная отношение % 1-й к среднему % первой подачи для игрока можно уже поискать зависимость успешности выступлений на временном отрезке. Учитывая значимость первой подачи в теннисе, думаю можно начать формировать БД с нее.
Теперь, такой невещественный, но важнейший (важнее % первой подачи) критерий как мотивация. Вот здесь засада. Что брать за основу вычислений? Значимость турнира именно для данного игрока? Типа защиты очков или хороших призовых. А может возможность улучшить рейтинг и на следующей неделе уже попасть в число сеянных или войти в сотню, топ-50/20/10. Или просто "любимый" турнир. Как все это просчитать. Вопросы, вопросы....

#11 OFFLINE   JimmyDarmody

    Новичок


  • Участник
  • Пип
  • 3 сообщения
-1

Добавлено 21 June 2013 - 21:51

% первой подачи. Дальше можно искать зависимости от скорости подачи, погодных условий, под крышей/на воздухе ....

неплохо бы, ко всему перечисленному, учитывать на каком покрытии... грунт/трава..

есть такой термин в теннисе - грунтовик, те теннисист, излюбленным покрытием которого является грунт..
и его последние результаты, и параметры показанные на траве, абсолютно ничего не значат на грунте...

также
не было бы лишним учитывать
в каком турнире были показаны эти результаты

фавориты
перед крупным турниром
частенько сливаются в челленджах или мало значащих для рейтинга мероприятиях

Отредактировано JimmyDarmody, 21 June 2013 - 21:53.


#12 OFFLINE   Sector

    Holemaster


  • mp
  • 2994 сообщения
680

Добавлено 21 June 2013 - 23:09

Предлагаю найти статистику точек попадания в квадрат на подаче, вычислить матожидание и дисперсию по двум осям, а потом взяв двойной интеграл по площади корта от двумерной функции Гаусса (предполагается, что распределение точек будет нормальным) найти вероятность аута.

#13 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 22 June 2013 - 02:37

СообщенияCredo, on 21 June 2013 - 18:42, сказал:

Бамбук, отталкиваться от выигранных и проигранных геймов наверное нельзя. Нередки такие счета в матче А-В: 7-5 0-6 6-4. Или 2-1 по сетам(матч выиграл А), и 13-17 по геймам.

Одну игру рассматривать не надо. Барса тоже может проиграть 1-2 например но это ж не говорит что вероятность как-то сильно пошатнулась из-за этого факта. Это Выяснить очень просто--надо взять расчёт по геймам для кучи из 20 игроков например (да можно и меньше пока посмотреть) и сравнить с расчётом по сетам. Да тут в принципе можно параллельно два варианта рассматривать (суть расчёта останется только псевдовероятности начальные расчитать по сетам. Такой параллельный подход даже правильнее сделать на начальном этапе).

Вы пытаетесь очень всё детализировать, на каждого игрока в конечном итоге все факторы которые мы соберём влияют совершенно различным образом и создать универсальной зависимости не получится (тут будет рулить всё тот же принцип неопределённости). Проще рассматривать группы для начала. Допустим мы создали "колоду" которую и будем вести--например в колоде 56 игроков. Вот и больше не надо и рассматриваем тока их. Чтоб было проще на начальном этапе их можно раскинуть например в 5 или 6 или сколько мы по здравому смыслу посчитаем групп. вот у Вас получатся игры между группами 1-2 1-3 1-4 1-5 2-3 2-4 2-5 3-4 3-5 4-5 (можно допустим разделение сделать ещё по типу покрытия и рассматривать для разных покрытий вот эти сочетания) Тут самое главное чтоб условная пара i-j по группам имела достаточно игр --если там 10 тенисистов то они если раз даже сыграли меж собой это 90 игр. Вот в тенисе надо выяснить какие группировки мы можем создать и как сделать оптимальное деление (мы ж не можем брать очень старые игры--это определяется временными показателями развития тениса... спорт и технологии там применяемые развивается и это тоже надо учитывать). Это вот просто мысли "на пальцах" а так там можно что-то додумывать по ходу ситуации. Вот допустим группа тенисистов из 10 человек сколько сыграет за год? Или они вообще могут там не пересечся по всем парам?
Тут надо учитывать сам механизм проведения соревнований и как там встречаются. В футболе например сложно получить данные если идут игры в группах потом из групп команды
выходят и формируют новые и так далее до финала. Можно временно для создания групп и чтоб определиться сколько их лучше делать взять рейтинги тенисистов и создать интервалы
между самым большим и самым маленьким рейтингом. Может надо на 4 группы делить итд.. мы пока-то не знаем. Если некоторые условия соблюдаются и игр много например в год
то можно 2-3 года взять предыдущих и гнать группы через нейросети (для каждой своя) и будет на выходе допустим два нейрона которые можно сделать дающими вероятностные характеристики выигрыша А у Б или ещё там чёта что нам в голову придёт. Многие идут стандартными прозрачными путями, но в спорте прозрачного мало и поэтому надо разные варианты пробовать (даже абсурдные на первый взгляд). Вот почему бы не взять для сети не каки-то там данные статистики а тупо подавать кефы и обучать на сигналах выход
по принципу КЕФЫ--->РЕЗУЛЬТАТ (выигрыш или проигрыш).....так ещё ни кто не делал (и до кучи несколько наших сигнальчиков на вход которые мы считаем очень влиятельными на резы)..--зачем Вам корячится если формально в кефах часть инфы аккомулируется букмекерами? Вопрос с группами всё равно желательно провинтилировать даже если мы в каком-то ином направлении двинемся--подачи-модачи и проч. и проч.

Отредактировано Bambuk, 22 June 2013 - 02:48.


#14 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 22 June 2013 - 03:00

Забыл ещё внутригрупповые встречи--1-1 2-2 3-3 4-4 итд....... Когда будут данные по группировкам можно временно группу считать формально игроком со средними характеристиками
которые мы найдём и которые мы учитывали. Такое обстоятельство возможно поможет создать модель с конкретными связями между влияющими факторами (так как между группами-игроками значимые показатели и по вероятностям и по другим параметрам при достаточности игр). По геймам и сетам можно даже посмотрев результаты расчёта и сравнив с кефами рассмотреть как границы где вероятность находится (если данные позволят выдвинуть такую гипотезу). И ещё --на начальном этапе можно выдвигать самые корявые гипотезы--их потом просто можно проверить на состоятельность и они пока как "сырьё" для исследования.

Отредактировано Bambuk, 22 June 2013 - 03:06.


#15 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 22 June 2013 - 04:14

рейтинги
ATP www.eurosport.ru/tennis/atp/standing.shtml
WTA www.eurosport.ru/tennis/wta/standing.shtml
Судя по структуре Уимблдона можно на 5 групп, наверно,
попробовать делить колоду.

#16 OFFLINE   AlexP

    Генерал Максимус


  • Участник II
  • ПипПипПип
  • 493 сообщения
73
  • МестоположениеАрхангельск

Добавлено 22 June 2013 - 04:26

СообщенияBambuk, on 22 June 2013 - 04:14, сказал:

рейтинги
ATP www.eurosport.ru/tennis/atp/standing.shtml
WTA www.eurosport.ru/tennis/wta/standing.shtml
Судя по структуре Уимблдона можно на 5 групп, наверно,
попробовать делить колоду.
Дополню:
Рейтинг, форма итд - Сравнение теннисистов(ок) , имена и фамилии удобно брать в betcity, переключив его в Английский интерфейс. Также на сайте есть рейтинг "прибыльности" при ставках флетом на победу конкретного игрока. Но сам я его не поверял.
tennis.matchstat.com/Compare/

Отредактировано AlexP, 22 June 2013 - 04:27.


#17 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 22 June 2013 - 05:35

Кто пояснит на пальцах что это такое (это для подачи)? Хотя лучше наверно правила почитать.............
Эйс1 Эйс2 Мвм1 Мвм2 Роз1в Роз1пр Роз2в Роз2пр Двойн.

Отредактировано Bambuk, 22 June 2013 - 05:39.


#18 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 22 June 2013 - 09:25

В основу модели детализирующей внутреннюю структуру игры я думаю резонно положить методологию определения эффективности подачи в теннисе.
Тогда что Мы имеем ? Имеем для начала вот такое понимание процесса:
1-ая подача
--->Р1.1 выигрыш на вылет или выигрыш при ошибке противника
--->Р1.2 выигрыш в розыгрыше. Введём Рвр1 –вероятность выигрыша в розыгрыше при
первой подаче
--->Р1.3 ошибка подающего ---àвторая подача
2-ая подача
--->Р2.1 выигрыш на вылет или выигрыш при ошибке противника
--->Р2.2 выигрыш в розыгрыше. Введём Рвр2 –вероятность выигрыша в розыгрыше при
второй подаче.
--->Р2.3 ошибка подающего ---àпроигрыш.
Теперь из этого представления у нас Р выигрыша при своей подаче формируются из
P.WIN=Р1.1+Р1.2*Рвр1+ Р1.3*( Р2.1+Р2.2*Рвр2)

ПРИМЕР имеем данные игрока-Бамбука с какой-то группой
1-ая подача пусть имеется 100 опытов (наблюдений)
50--->Р1.1=50/100 выигрыш на вылет или выигрыш при ошибке противника
30--->Р1.2=30/100 выигрыш в розыгрыше. Введём Рвр1 –вероятность выигрыша в розыгрыше при первой подаче 20 выиг 10 проигр Рвр1=20/30
20--->Р1.3=20/100 ошибка подающего ---àвторая подача
2-ая подача (20 из 100)
8--->Р2.1=8/20 выигрыш на вылет или выигрыш при ошибке противника
10--->Р2.2=10/20 выигрыш в розыгрыше. Введём Рвр2 –вероятность выигрыша в розыгрыше при второй подаче.6 выиг 4 проигр Рвр2=6/10
2--->Р2.3=2/20 ошибка подающего ---àпроигрыш.
P.WIN=0,84 (очевидно проще сложить выделенные жирным цифры и поделить на 100)
Для второго игрока тоже известна характеристика P.WIN и далее можно уже строить
модель игры и находить вероятности событий….

Гейм на своей подаче
Выигрыш (проигрыш наоборот)
4-0 4-1 4-2 что будет при 3-3? Кто там подаёт и как сее происходит и до какого будем брать расклада реально встречающегося (редкие случаи можно исключить).
Дальше придётся наверно погрузиться в цепи Маркова для нахождения вероятностей.
Или есть предложения другие по расчёту гейма (выигрыша и проигрыша)?
Пока с геймом не будет ясности дальше двигаться бессмысленно. В цепи Маркова вероятности переходов из состояния в состояние будут определяться всего
двумя вероятностями (для подачи одного игрока) это P.WIN и (1-P.WIN)

Отредактировано Bambuk, 22 June 2013 - 09:36.


#19 OFFLINE   Credo

    Специалист


  • Участник II
  • ПипПипПип
  • 190 сообщения
49

Добавлено 22 June 2013 - 10:07

СообщенияBambuk, on 22 June 2013 - 05:35, сказал:

Кто пояснит на пальцах что это такое (это для подачи)? Хотя лучше наверно правила почитать.............
Эйс1 Эйс2 Мвм1 Мвм2 Роз1в Роз1пр Роз2в Роз2пр Двойн.
Приведу расшифровку непонятных терминов на примере предстоящего матча Турсунов-Хаас
Окно сравнительной статистики (программа OnCourt)

Прикрепленный файл  сравн. стат.JPG   102.81K   5 Количество загрузок

Статистика матчей.
Match W/L - выигранн/проигранн матчи
Set W/L - в/п сеты
Gm W/L - в/п геймы
Pts W/L - выигранн. очки
TB W/L - в/п тайбрейки
TBs per Set - тайбрейков на сет

Статистика на подаче
Aces per Gm - эйсов на гейм
DFs per Gm - двойных ошибок на гейм
1st Serve% - % первой подачи
1st Serve W% - % выигрыша 1-й подачи
2nd Serve W% - % выигр. 2-й
Service Pts W% - % выигранных очков на подаче

Брейкпойнты - Подача
BPs Saved per Gm - отыгранные брейпойнты на гейм
BPs Faced per Gm - кол-во б/п на гейм
BP Save% - процент отыгранных б/п
Service Hold% - % удержания подачи

Статистика на приеме
Opp. Aces per Gm - эйсов на гей у соперника
Opp. DFs per Gm - двойных на гейм у соперника
Opp. 1st Serve% - % первой подачи соперн.
1st Return W% - % выигр. игроком 1-й подачи соперника
2nd Return W% - % выигр. игроком 2-й подачи соперника
Return Pts W% - % выигр. очков на подаче соперн.

Брейкпойны прием
BPs Won per Gm - выигранн. б/п игроком на гейм
Bp Change per Gm - к-во б/п на гейм у игрока
Break Pt W% - % выигр. б/п игроком
Opp. Hold% - % удержания подачи соперником

Сравнительная статистика матчей.

Прикрепленный файл  сс л_в.JPG   61.91K   1 Количество загрузок

1st Serve% - % первой подачи
Acess - эйсы (подача навылет)
Double Fault - двойные ошибки
Unforced Error - невынужденные ошибки
Winning % on 1 st Serve - % выиг. 1-й подачи
Winning % on 2nd Serve - % выигр 2-й подачи
Winners (Includ. Serve) - виннерсы (активно выигранн. очки)
Break Point Conversions - реализация брейкпойнтов
Receiving Points Won - выигранн. очки на приеме
Net Approaches - выходы к сетке
Total Points Won - общее к-во выигранных очков
Fastest Serve - быстрейшая подача
Average 1 st Serve Speed - средняя скорость 1-й подачи
Averadge 2nd Serve Speed - средняя скорость 2-й подачи

#20 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 22 June 2013 - 11:11

СообщенияCredo, on 22 June 2013 - 10:07, сказал:

Приведу расшифровку непонятных терминов на примере предстоящего матча Турсунов-Хаас

Credo, если можно внесите ясность в вопрос когда "поровну" в гейме. 3-3 допустим какие дальше расклады и до какой максимальной точки брать.
Я не пойму--кто там подаёт--кто подавал или идёт смена подачи при каком-то условии.
Потом как я понял из беглого обзнакомления с правилами--идёт два варианта игры с тайбрейком и нет. Какая схема сейчас применяется?
Там расклады ведь будут разные и расчёт совершенно иначе идёт--надо делать два варианта модели тогда или чего-либо ещё.
Я например не уверен что одна из схем не ставит какого-то игрока в лучшее положение.