Перепрыгнеть в содержание


- - - - -

Data Mining для прогнозирования результатов в теннисе.


67 ответов в эту тему

#41 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 23 June 2013 - 16:48

Pwin-PWgeim
0,5-0,5
0,52-0,5448
0,56-0,642
0,58-0,687
0,6-0,729
0,65-0,823
0,7-0,896
получилось вот так. Но тут смысл не в том чтоб это вычислить, а в том что после двух подач например Вы можете оценить и вероятность выигрыша при таком-то счёте--
я как понял это в первую очередь интересно.

Отредактировано Bambuk, 23 June 2013 - 16:51.


#42 OFFLINE   chepicov

    Специалист


  • Участник II
  • ПипПипПип
  • 354 сообщения
23

Добавлено 23 June 2013 - 17:25

Да это все уже придумали - Credo, например, выкладывал небольшое приложение для подсчета вероятности по ходу гейма.
Интересно другое. Вот игрок сыграл за сезон 100 матчей. Имел при этом разную доматчевую вероятность победы. Есть результат этих игр. Есть статистика игрока в этих играх (Serve win% и прочее). Нужно все это связать и на выходе получить оценку, более точную чем даст Пинка или БФ непосредственно перед началом.

Возможность превращения этой более точной оценки в деньги - тема отдельная, специально пока не трогаю

#43 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 23 June 2013 - 18:00

Сообщенияchepicov, on 23 June 2013 - 17:25, сказал:

Да это все уже придумали - Credo, например, выкладывал небольшое приложение для подсчета вероятности по ходу гейма.
Интересно другое. Вот игрок сыграл за сезон 100 матчей. Имел при этом разную доматчевую вероятность победы. Есть результат этих игр. Есть статистика игрока в этих играх (Serve win% и прочее). Нужно все это связать и на выходе получить оценку, более точную чем даст Пинка или БФ непосредственно перед началом.

Возможность превращения этой более точной оценки в деньги - тема отдельная, специально пока не трогаю
Так Вам не статистика игрока нужна а статистика, двух игроков. У нас пара А_Б, а не один плавец в басейне. Делать можно так примерно--взять сеть (но надо подумать что туда подавать),
и обучать её да и всё. В качестве сигнала выхода надо взять два параметра Pwin1 Pwin2 для двух игроков. Тогда набор данных будет ---входной вектор (игрок1к куче+куча к игроку1 +игрок2 к куче+ куча к игроку2) а выход это то что нас интересует но определённый после состоявшегося матча (а вход--то что имели до матча). Такой аппроксиматор можно даже тупо в екселе построить...только там ограничение на число подбираемых параметров 200 но он даже 150 плохо тянет поэтому надо на не боолее 100 ориентироваться (это веса и уровни активации).
По поводу оценок я уже 100 раз писал--не будет это работать, надо всё равно множества создавать и балансы смотреть и возможно есть смысл в каких-то весомых дополнительных критериях.

По оценкам у меня вот такая хрень получилась (только надо будет ещё почитать про цепи марковские, а то я с ними не работал мог накосячить.... но тут собственно главное понять принцип кто сам там может захочет помытариться)
https://8zx62a.sn2.l...1%81.jpg?psid=1

Отредактировано Bambuk, 23 June 2013 - 18:06.


#44 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 23 June 2013 - 18:22

Я ещё забыл спросить--вот по ходу матча статистика какая-то ведь наверно имеется и вообще резонно подумать сразу--как можно грамотно подкорректировать ситуацию.
Если такой подход возможен то играть можно равных каки-то или типа этого после 2 сетов....это ж можно всё протестить и посмотреть без бабок.

#45 OFFLINE   chepicov

    Специалист


  • Участник II
  • ПипПипПип
  • 354 сообщения
23

Добавлено 23 June 2013 - 22:00

Проблема еще в том, что за сезон играется ничтожно мало игр. Даже если корреляции и можно найти, то не на такой выборке.

По ходу матча статистика ведется. Но в лайве все не так однозначно. Голая теория не работает. Я уже писал об этом в соответствующей теме. По теории нет разницы с каким счетом проигран сет, а по факту разница есть.

#46 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 23 June 2013 - 22:14

Да я тут сидел между делом размышлял и тоже думаю данных там мало получится. Во первых как трубит нет (сам не могу судить просто читаю что народ вещает) играют роль например покрытие, оно и травмы может создать и неудобства итд... --значит надо делить (а на некоторых видах как я посмотрел там вообще не густо игр), но это даже не главное...дело в том что игрок это всё же индивид а не команда футбольная (хотя там иногда и один чел может много намутить но это скорее исключение...футбол всё ж как не крути коллективное творение)
тогда теоретически лучше под каждого игрока лепить вычислитель (сеть), но тогда вообще засада будет с данными. На сколько продуктивно будет их всёж на группы раскидывать --неизвестно..но тут всё равно надо попробовать... главное определить вот что подавать (это должно значимым быть для результата но в тоже время слишком много переменных и причём некчёмных будут только зашумлять картину и мешать).

#47 OFFLINE   chepicov

    Специалист


  • Участник II
  • ПипПипПип
  • 354 сообщения
23

Добавлено 23 June 2013 - 22:23

Все верно, покрытие нельзя игнорировать и мешать все в кучу. Для травы и i.hard данных будет неприлично мало.

#48 OFFLINE   SpartakRW

    Новичок


  • Участник
  • Пип
  • 15 сообщения
0

Добавлено 24 June 2013 - 12:06

Сообщенияchepicov, on 23 June 2013 - 22:23, сказал:

Все верно, покрытие нельзя игнорировать и мешать все в кучу. Для травы и i.hard данных будет неприлично мало.
индур-хард можно связать с обычным хардом, ибо там отличие разве что в погодных условиях

#49 OFFLINE   chepicov

    Специалист


  • Участник II
  • ПипПипПип
  • 354 сообщения
23

Добавлено 24 June 2013 - 12:25

Для кого-то не принципиально, а у кого-то результаты сильно разнятся. Даже хард делится на подвиды с соответствующим влиянием на результаты. Это уже если совсем серьезно учитывать поверхность

#50 OFFLINE   Sector

    Holemaster


  • mp
  • 2994 сообщения
680

Добавлено 24 June 2013 - 20:36

Какой там кстати по Надалю прогноз был? :D
Эх скока народу посливалось то!

#51 OFFLINE   JimmyDarmody

    Новичок


  • Участник
  • Пип
  • 3 сообщения
-1

Добавлено 24 June 2013 - 21:19

СообщенияSector, on 24 June 2013 - 20:36, сказал:

Какой там кстати по Надалю прогноз был? :D
Эх скока народу посливалось то!

Буки в толстом слое шоколада :D

По Сканбету

Пинка на выходе
S. Darcis (+2.5 Sets) R. Nadal (-2.5 Sets) 3,76 1,318 23.06.13 18:00

перед ин-плей
S. Darcis (+2.5 Sets) R. Nadal (-2.5 Sets) 4,14 1,277 24.06.13 17:30

СообщенияJimmyDarmody, on 24 June 2013 - 21:11, сказал:

Буки в толстом слое шоколада :D

По Сканбету

Пинка на выходе
S. Darcis (+2.5 Sets) R. Nadal (-2.5 Sets) 3,76 1,318 23.06.13 18:00

перед ин-плей
S. Darcis (+2.5 Sets) R. Nadal (-2.5 Sets) 4,14 1,277 24.06.13 17:30


Фон
Надаль Р Дарсиз С 1.01 11.00 -8.5 1.80 +8.5 1.90 28.5 1.80 1.90
24.06.13 11:59

Марафон
Надаль, Рафаэль - Дарси, Стив 1.01 41.00 -8.5 1.88 +8.5 2.08 28.5 2.04 1.90
24.06.13 01:52

Отредактировано JimmyDarmody, 24 June 2013 - 21:21.


#52 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 25 June 2013 - 15:42

СообщенияCredo, on 21 June 2013 - 18:42, сказал:

Спасибо за ссылку на Учебник. Читаю, изучаю, что не понятно спрошу.

Credo, вот ещё забыл дать ссылку : Анализ данных http://sernam.ru/book_zg.php
Вообще тут можно найти информацию по многим вопросам математики и других областей, всё достаточно системно изложено и в случае непонимания сразу можно посмотреть какие-то другие разделы библиотеки sernam.ru/ .
Чтоб не испытывать неудобств в переходах на некоторые внутренние области книг (некоторые так сделаны что войти внутрь сразу не получится--блюдут авторское право)
можно просто менять номер в ссылке которую Вы увидите www.sernam.ru/book_vap.php?id=0&filter=images&num=46 вот меняем 46 на 50 итд так можно сразу перейти где вы читали или дальше там искать инфу.

Отредактировано Bambuk, 25 June 2013 - 15:56.


#53 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 26 June 2013 - 16:31

Может кто-то из знатоков разъяснит тупому бамбуку вот что---Читаю правила и вот такая фигня, есть два варианта доигрывать сет при 5-5 с тай-брейком и без.
Я лично понял так--если без тайбрейка то играем до превосходства в 2 гейма (похоже на гейм при 3-3) если с тайбрейком то при счёте 6-6 играется один гейм до 7 но должен быть перевес 2 очка
при этом там не ясно кто подаёт (если 6-6то подачи выровнены по геймам и допустим начинался сет с подачи игрока А пары А_Б тогда последним подпвал Б получается допустим начал
гейм А потом по 2 подачи меняемся.............) тут основной вопрос с подачами в следующем сете...вот допустим счёт 7-6 в гейме это подача была последняя А теперь допустим выиграл
А кто подаёт в следующем сете первый? а если допустим наоборот 6-7 и выиграл Б............чёта запутался в этом теннисе.

Отредактировано Bambuk, 26 June 2013 - 16:31.


#54 OFFLINE   chepicov

    Специалист


  • Участник II
  • ПипПипПип
  • 354 сообщения
23

Добавлено 26 June 2013 - 17:01

СообщенияBambuk, on 26 June 2013 - 16:31, сказал:

А кто подаёт в следующем сете первый? а если допустим наоборот 6-7 и выиграл Б............чёта запутался в этом теннисе.

При тайбрейке первым всегда подает тот, кто подавал первым в сете, иначе нельзя выйти на 6-6 в сете. В следующем сете всегда первым подает тот, кто НЕ подавал первым в предыдущем сете

Отредактировано chepicov, 26 June 2013 - 17:03.


#55 OFFLINE   slamdunk

    Специалист


  • Участник II
  • ПипПипПип
  • 160 сообщения
15

Добавлено 27 June 2013 - 02:43

СообщенияBambuk, on 26 June 2013 - 16:31, сказал:


А кто подаёт в следующем сете первый? а если допустим наоборот 6-7 и выиграл Б............чёта запутался в этом теннисе.

Все просто на самом деле. После начальной жеребьевки и выбора кто первым подает, а кто принимает далее порядок никак не меняется. Player A подает в 1м гейме, далее все нечетные геймы подает тоже он, все четные player B, включая тай-брейк, хотя в этом гейме формально подают оба игрока поочередно по схеме 1-2-2-2 итд, но первую подачу выполняет игрок А.

#56 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 27 June 2013 - 03:58

Спасибо, за разъяснение.
Тогда вот вернулся к предыдущим постам и читаю:
"А выиграл у игрока B на тай-брейке 7-5 - будет запись A-B 7-6 (5). В квадратных скобках результат укороченного тай-брейка или 3-го сета у пар. Пары особенно не жалуют в туре, и на обычных турнирах ( не шлемах) часто играют третий сет как подобие тай-брейка. До 10 набранных очков, если дошли до 9-9 то на больше-меньше, те перевес в 2 очка должен быть, чтоб нивелировать фактор подачи.."
Непонятно выделенное.
Если выиграли 7-5 то игра без тайбрейка получается (по правилам) а просто играем до перевеса в 2 очка в сете.
Что за укороченный тай-брейк? Это тогда просто тай-брейк где играется гейм до 7 (а Кредо пишет до 10). Это если например они при 2-2 по сетам играют 5 по правилам ,
а тут типа при 1-1 заменяют это на игру "тайбрейк сет" до 10 что ли?
Но я читаю правила федерации тениса РФ утверждённые Тарпищевым, может там на другом уровне правила другие?
Поясните в чём тут нестыковка.

Отредактировано Bambuk, 27 June 2013 - 04:04.


#57 OFFLINE   slamdunk

    Специалист


  • Участник II
  • ПипПипПип
  • 160 сообщения
15

Добавлено 27 June 2013 - 06:50

СообщенияBambuk, on 27 June 2013 - 03:58, сказал:

Спасибо, за разъяснение.
Тогда вот вернулся к предыдущим постам и читаю:
"А выиграл у игрока B на тай-брейке 7-5 - будет запись A-B 7-6 (5). В квадратных скобках результат укороченного тай-брейка или 3-го сета у пар. Пары особенно не жалуют в туре, и на обычных турнирах ( не шлемах) часто играют третий сет как подобие тай-брейка. До 10 набранных очков, если дошли до 9-9 то на больше-меньше, те перевес в 2 очка должен быть, чтоб нивелировать фактор подачи.."
Непонятно выделенное.
Если выиграли 7-5 то игра без тайбрейка получается (по правилам) а просто играем до перевеса в 2 очка в сете.
Что за укороченный тай-брейк? Это тогда просто тай-брейк где играется гейм до 7 (а Кредо пишет до 10). Это если например они при 2-2 по сетам играют 5 по правилам ,
а тут типа при 1-1 заменяют это на игру "тайбрейк сет" до 10 что ли?
Но я читаю правила федерации тениса РФ утверждённые Тарпищевым, может там на другом уровне правила другие?
Поясните в чём тут нестыковка.
Смотрите, сет выигрывает игрок выигравший 6 геймов при перевесе в 2 гейма и более. При счете 6-5 в пользу игрока A возможны 2 ситуации. Игрок А выигрывает 12 гейм и следовательно сет со счетом 7-5 и тайбрейка нет. Либо игрок А проигрывает 12 гейм счет в сете становится 6-6 и играется тайбрейк. В тайбрейке побеждает игрок первый набравший 7 очков, но с перевесом в 2 и более очка. те теоретически тайбрейк вполне может закончиться 20-18 и иногда так бывает. Запись тогда будет А-B 7-6 (18). В парах часто для экономии времени на второстепенных турнирах третий сет проводят в формате тайбрейка до 10 очков. Те выигрывает пара первая набравшая 10 очков с перевесом в два и более очков. С этими тайбрейками вообще есть нюансы но сам по себе тайбрейк очень нужен., на Уимблдоне к примеру не играется тайбрейк в решающем сете ( 3 у женщин или 5 у мужчин). Иснер-Маю в 2010 году завершили матч за 3 дня и счет в 5 сете был 70-68.

#58 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 27 June 2013 - 09:43

В теннисе приходится учитывать все 6 основных видов покрытия, результаты последних игр игроков, результаты игр игроков между собой, группировку игроков по рейтингам, группировку игроков по "подавалам", "универсалам", "бегункам", заработки игроков, изменение заработка и рейтинга в случае победы или поражения в игре ( и реакцию на это игроков), болезни игроков, смену тренера и крайнюю нестабильность многих игроков, особенно женщин, в статистических характеристиках даже в пределах одной игры. Кроме того, собирать статистические характеристики, особенно если вы не используете какие-то сервисы, очень трудоемко. Когда вы попытаетесь учесть все эти различия, то окажется, что в очень большом числе случаев вам просто не хватает информации для статистически достоверных выводов. Поэтому "малой кровью" и весьма простыми , "усредненными" расчетами и формулами здесь не обойтись.

#59 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 27 June 2013 - 10:23

Учитывай не учитывай... Федерер и Шарапова кому-то подпортили статистику выигрышей на фаворитах.

#60 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 27 June 2013 - 12:44

Может быть кому-нить пригодиться ресурс. Старожилы тенниса наверно знают все источники получения данных поэтому это наверно актуально для новичков,
тут есть и кефы на матчи-- что может быть полезным для быстрых оценок ситуации. tennis.matchstat.com/index.php?ControllerName=Compare&Name_Player1=Jaroslav+Pospisil&Id_Player1=1823&Name_Player2=Jiri+Vesely&Id_Player2=18017