ФОРМА ЛОШАДИ ГЛАЗАМИ ПАССАЖИРА
#1
14 June 2015 - 13:12
Теперь в общих чертах суть самой идеи.
Предметом обсуждения будет не форма лошади в комплексе а лишь компонента---в виде циферек последних забегов лошади
типа 99911 или 222-21 итд. Совершенно очевидно что адекватно трансформировать в мозгах наборы которые могут быть весьма разнообразны и число их достаточно велико в какую-то одну внятную цифру которую можно было бы присовокупить к прочим показателям достаточно сложно особенно начинающим.
пока сырой начальный алгоритм состоит в следующем---берём и разделяем номер на компоненты и рассматриваем каждую как некую переменную
Х1 Х2 Х3 .....(при этом последние забеги у нас правее...и формально идём как китайцы...)
так как в коде (будем его так условно называть) могут быть прочерк и косая черта и буквы то надо тогда их заменить на более менее адекватные в смысле разумности такой замены (чисто интуитивно) цифры. Так как представление данных на таймфоре и например расингпост разное то рациональнее выбрать универсальный механизм и остановиться на 5-значном коде, тогда если данные с таймфора то просто первую цифру слева можно убрать).
добавим к 5-тизначному коду одну клетку слева (формально последний самый забег).
тогда если пробел 999-11 то на его место пишем среднее (9+9+9+1+1)/5 если черта то пишем среднее +1 если нет ни чего то среднее пишем в дополнительную клетку.
Теперь с буквами---можно например писать среднее+1 (или ещё больше это надо обсудить можно и +1.5 писать тут это пофигу лишь бы интуитивно адекватно)
теперь у нас получается такая фигня ---если не парится особо а допустим закодировать OUT Y вхождение в призовые 1 а не вхождение 0
то можно построить (попробовать сначала построить) множественную регрессию вида Y=c1*X1+c2*X2+.....+c6X6
тогда мы получим возможно некие цифры которые можно использовать дальше.
Предполагаем что будем разделять лошадей на три группы например так по классам 1-2 3-4 5-6 и в каждой группе строить свою зависимость.
#2
14 June 2015 - 13:30
Ну а получить число и использовать его в совокупности с другими данными (жокеи, скорость и т.д.) можно попробовать
#3
14 June 2015 - 13:39
Потом Вы не забывайте что у других лошадей ведь тоже цифры будут по этой бадяге так вот пример
три лошади и три цифры 0.4 0.4 0.4 тут понятно что шансы у всех одинаковые а если так 0.1 0.8 0.8 тут мы видим что у нас одна лошадь достаточно удалена от других ну и почему её например не леить или вот так 0.3 0.3 0.8 тогда ставим плейс на 0.8 тут важно как цифра смотрится в контексте остальных а не так что вот в воздухе подвесили и решаем.
#4
14 June 2015 - 13:48
#5
14 June 2015 - 13:51
Вечерком напишу программу, которая будет выводить список забегов с racingpost и считать Фуйню..
Пусть народ при желании затестит
#6
14 June 2015 - 14:08
Вечерком напишу программу, которая будет выводить список забегов с racingpost и считать Фуйню..
Пусть народ при желании затестит
Я думал может сначала обсудить как лучше заменять там прочерк , черту и буквы а потом уж думать об остальном....надо погодить пока. Да мне по идее надо только данные и всё а потом там попробую этот код как-то обработать прям в екселе и загоню в другую прогу---она сама там всё построит чё надо, а тут просто рез приведу по самой функции регрессии.
и вот её уже можно запрограммировать будет.
#7
14 June 2015 - 14:18
Я думал может сначала обсудить как лучше заменять там прочерк , черту и буквы а потом уж думать об остальном....надо погодить пока. Да мне по идее надо только данные и всё а потом там попробую этот код как-то обработать прям в екселе и загоню в другую прогу---она сама там всё построит чё надо, а тут просто рез приведу по самой функции регрессии.
и вот её уже можно запрограммировать будет.
Буквы есть разные... И имеют разное значение
DNF – Did Not Finish – не пришла к финишу
BD – Brought Down – лошадь сбита другими лошадьми
F – Fell – падение лошади
U - лошадь сбросила жокея
PU – Pulled Up – остановка лошади во время гонки
HR – Hit Rails – удар лошади во время гонки о заграждение
R – Refused – лошадь остановилась перед препятствием
SU – Slipped Up – лошадь подскользнулась
RTR – Refused To Race – отказ лошади выбежать из стартовой кабины
DSQ – Disqualified – дисквалификация лошади
UR – Unseated Rider –падение жокея с лошади
N/R – Non-runner – лошадь, первоначально заявленная в гонке, но не бежавшая
RO - run out, когда лошадь пропускает препятствие, то ли по своей "хотелке", то ли по ошибке жокея
VOI - отмененный забег по тем или иным причинам после старта.
#8
14 June 2015 - 14:29
99/9F9---тогда надо определить чёткое правило для обработчика что первое обрабатывать---можно допустим жёстко идти справа налево и заменить сначала Fно тогда вот тут непонятно как обработать 99F-9 или типа того.
#10
14 June 2015 - 14:47
99F-91 тогда получится берём пока все цифры которые есть и находим для "-" это среднее (9+9+9+1)/4 когда это появилось в позиции "-" то уже считаем для F
(9+9+7+9+1)/5+1 +1-штраф. (тут уже можно додумывать по размеру...главное принципиально разбор запрограммить).
По буквам думаю можно не парится а разделить на 2-группы штрафуем-нет и где штрафуем один штраф к среднему.
#11
14 June 2015 - 15:03
Patternform....How to analyse a race in 5 minutes...with some interesting results!
#12
14 June 2015 - 15:18
По сравнению с лошадками есчть несколько плюсов
Количество участников постоянно, забеги в закрытых помещениях - фактор погоды, покрытия отпадает
Ну и циферки тоже есть
#13
14 June 2015 - 15:36
По сравнению с лошадками есчть несколько плюсов
Количество участников постоянно, забеги в закрытых помещениях - фактор погоды, покрытия отпадает
Ну и циферки тоже есть
#14
14 June 2015 - 16:01
#16
14 June 2015 - 16:19
поэтому тут так детально не получается делать. Что касается разных отрывов от победителя то это лучше в скорость отнести а не в комбинацию цифр (так как по ней получается достаточно грубая оценка---один хрен там и дистанции разные будут и прочее)...тут главное просто породить цифру которая бы имела приемлемую (не маленькую) корреляцию с тем что лошадь займет призовое место(или не займёт). Так как на скачках много влияющих факторов то там как не корячься их в одной какой-то простой формуле не учтёшь......
Надо найти теперь энтузиастов могущих прописать разбор и перевод кода в нужный вид........ остальное там не проблема. Остаётся непонятка если в коде мало цифер
типа 234. И там думаю надо брать без препятствий пока забеги и выкинуть букву(вы) которая к ним относится.
#17
14 June 2015 - 16:33
#18
14 June 2015 - 16:48
#19
14 June 2015 - 16:58
#20
14 June 2015 - 17:19
У нас в коде допустим стоит 6 у одной лошади и у второй в той же позиции допустим 10 если первая 6 получена в забеге где 6 лошадей то это одно а если в забеге где было 12 это совсем не тоже самое и вот эта 10 если тупо в забеге 30 тоже не адекватная цифера. Сдаётся мне тут без приписывания и мощи забега не обойтись для более менее адекватной оценки чисел в позициях кода. Нужно значит сообща подумать--как более менее адекватно нормализовывать данные. Есть вариант самый тупой поделить на мощь (число лошадок)...но насколько это адекватно будет????
Давайте поэкспериментируем по ходу писанины---вот допустим 6место в 10мощи и 12 в мощи 20 если поделим получим как бы одно число 0.6 можно попробовать делить на корень из числа лошадей (или взять какую-то степень 0,75 или 0,45 ХЗ......)
Можно наверно на корне остановиться тогда вот допустим для первых мест такой подход выглядит более менее логичным если 1 в позиции то если лошадь победила среди 30 претендентов то её 1 весомее 1 той лошади которая поимела 7 лошадей.