Перепрыгнеть в содержание


- - - - -

Massey rating .Метод малых квадратов


37 ответов в эту тему

#21 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 30 March 2015 - 14:18

Конечная задача игрока--не определение рейтингов или ещё там чего-то, а выработка алгоритма принятия решения о ставке и сумме...всё остальное вторично.
3-4 тура (лучше 4 чтоб сбалансировать Д/Г) можно использовать например вот для чего---Вы определяете средние параметры за 4 тура...а потом сдвигаетесь на тур вперёд и снова определяете по 4 последним (почитайте про "гусеницу" в теории временных рядов). При этом надо понимать что связи между параметрами для команд лиги скорее всего нелинейны
и туманны...поэтому тут может быть рациональным подавать параметры "гусеницы" (например какое-то число "точек-четвёрок") на нейросеть.

#22 OFFLINE   yall

    Пунтер


  • Участник
  • ПипПип
  • 39 сообщения
1

Добавлено 05 April 2015 - 13:45

Bambuk добрый день
Добрался до изучения Вашего файла
Вроде более менее ясна ситуация по формулам в ячейках , но у меня главный вопрос , к чему применялся Поиск решений и с какими параметрами ?

Спасибо

И хотел спросить , как этот метод применить к теннису например , игроков много , не 20 команд в два круга , посоветуйте пожалуйста ?

Вроде как задача минимизации решается исходя из суммы квадратов , в примере эта сумма равна 148,8 , в окошке Поиска решений что необходимо указать , чтобы в итоге получились рейтинги Rh и Ra ?

#23 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 05 April 2015 - 13:46

Сообщенияyall, on 05 April 2015 - 13:37, сказал:

Bambuk добрый день
Добрался до изучения Вашего файла
Вроде более менее ясна ситуация по формулам в ячейках , но у меня главный вопрос , к чему применялся Поиск решений и с какими параметрами ?

Спасибо

И хотел спросить , как этот метод применить к теннису например , игроков много , не 20 команд в два круга , посоветуйте пожалуйста ?
Ищем Rh Ra
поэтому поиску указываем этот диапазон (там можно какие-то начальные данные вводить например 0 или 0,1 во все ячейки--это будет начальная точка итераций)
а целевой функцией является сумма квадратов разности прогнозного и реального CELL=
вводим в поиск адрес ячейки где ссумма.

Можно допустим добавить условие--взять како-то один рейтинг и просуммировать его данные в какой-то выделенной произвольно ячейке (на любом свободном месте) а потом в "поиске" в условиях указат на эту ячейку и написать=0 тогда там рейтинги другие будут (а можно и ни чё не указывать...сами значения рейтингов значения не имеют--важно что потом мы по ним прогнозируем).

#24 OFFLINE   yall

    Пунтер


  • Участник
  • ПипПип
  • 39 сообщения
1

Добавлено 06 April 2015 - 06:35

Приветствую Bambuk
Извиняюсь , но немного не понял
В окошке Поиска решений первым идёт установить адрес целевой ячейки , целевой ячейкой является сумма квадратов разности прогнозного и реального , вопрос - как получается прогнозное ? Если следовать по ячейкам в примере то прогнозное упирается в Rh и Ra , которые я пытаюсь найти Поиском решения , вообщем я запутался
Далее идут радиокнопки , выбираю по минимальному значению
Далее идёт поле с названием изменяя ячейки , сюда я так понимаю нужно ввести диапазон всех 40 нулевых ячеек 20 Ra и 20 Rh
В параметрах ничего не меняю
Жму выполнить , ничего не меняется , оно и понятно что из 40 нулей и одного числа 148,8 рейтинги не посчитаются
Главным для меня остаётся вопрос как посчитать прогнозное и из чего оно высчитывается ? Где я что упустил ?

Спасибо

#25 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 06 April 2015 - 08:28

Сообщенияyall, on 06 April 2015 - 06:35, сказал:

Приветствую Bambuk
Извиняюсь , но немного не понял
В окошке Поиска решений первым идёт установить адрес целевой ячейки , целевой ячейкой является сумма квадратов разности прогнозного и реального , вопрос - как получается прогнозное ? Если следовать по ячейкам в примере то прогнозное упирается в Rh и Ra , которые я пытаюсь найти Поиском решения , вообщем я запутался

Если Вы делаете в типа шахматки, то в клетку строка-столбец заносите (Y-Y*)^2 (или вот так если счёт Y:Z приближаете (Y-Y*)^2+(Z-Z*) ) со звёздочкой(*) для матрица квадратов разн, а вот Y* это прогнозирующая функция даёт (это как бы модель--для неё свою матрицу сделайте) формулы (по смыслу адресации) вот в таком виде можно только в одну ячейку ввести =$AD27-AG$24 (это допустим Y*) но тогда Вы поместите строки рейтингов над матрице, а один рейтинг перенесите слева например от матрицы, но свяжите со строкой над матрицей вот так ={ТРАНСП(AG23:AZ23)} (AG23:AZ23--это строка одного из рейт. над матрицей, а вводите вы формулу как для формул массивов, выделяя 20 клеток сразу в столбце. Так Вам просто надо будет в одну ячейку данные ввести а потом маркером заполнителем протянуть по всей матрице....а не 400 клеток тыкать....
Там будет матрица где Вы вычисляете квадраты и в начале будет матрица самих прогнозов Y* и матрица реальных значений Y (если для каждого значения счёта то там ещё две матрицы будут Z и Z*)
потом вот эту матрицу (Y-Y*)^2 в какой-то клетке свободной на листе надо просуммировать по всем ячейкам---это и есть CELL, которую указываете "поиску" (оптимизировать целевую ячейку).

Далее идут радиокнопки , выбираю по минимальному значению
Далее идёт поле с названием изменяя ячейки , сюда я так понимаю нужно ввести диапазон всех 40 нулевых ячеек 20 Ra и 20 Rh
Просто выделяете диапазон над шахматкой--две строки с рейтингами и данные занесутся в "Поиск решения"
В параметрах ничего не меняю
Жму выполнить , ничего не меняется , оно и понятно что из 40 нулей и одного числа 148,8 рейтинги не посчитаются
Главным для меня остаётся вопрос как посчитать прогнозное и из чего оно высчитывается ? Где я что упустил ?
Прогнозное----Вы сами функцию придумывайте (например если ВНП то кодируете и для Y* берёте например разность рейтингов рейтинг для домашнего сост. и рейтинг ком. для гостевого)
Если Вы хотите всё ж "связать судьбу" с понятиями атака--оборона то самая простая модель будет например такая Y*=Rnap_h(i)*Rzach_a(j) Z*=Rnap_a(j)*Rzach_h(i) (nap--нападение(атака) zach-защита(оборона)). Можно второй вариант попробовать(более простой) с домашним эффектом, тогда не будет индексов h-дом a-выезд. но будет d(i)-добавка к рейтингу нападения домашней ком., d(j)-добавка к рейтингу нападения гостевой ком (она скорее будет отрицательная для большинства ком.)
Y*=(Rnap(i)+d_h(i))*Rzach(j) Z*=(Rnap(j)+d_a(j))*Rzach(i) модель с эффектом для пары i--j (дальнейшее упрощение может состоять в выкидывании d(j) так как модель по сути сводиться к предыдущей ибо команда имеет две поправки--для домашнего и гостевого состояния...там единственное что с двумя добавками (если сравнивать с моделью где команда имеет 4 характеристики-рейтинга) можно потребовать добавку(ки) d_h, d_a ( в каких-то интервалах меньше чем интервалы для рейтингов, тогда там возможно погрешность можно понизить)

Спасибо


#26 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 06 April 2015 - 08:42

Забыл ещё дописать (а то может Вы не в курсе) иногда вычисляют абстрактную игру команды сама--с собой (где одно домашнее состояние а другое гостевое), хотя в реалове такой игры создать нельзя, но смоделировать её вполне можно и судить например о том какова разница игры на выезде и в гостях по этой характеристике.

#27 OFFLINE   yall

    Пунтер


  • Участник
  • ПипПип
  • 39 сообщения
1

Добавлено 06 April 2015 - 10:40

Ну так подробно и обо всём не стоило писать , я во всём разобрался вроде , кроме прогнозного значения
(например если ВНП то кодируете и для Y* берёте например разность рейтингов рейтинг для домашнего сост. и рейтинг ком. для гостевого)

Что значит кодируйте ?

В принципе я посмотрел в Вашем примере там где была таблица с @ сравнение между реальным и прогнозным - как минимум везде 1х или х2 везде сходится , нужно более детально изучить и поэкспериментировать

#28 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 06 April 2015 - 11:36

Сообщенияyall, on 06 April 2015 - 10:40, сказал:


Что значит кодируйте ?



Мы же не можем написать В Н П а надо как-то модели пояснить что от неё хотят (она ж тупая) поэтому можно задать какие-то уровни для резов например можно В присвоить уровень 3 , ничье 2 а проигрышу 1 а можно 1...0....-1 а можно 0,5=В 0,3=Н 0,2=П (иногда кодируют так 10 01 00 11 если допустим надо четыре сигнала закодировать). Вам надо потом как-то интерпретировать ответ прогнозирующей функции ...это например можно сделать задав разграничительные уровни в виде интервалов. На ретро данных (или лучше на данных которые прогнозируем--то есть Вы данные берёте как будто играете, взяли предыдущие дан.--> спрогнозировали, занесли проuноз+рез куда-то потом это обрабатываем см. далее) ---Вы можете создать полосы-интервалы по значению ответа модели и посмотреть сколько там зашло реально, тогда можно оценку сделать по вероятности--число + исходов мы знаем для нашего интервала (полосы) и знаем общее число пар в интервале p=win/N и тогда можно создать некоторое соответствие р=Р(Y*) тогда решение принимать будет проще.

#29 OFFLINE   yall

    Пунтер


  • Участник
  • ПипПип
  • 39 сообщения
1

Добавлено 06 April 2015 - 14:10

То есть Y* разность рейтинга домашнего и гостевого , получается что рейтинги сами высчитываются как то по другому , я совсем не понимаю..
Есть допустим матч , разница в матче -2 например , тогда получается (-2-(Rh-Ra)^2 если следовать формуле (Y-Y*)^2 , вопрос тогда как считаются Rh и Ra ?

Тут по моему не только модель тупая..

#30 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 April 2015 - 02:02

Сообщенияyall, on 06 April 2015 - 14:10, сказал:

То есть Y* разность рейтинга домашнего и гостевого , получается что рейтинги сами высчитываются как то по другому , я совсем не понимаю..
Есть допустим матч , разница в матче -2 например , тогда получается (-2-(Rh-Ra)^2 если следовать формуле (Y-Y*)^2 , вопрос тогда как считаются Rh и Ra ?

Тут по моему не только модель тупая..
А что Вас смущает? Вы всё правильно написали (-2-(Rh-Ra)^2. А как считаются Rh и Ra надо спросить у Левенберга — Марквардта ....так как в екселе этим алгоритмом "поиск" считает все рейтинги.
про алгоритм можете тут почитать (но это не шибко интересно) https://ru.wikipedia...%B4%D1%82%D0%B0

#31 OFFLINE   yall

    Пунтер


  • Участник
  • ПипПип
  • 39 сообщения
1

Добавлено 07 April 2015 - 14:47

Господи..Разобрался.. Я смотрел гораздо дальше..Решение оказалось под носом..Не мог понять как работает Поиск решений ))
Извиняюсь Bambuk за дотошность , спасибо огромное!!!
Тему продолжаю

#32 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 07 April 2015 - 15:46

Сообщенияyall, on 07 April 2015 - 14:47, сказал:

Господи..Разобрался.. Я смотрел гораздо дальше..Решение оказалось под носом..Не мог понять как работает Поиск решений ))
Извиняюсь Bambuk за дотошность , спасибо огромное!!!
Тему продолжаю
нет проблем...сам такой--если что-то непонятно .....

Решил ещё дописать тут в теме вот что----иногда возникает потребность запихнуть исходные данные в какой-то другой интервал (например в 0----1 ) особенно часто это в нейросетях используют.

тогда можно вот этой формулой воспользоваться (переход из интервала [A;B] (исходного) в интервал [C;D] где xi--точки интервала [A;B] а yi --точки нового интервала)

yi=C+(xi-A)*(D-C)/(B-A) (например для [0;1] C=0 & D=1)

Ещё примите к сведению, что для некоторых похожих на рейтинг задач можно вводить какие-то дополнительные условия в виде равенств или неравенств---например просуммировать данные по строке или столбцу (для каждой ком получим несколько цифр) а потом приравнять эти прогнозные к каким-то цифрам реалова но точно там может поиску сложно будет поэтому иногда вместо равенств можно задать интервалы для сумм ну и так далее там много разных вариантов может возникать.

Отредактировано Bambuk, 07 April 2015 - 15:53.


#33 OFFLINE   yall

    Пунтер


  • Участник
  • ПипПип
  • 39 сообщения
1

Добавлено 08 April 2015 - 20:19

Приветствую Bambuk
Немного не по теме задам вопросы
Как определить важность влияния какого либо параметра из нескольких допустим на тотал матча ? т.е. степень влияния допустим значения средних забитых домашней команды за последние Н игр или среднее количество ударов в створ , ну и подобного рода параметры

И возможно ли разбить лигу из 20 команд на группы по силе если можно так выразиться , типа топ команды середняки дно полудно ,понимаю что в каждой лиге группы могут состоять как из 2 - 3 команд так и из 5-6 , например в РПЛ или в Испании к топ командам в группу можно отнести только 2 или 3 команды не больше которые не чувствуют сопротивлений почти с другими командами , вообщем имеются ли методы по каким то критериям разбивать лигу на группы не так чтоб в ручную , типа первые 4 места это топ , потом следующие 4 это полутоп , а так чтобы какая то функция сама раскидывала команды по группам ? Я думаю Вы меня поняли)

#34 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 09 April 2015 - 01:44

Сообщенияyall, on 08 April 2015 - 20:19, сказал:

Приветствую Bambuk
Немного не по теме задам вопросы
1.Как определить важность влияния какого либо параметра из нескольких допустим на тотал матча ? т.е. степень влияния допустим значения средних забитых домашней команды за последние Н игр или среднее количество ударов в створ , ну и подобного рода параметры

2.И возможно ли разбить лигу из 20 команд на группы по силе если можно так выразиться , типа топ команды середняки дно полудно ,понимаю что в каждой лиге группы могут состоять как из 2 - 3 команд так и из 5-6 , например в РПЛ или в Испании к топ командам в группу можно отнести только 2 или 3 команды не больше которые не чувствуют сопротивлений почти с другими командами , вообщем имеются ли методы по каким то критериям разбивать лигу на группы не так чтоб в ручную , типа первые 4 места это топ , потом следующие 4 это полутоп , а так чтобы какая то функция сама раскидывала команды по группам ? Я думаю Вы меня поняли)

По 1. пункту. Лучше все параметры для начала загнать в одинаковый диапазон (например в 0--1)...можно взять что в голову взбрендит. Потом можно разными путями делать осмысление---например можно очень просто посмотреть корреляцию наших параметров с тоталом (но лучше делать два варианте 1. само значение тотала. 2. взять тотал какой Вам надо например Вы хотите 2.5 тогда надо
опять закодировать это 0-не пробит 1--тотал 2.5 пробит.) ..... в екселе есть функция
Данные по ТОТ// Данные2(типа влияющие)
3 9
2 7
4 12
5 15
6 17
Формула// Описание// (результат)
=КОРРЕЛ(A2:A6;B2:B6) Коэффициент корреляции между двумя наборами приведенных выше данных (0,997054)

Все параметры которые Вы хотите посмотреть можно найти коррел. Чем значение больше по модулю тем предположительно сильнее связь (и сильнее влияние) (если значение отрицательное то это значит увеличение параметра ведёт к снижению тотала (при положит. увеличение ведёт к увеличению). Но наличие корреляции ещё в реалове не означает что связь есть--её надо как-то логически объяснить что ли (а то так можно и с Луной найти корреляцию чего-нить).

Со 2. п. тут посложнее--смотря по каким параметрам мы хотим деление делать. Во вторых команда ж в начале сезона не имеет достаточно характеристик по тек. сезону (тут только вариант с подгрузкой данных предыдущего сез. к текущему). Можно просто допустим в начале заменять сыгранные матчи в старых данных (в какой-то может даже их части ). Можно по очкам допустим делать деление--взять и делить О/число сыгранных матчей. Только тут опять у нас всё относительно получается---допустим команда "топ" дома...и совсем не "топ" в гостях...поэтому тут такое деление тоже может присутствовать.

На самом деле у каждой лиги как бы свой "топ-не топ" это просто зависит как команды расположены в пространстве признаков---допустим если очки брать то как по очкам (их просто на ось Х перенести и там видно будет), а можно например по Заб/число игр Проп/число игр смотреть ...тогда надо команды перенести на плоскость в систему координат ХУ и там тоже будет видно как они кучкуются(можно делать для Домашних игр и для Г например),
можно по ВНП (тоже поделить на число игр)---тогда команды можно тоже будет на плоскость загнать--так как ВНП данные(поделенные на N= В+Н+П) --все лежат в одной плоскости.
Тогда по идее надо для разделения куч задать как-то границы...но тут опять ХЗ как их универсально задать---в разных лигах они там кучкуются по своему.....
Вы для начала посмотрите по очкам O/N а потом по разности (Заб-Проп)/N ......

Отредактировано Bambuk, 09 April 2015 - 01:46.


#35 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 12 April 2015 - 14:23

yall, вот пример команды в пространстве признаков по ВНП (общие дом и гость).

Attached File(s)

  • Прикрепленный файл  angltab.jpg   537.6K   3 Количество загрузок


#36 OFFLINE   Kitaioza

    Новичок


  • Участник
  • Пип
  • 2 сообщения
0

Добавлено 23 April 2015 - 03:20

Добрый день, господа. Я либо невнимательно читаю, либо что-то упускаю. Взять хотя бы пример приведеный в файле Massey’s method.

Gettysburg - Johns Hopkins = 35 - 49 = -14
Gettysburg - Franklin and Marshall = 38 - 31 = 7
Gettysburg - Dickinson = 13- 23 = 10
Gettysburg - McDaniel = 35 - 3 = 32
If we add these individual point differences, we get the total point differential for Gettysburg
for this series of games, and it is 15.

Как так? -14+7+10+32 = 35, а не 15. Дальше читать не стал, боясь запутаться.

Bambuk, что касается вашего примера в экселе, то там тоже не совсем понял. Взять хотя бы пример Рома. Результаты игры дома: 2:0, 3:0, 2:0, 1:1, 5:0, 1:0. А Rh Рома равен = 1.989. Как так? Можете просто описать алгоритм. Какими действиями мы пришли к 1.989.
Простите за мою тупизну и беспокойство :)

#37 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 23 April 2015 - 12:03

СообщенияKitaioza, on 23 April 2015 - 03:20, сказал:

Добрый день, господа. Я либо невнимательно читаю, либо что-то упускаю. Взять хотя бы пример приведеный в файле Massey’s method.

Gettysburg - Johns Hopkins = 35 - 49 = -14
Gettysburg - Franklin and Marshall = 38 - 31 = 7
Gettysburg - Dickinson = 13- 23 = 10
Gettysburg - McDaniel = 35 - 3 = 32
If we add these individual point differences, we get the total point differential for Gettysburg
for this series of games, and it is 15.

Как так? -14+7+10+32 = 35, а не 15. Дальше читать не стал, боясь запутаться.

Bambuk, что касается вашего примера в экселе, то там тоже не совсем понял. Взять хотя бы пример Рома. Результаты игры дома: 2:0, 3:0, 2:0, 1:1, 5:0, 1:0. А Rh Рома равен = 1.989. Как так? Можете просто описать алгоритм. Какими действиями мы пришли к 1.989.
Простите за мою тупизну и беспокойство :)

Во всех книжках есть--опечатки, описки и так далее....Имейте это в виду. Дальше там в таблицах всё правильно написано. Да и в целом надо улавливать суть идеи и потом самому попытаться что-то смастерить(хотя б теоретически на бумаге) попутно читая материал.
Рейтин это число которое относится к модели и через которое потом модель рассчитывает что-то поэтому внутрение параметры модели часто не поддаются интерпритации чтоб их можно было с чем-то ассоциировать(с какими-то показателями команды)..а по поводу расчёта--там же считает "поиск решения" и ХЗ чё там он насчитает, главное чтоб потом расчёт был адекватный по модели.

Отредактировано Bambuk, 23 April 2015 - 12:07.


#38 OFFLINE   Kitaioza

    Новичок


  • Участник
  • Пип
  • 2 сообщения
0

Добавлено 02 January 2016 - 13:42

С новым годом )

Что-то я отошел от этой темы, хотя в свое время она меня заинтересовала. Вчера взялся опять. Вот пример премьер лиги Англии. как видно из файла проходимость ставок 1Х | Х2 ~82%. Беда в том, что кэфы на 1хх2 всегда низкие. И у меня вопрос: Можно как нибудь таки срубить бабла на этой системе?

rghost.net/6LvpvCcK8

Отредактировано Kitaioza, 02 January 2016 - 13:44.