Перепрыгнеть в содержание


* * * * * 1 голосов

Объединение усилий по сбору и организации БД по футболу


222 ответов в эту тему

#41 OFFLINE   Пешеход

    Пунтер


  • Участник II
  • ПипПип
  • 73 сообщения
7

Добавлено 08 May 2015 - 14:34

Сообщенияandre48, on 07 May 2015 - 19:38, сказал:

Забыл написать совсем простенький пример для выборки. Оценка соотношения сил команд букмекерами определена коэф. П1 равным 1,75 +-5%. Первая команда выигрывает дома 50% игр, в том числе 40% игр с разницей больше чем в мяч и 20% игр с разницей в мяч. Вторая команда проигрывает в гостях 50% игр, в том числе 40% с разницей больше чем в мяч, 20% с разницей в мяч. Интересует фактический payout (вы его называете ROI) при данных ограничениях при ставке на домашнюю команду с форой -1 и гостей с форой +1.

Попробую тоже прогнать такой примерчик у себя :)

Смутило только вот что "выигрывает дома 50% игр, в том числе 40% игр с разницей больше чем в мяч и 20% игр с разницей в мяч" этож получается 60% а должно быть те же 50%? Или я не правильно понял ?

andre48, не могли бы вы уточнить?

спасибо!

Отредактировано Пешеход, 08 May 2015 - 14:34.


#42 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 08 May 2015 - 14:49

Я написал в том числе, что значит если команда выиграла 5 игр из 10 (50%), то в том числе с преимуществом в 2 мяча выиграла 2 игры (40% но уже от 5), а в один мяч выиграла одну игру. Этот простейший пример никакого практического применения не имеет, а только показывает, что для формирования критериев нужно очень часто проводить предварительные расчеты и записывать результаты в базу данных.

#43 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 08 May 2015 - 17:28

Начну с наиболее общих вещей, а поэтому и наиболее легких для комментария )

СообщенияBambuk, on 08 May 2015 - 08:45, сказал:

Тут ещё одна проблема в обработке данных... много завязано на финансирование...покупку игроков ну и всё остальное связанное с подготовкой--мат.тех. база. подготовка молодёжи, тренерский состав, медицина и тд.....оч много факторов стимулирующих--ну деньги основа...) поэтому порой трудно уйти даже далее 3-4 сезонов. При этом нам надо ж проверить и устойчивость критерия во времени и сами фазовые траектории для выстраивания алгоритма нашего "финансирования" процесса--какими суммами идти..это ж тоже очень влияет на размер прибыли-убытков...ну много тут мороки особенно если ведётся более 5-6 лиг то очень напряжно.....

В будущем есть влияние добавить помимо игровых характеристик, еще характеристики состояния команды: ситуация с тренером, финансы, сила состава и т.д. В общем, формализовать те критерии, которые вы перечислили (не все, конечно, т.к. по многим будет трудно найти информацию), и записать их рядом с другими характеристиками. Понимаю, что это будет сложно сделать, но т.к. эти не игровые показатели влияют на результат, то делать это имеет смысл. В теме ТФМ я заводил речь об исследовательских организациях, которые занимаются футбольной аналитикой и прогнозированием. Так вот, в обязанности одной из вакансий входит отслеживание всей внутренней кухни закрепленного за человеком турнира с обязательным просмотром всех матчей. Но, т.к. у них штат больше сотни человек, а многие watcher‘ы работают дистанционно, у себя на местах, то и охват лиг соответсвенно, может получится большой.

СообщенияBambuk, on 08 May 2015 - 06:23, сказал:

tester, Я попробую на простом примере объяснить что например может потребоваться. Буду на абстрактной базе показывать. Допустим у нас 50 критериев(характеристик...хотя может и 250 быть) для ком заранее затачкованных (часть может быть и нами как-то рассчитываться). Теперь у нас есть пара допустим А_Б и мы хотим что-то там прояснить в отношении двух ставок ну пусть по линии 1Х2 (или по форе допустим) и тотал ТБ2.5 (или любая другая лини ну смысл что две ставки). Во первых--мы не можем указать все 50 характеристик для выборки. Тогда вот конкретно для этой А_Б мы можем указать допустим набор из 3-ёх характеристик (которые мы априорно из предыдущих исследований понимаем что они наиболее влиятельны на рез в линии 1Х2)...но тогда для ТБ у нас будут не факт что те же 3-характеристики, а другие. Теперь далее---взяв выборку по 3-ём мы должны понять ---какие ещё 1 или 2 или 3...итд характеристики из оставшегося набора влияют на рез. и принятие решения---в простейшем случае мы смотрим корреляции, а в общем--корреляции+профиты...и вот для разных А_Б которые например в наборе начальном из 3-ёх характеристик отличаются только допустим диапазоном КП1 допустим так 1.7--1.85 1.9-2.05 могут разные оставшиеся характеристики в наборе 50 влиять больше или меньше на рез...я не говорю уже о сочетании всех 3-ёх параметров. И поэтому процесс в некотором смысле заморачивается---так как априорно вы не знаете что и как влияет и не можете сделать адекватные ограничения на параметры а также создать сам набор (так как он формально должен создаваться гиблой процедурой---выбрали один параметр из 50--смотрите корреляции и профиты в узких полосах критериев, потом выбираете наилучший...но на первом же этапе вы попадаете в блудняк так как мы не можем задать очень узких диапазонов для 50-ти так как в выборке не получим статистически значимый набор для выводов---получается "заколдованный круг").

При этом я акцентирую внимание всех на том что допустим 4-ый параметр(и прочие) который мы ищем для первичного набора может не только в разной степени влиять, но и иметь даже разные знаки корреляции---что приводит к попаданию в "непонятки" игроков (так как они думают что такая характеристика например улучшает рез по профиту а на самом деле ухудшает...при этом надо отдавать себе отчёт что положительная корреляция для самого исхода не является основополагающим критерием для принятия решения ибо положительно влияя на сам исход критерий может отрицательно влиять на профит в множестве аналогичных пар---на этом факте горят многие начинающие бетторы)

Да, здесь действительно эффективный метод обработки придумать сложно. В идеале нужно перебрать все возможные сочетания и выбрать наиболее подходящие из них. Вы уже написали, что выбирать нужно диапазонами, иначе у нас получится так, что позитивный профит имеют только команды, например, с 1-м и 4-мя набранными очками за последние три игры. Это, как по мне, неправильно (хотя, не до конца могу сформулировать почему)) ). Но, с другой стороны, мы всегда можем безболезненно укоротить диапазоны критериев, почти не влияя на ее количество, т.к. на крайние значения критериев случаются очень редко и погоды нам не сделают. В принципе, если не получится ничего толкового придумать в Excel, то можно написать небольшую программу для их обработки, где перебирать все возможные варианты и смотреть на профит конкретной выборки и на устойчивость во времени. При этом определить минимальный и максимальный диапазон для каждого критерия и расширять его понемногу.

#44 OFFLINE   Пешеход

    Пунтер


  • Участник II
  • ПипПип
  • 73 сообщения
7

Добавлено 08 May 2015 - 17:58

Сообщенияandre48, on 08 May 2015 - 14:49, сказал:

Я написал в том числе, что значит если команда выиграла 5 игр из 10 (50%), то в том числе с преимуществом в 2 мяча выиграла 2 игры (40% но уже от 5), а в один мяч выиграла одну игру. Этот простейший пример никакого практического применения не имеет, а только показывает, что для формирования критериев нужно очень часто проводить предварительные расчеты и записывать результаты в базу данных.


Там речь шла про победу в один мяч (по тексту 20%), и про победу в более чем в один мяч (по тексту 40%), получалось бы что в остальных играх (40%) они никак НЕ могли бы победить . Поэтому получается не совсем корректно пример приведен).

Попробовал на одной лиге, чем больше критериев тем уже будет выборка подходящих событий.

#45 OFFLINE   Vladislove

    Специалист


  • Участник II
  • ПипПипПип
  • 165 сообщения
53
  • МестоположениеРоссия

Добавлено 08 May 2015 - 18:52

Сообщенияtester.nt, on 08 May 2015 - 17:28, сказал:

В теме ТФМ я заводил речь об исследовательских организациях, которые занимаются футбольной аналитикой и прогнозированием.
А что это за тема? Можно ссылочку? Интересно почитать)

#46 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 08 May 2015 - 19:03

Действительно, наверно, второпях описался потому, что в тех самых турнирных таблицах, о которых шла речь, и которые у меня считаются примерно за 2 секунды на 41 лигу, структура выигрышей записывается как >2, =2 и =1. Но главной целью был не расчет, а показать, что для расчета многих критериев их сначала нужно сформировать и записать в базу данных. Кстати, и эти турнирные таблицы совсем не похожи на обычные, так как имеют больше двухсот полей, из которых с десяток заполняются вручную (вроде названия команд и лиг, критериев для определения зон вылета и зон фаворитов по лигам,наказаний в виде снятия очков, числа игр в сезоне и т. д.), а остальные рассчитываются по данным базы данных и систематически обновляются после пополнения базы.

#47 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 08 May 2015 - 19:48

СообщенияVladislove, on 08 May 2015 - 18:52, сказал:

А что это за тема? Можно ссылочку? Интересно почитать)
:)
Тема не моя и совсем о другом. Просто там я упомянул о них, приводя их как пример. Ссылка на тему здесь.
А если вам интересны организации, то ищите footballradar и smartodds. А дальше сами поймете что и как.

Но, вообще, как-то странно. Вы на форуме с 13 года и просите ссылочку на ТФМ...

Отредактировано tester.nt, 08 May 2015 - 19:54.


#48 OFFLINE   Vladislove

    Специалист


  • Участник II
  • ПипПипПип
  • 165 сообщения
53
  • МестоположениеРоссия

Добавлено 08 May 2015 - 20:29

Сообщенияtester.nt, on 08 May 2015 - 19:48, сказал:

:)
Тема не моя и совсем о другом. Просто там я упомянул о них, приводя их как пример. Ссылка на тему здесь.
А если вам интересны организации, то ищите footballradar и smartodds. А дальше сами поймете что и как.

Но, вообще, как-то странно. Вы на форуме с 13 года и просите ссылочку на ТФМ...

Спасибо за ссылку и за название организаций ;)

Ну а то что на форуме я с 13 года зарегистрирован, это ничего не значит. Регистрировался я, так как были некоторые вопросы, на которые искал ответы. Ответы нашел и перестал заходить на форум, потом вообще был перерыв в ставках у меня. Вот с недавнего времени снова стал периодически заглядывать сюда, почитать, что интересного люди пишут :) Ну а данная тема, созданная Вами и вовсе меня заинтересовала, поскольку я стал изучать потихоньку эксель, и различного рода решения, которые можно применять для анализа статистики очень интересны для меня в плане развития в этом деле, например про надстройки (PowerPivot и PowerQuery), которые Вы рассказали я впервые узнал, вообще никогда о них не слышал :)

#49 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 08 May 2015 - 21:11

Если есть желание попробуйте посчитать один из реальных простых показателей, который я называю 2OpD5F. Это значит, что для анализируемых команд, например, по играм за 08,05,2015 делается выборка по всей базе с играми в которых команды имеют аналогичные показатели, а именно ВНП за последние 2 игры с учетом поля, разница в набранных очках команд в выборке и анализируемых меньше 5, опорные вероятности на П1 отличаются не более 5% от анализируемых. Затем в выборке определяется payout для равновесных фор и этих фор с покупкой половины мяча (+0,5) по коэффициентам в базе и по коэффициентам заданным на анализируемые команды. Опорная вероятность на П1 в % равна Коэф на Ф2(+0,5)/(Коэф П1+Коэф Ф2(+0,5))*100. Равновесные форы, это форы при которых разница между их коэффициентами минимальна. Возможно, реальный расчет даже по таким простым критериям позволит улучшить структуру базы данных и уточнить механизмы расчетов.

#50 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 08 May 2015 - 21:14

Сообщенияandre48, on 08 May 2015 - 06:21, сказал:

...Посчитать все это, имея базу данных, безусловно можно, но, скорее всего, сначала нужно будет посчитать соответствующие проценты и записать их в базу данных, чтобы знать их значения перед каждой игрой...

Сообщенияandre48, on 08 May 2015 - 14:49, сказал:

...Этот простейший пример никакого практического применения не имеет, а только показывает, что для формирования критериев нужно очень часто проводить предварительные расчеты и записывать результаты в базу данных...

Сообщенияandre48, on 08 May 2015 - 19:03, сказал:

...Но главной целью был не расчет, а показать, что для расчета многих критериев их сначала нужно сформировать и записать в базу данных...

Наконец-то я понял, что вы, andre48, хотели мне сказать :)

Bambuk, в свое время, мне также пытался усердно это донести, когда я спрашивал что-то другое :))) (здесь) Какие-то странные совпадения :)
--------------------

СообщенияBambuk, on 18 March 2015 - 13:46, сказал:

...Вам ни чего глядеть не надо---надо в таблицу добить то, что Вы считаете нужным в качестве критериев--тогда вот этих проблем не будет возникать...
сразу берём и заносим напротив пары то чё считаем целесообразным для анализа

СообщенияBambuk, on 18 March 2015 - 18:41, сказал:

...поэтому я не издеваюсь, а просто исходя из упомянутых трудностей считаю рациональным писать характеристики напротив пары и тогда

СообщенияBambuk, on 19 March 2015 - 13:59, сказал:

Я просто думаю что Вам в последствии могут понадобятся уже готовые и заранее рассчитанные данные для пары команд которые просто занесены в свои столбики исходной таблицы...
Могут возникнуть некоторые трудности по предварительному расчёту если что-то сильно мудрёное рассчитывать.....но основные-то параметры можно же рассчитать и занести
...поэтому без добивания таблицы Вы всё равно не обойдётесь.

Цитата

Bambuk, Вы несомненно говорите дельные вещи. И в последнем, и в предыдущих сообщениях. Но, видимо Вы ту задачу, о которой говорите считаете важной, поэтому уже несколько раз акцентируете внимание не на изначальном вопросе, а например, на том, что надо прописать какие-то характеристики возле пары команд. И с тем, что желательно прописать ряд характеристик возле каждой пары я также согласен и считаю это важным моментом.

:)
-----------------------

Что касается подсчета payout'а, то если посмотреть на мой второй рисунок (там где ROI), то в это окно добавляется три-пять критериев, которые вы назвали, и тогда подсчет и постройка графиков будет вестись только по тем матчам, которые будут соответствовать критериям выборки. И мы сможем смотреть динамику и по временным периодам и по командам. И по другим критериям также.

Вообще, все началось вот с этого вопроса.

Сообщенияandre48, on 07 May 2015 - 09:23, сказал:

Например, как быстро вы формируете текущие турнирные таблицы с общим итогом и разбивкой по играм дома и в гостях с учетом числа игр, ВНП, очков, забито пропущено, место?

По времени они формируются приблизительно также как у вас.

Сообщенияandre48, on 08 May 2015 - 19:03, сказал:

...в тех самых турнирных таблицах, о которых шла речь, и которые у меня считаются примерно за 2 секунды на 41 лигу...

Но я вот что хотел донести. Пользуясь описанной мною рабочей схемой, можно сформировать сформировать свою базу со своими критериями не зная программирования, а только разбираясь в екселевских формулах. А для того, чтобы формировать новые таблицы на основе такой базы данных, нужно всего лишь водить мышкой и вставлять новые поля там, где вы хотите их расположить, в отличии от любой самописной (это не умиляет ее ценности!) программы, где все строго предопрелено (даже наборы фильтов), и для того, чтобы сформировать новое представление данных (новую таблицу, не говоря о графиках вообще) нужно написать немало кода.

Таким инструментом могут пользоваться люди, не знающие программирования и на основе него можно построить неплохой исследовательский инструмент. А в некоторых аспектах, более гибкий и функциональный, чем другие инструменты, включая специально написанные под анализ ставок. Так что, если будут вопросы конкретно по работе с ним, то с радостью отвечу.

Bambuk, andre48 и другие, с удовольствием приму участие в совместной работе над оптимизацией и усовершенствованием того процесса выборки и поиска новых ниш профита, который вы описываете. Готов глубоко погрузится в детали. Есть свои идеи, свои подходы, свои навыки и умения. Вместе веселей :)
(это предложение)

Отредактировано tester.nt, 08 May 2015 - 21:16.


#51 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 08 May 2015 - 21:29

СообщенияVladislove, on 08 May 2015 - 20:29, сказал:

...Ну а данная тема, созданная Вами и вовсе меня заинтересовала, поскольку я стал изучать потихоньку эксель, и различного рода решения, которые можно применять для анализа статистики очень интересны для меня в плане развития в этом деле, например про надстройки (PowerPivot и PowerQuery), которые Вы рассказали я впервые узнал, вообще никогда о них не слышал :)
Я сам о них не слышал за 15 лет пользования экселем. А потом узнал, и представление о возможностях Excel у меня перевернулось. В русскоязычном интернете очень мало есть информации на данную тему. Вот одни из немногих ссылки:
exceltip.ru/category/powerpivot/
baguzin.ru/wp/?p=10389

Ну а в англоязычном интернете, конечно, блог www.powerpivotpro.com, а также ищите Marco Russo и Alberto Ferrari. Они исполняют чудеса c данной технологией. Есть еще парочка экспертов в данной области.

Также известный проект The Great Football Project, о котором можно посмотреть здесь и почитать здесь.

#52 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 08 May 2015 - 22:01

Я не зря делал упор на производительности. Когда-то я довольно много работал и с Excel и с Access, в том числе писал макросы и программы на VBA для них. У меня осталось стойкое впечатление об их медлительности при работе с большими объемами данных. Для себя я не вижу никаких причин переходить с расчетов при использовании баз данных на расчеты с использованием Excel. Хотя я тестировал разные базы данных, но, как ни парадоксально, до сих пор самыми быстрыми и удобными остаются очень старые базы типа Clipper с таблицами dbf и очень простым языком программирования. Программы написанные на Clipper легко переводятся с использованием harbour в программы на языке C, а затем компилируются под современные операционные системы.Современные же базы и языки для них больше ориентированы на многопользовательский интерфейс, развитую графику и работу в интерактивном режиме, поэтому высокая производительность для них вторична. А для высокой производительности, которая для меня критична, нужна монопольная работа в режиме компиляции. Высокая же производительность лучше всего обеспечивается старыми системами, так как в те времена более экономно относились к вычислительным ресурсам, которые были сильно ограничены .

#53 OFFLINE   Vladislove

    Специалист


  • Участник II
  • ПипПипПип
  • 165 сообщения
53
  • МестоположениеРоссия

Добавлено 08 May 2015 - 22:10

Сообщенияtester.nt, on 08 May 2015 - 21:29, сказал:

Я сам о них не слышал за 15 лет пользования экселем. А потом узнал, и представление о возможностях Excel у меня перевернулось. В русскоязычном интернете очень мало есть информации на данную тему. Вот одни из немногих ссылки:
exceltip.ru/category/powerpivot/
baguzin.ru/wp/?p=10389

Ну а в англоязычном интернете, конечно, блог www.powerpivotpro.com, а также ищите Marco Russo и Alberto Ferrari. Они исполняют чудеса c данной технологией. Есть еще парочка экспертов в данной области.

Также известный проект The Great Football Project, о котором можно посмотреть здесь и почитать здесь.
Хорошо, почитаю) Большое спасибо.

#54 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 08 May 2015 - 22:56

Ексель подходит конечно в большей степени для Бамбуков, но с учётом того что их много, то это нормальный в определённом смысле инструмент для первичных исследований и ведения небольшого числа лиг. Во всяком случае на нём можно считать свои выигранные деньги :).
Те механизмы которые использует Андре я думаю для уже более 10 лиг будут включать заметные тормоза, но тут есть ещё один подход как можно игнорировать рассмотрение "прецендентов" для конкретной пары А_Б. Суть состоит в том что можно априорно поискать некоторые критерии (даже руками тупо перебирая и смотря профиты с устойчивостью по сезонам) и тогда если пара попала в заданную область признаков--то играть её...такой метод конечно менее точен из-за того что пара может встать на границу многомерной "оболочки"
и эффективность снизится при появлении достаточного числа подобных пар. Как вариант--группировать лиги по некоторым свойствам (предварительно немного изучив на предмет выбранного типа ставок) . Можно немного упростить себе жизнь используя например функции по работе с базами данных, а так же функцию промежуточные итоги--она например может быстро подсчитать сумму, среднее, дисперсию, максимум, минимум, общее число.....итд чего-то там по столбцу если включен фильтр...другой приём может состоять (чтоб не заморачиваться с функциями БД) в маркировании пар при выполнении некоторого набора условий (которые можно быстро менять) тогда просто пишем 1 или 0 в столбец маркеров. а далее перемножаем тот столбец который надо на маркированный---далее включаем фильтр который игнор. нули.. ну вот как-то так иногда можно делать если надо что-то быстро просмотреть в предварительных экспериментах.... Я думаю что на форуме желательно рассматривать разные подходы и для тех кто понимает в программировании и остальных и возможно кто-то даже и ексель только начинает осваивать. Я сам начал когда-то его изучение купив в магазине книжку за 80 р. О.А. Сдвижкова "Математика в Excel 2003".
При этом долго смотрел на клетки проги как баран на сетку-рабицу........

#55 OFFLINE   tester.nt

    Специалист


  • Участник II
  • ПипПипПип
  • 192 сообщения
61

Добавлено 09 May 2015 - 00:20

СообщенияBambuk, on 08 May 2015 - 22:56, сказал:

Те механизмы которые использует Андре я думаю для уже более 10 лиг будут включать заметные тормоза...
Протестую. У меня в том файле, с которого я картинки показывал, имеется формул на 5 млн.ячеек. И если я увеличу базу в 10, а то и в 100 раз, то обновлять таблицу мне будет не 1-2 секунды, а 10-20. Вы сравниваете быстродействие в обычных рабочих листах с быстродействием в PowerPivot, где совсем другие механизмы обработки и компрессии данных. А это немного не правильно. Я думаю, что если там будет 100 лиг за 10 лет, да еще и с поминутными голами, то никаких проблем с быстродействием не возникнет. Да, если высчитываемых критериев будет не 50, а на порядок больше, то скорее всего, их нужно будет перевести в текстовый вариант, а не высчитывать по формулам. Но, для этого существует другая надстройка, PowerQuery, позволяющая рассчитать некоторые критерии до загрузки в модель данных, избавившись тем самым от нескольких сот тысяч или нескольких миллионов высчитываемых по формуле ячеек.

Я скорее переживаю, что для тех механизмов может не хватить функционала...

СообщенияBambuk, on 08 May 2015 - 22:56, сказал:

Можно немного упростить себе жизнь используя например функции по работе с базами данных, а так же функцию промежуточные итоги--она например может быстро подсчитать сумму, среднее, дисперсию, максимум, минимум, общее число.....итд чего-то там по столбцу если включен фильтр...другой приём может состоять (чтоб не заморачиваться с функциями БД) в маркировании пар при выполнении некоторого набора условий (которые можно быстро менять) тогда просто пишем 1 или 0 в столбец маркеров. а далее перемножаем тот столбец который надо на маркированный---далее включаем фильтр который игнор. нули.. ну вот как-то так иногда можно делать если надо что-то быстро просмотреть в предварительных экспериментах....

Вы, кстати, разобрались с тем как работает сводная таблица? Подход сводных таблиц используют множество BI-программ (Tableau, QilkView, Excel, ...), которые специализируются на обработке данных и их представлении в удобном для пользователя виде. На правду, это очень удобный инструмент. Он позволяет увидеть то, чего нельзя увидеть работая с простой таблицей.

СообщенияBambuk, on 08 May 2015 - 22:56, сказал:

... Я думаю что на форуме желательно рассматривать разные подходы и для тех кто понимает в программировании и остальных и возможно кто-то даже и ексель только начинает осваивать...

Поддерживаю. Думаю записать какой-то скринкаст по работе с PowerPivot и какой-то футбольной базой, если кому то будет это интересно. Еще бы научится видео с ютуба вставлять в сообщения...

Отредактировано tester.nt, 09 May 2015 - 00:24.


#56 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 09 May 2015 - 03:12

Сообщенияtester.nt, on 09 May 2015 - 00:20, сказал:

Я скорее переживаю, что для тех механизмов может не хватить функционала...



Вы, кстати, разобрались с тем как работает сводная таблица? Подход сводных таблиц используют множество BI-программ (Tableau, QilkView, Excel, ...), которые специализируются на обработке данных и их представлении в удобном для пользователя виде. На правду, это очень удобный инструмент. Он позволяет увидеть то, чего нельзя увидеть работая с простой таблицей.


Начал разбираться, но не совсем получается. Тут надо наверно хоть чуть-чуть понимать в базах данных и как там таблицы связываются и взаимодействуют, но с такими вопросами судьба как-то не свела...до сего момента...но в принципе учиться не поздно ни когда. По поводу баз вот опять---тут вот какая фигня получается, с одной стороны надо наращивать выборку допустим обрабатывая много лиг и тем самым и увеличивая по сути возможность ставить много ставок, но с другой стороны возникают две нерешаемые задачи--во первых лиги специфичны как и пары, как и команды и плюс надо иметь стопудовые механизмы отбора тогда иначе при простановке пакетами---допустим ставок по 40 за замес в случае дрейфа в 0 ситуация вообще трудно выправима даже хоть суммы повышать как при догонах допустим (но это просто как пример). То есть я хочу подчеркнуть что чем больше ставим за замес тем ответственнее надо выбирать (а чел ясен пень много пар руками не в состоянии адекватно обработать ....хоть землю рой хоть навоз...). И получается тогда ситуация что если допустим не конкретно лигу "колупать" или 3-4 лиги в одной куче подобрав как-то их в разные кучи а "колупать" скопом не тем механизмом о котором Андре говорит а вот альтернативным что я написал то получится что по каким-то там критериям очень много пар имеют некий +++ но такие ситуации они даже если и есть то мы ж не одни такие умные и поэтому и БК и другие игроки их будут "ликвидировать", а некие маленькие множества которые вроде профитные их по идее стрёмно играть (приходится рисковать)--так как там
если исследовать на предмет доверительного интервала для оценок то на левой границе может быть минус больше чем ожидание и поэтому взвешивая данную ситуацию на весах мозговых извилин--мы понимаем что хотим 12% а попасть можем на 40% в минус и тогда возникает законный вопрос---нахрена козе баян? А тот механизм с прецедентами по конкретной паре его руками провести проблемно так как Вам же надо много ставок обработать, а значит нужна автоматизация процесса, а ХЗ как её грамотно обеспечить когда 99% программ заточены на рез, а цель--деньги.... Поэтому тут очень много противоречий возникает связанных с объёмами данных по которым принимается решение даже если вычисленный % с оборота соблазняет это ещё не повод ставить причём там же на разных кефах нужны разные объёмы для адекватных умозаключений и разные вот эти % для формально равных рисках (смысл в том что не редко лучше играть меньший процент чем больший) это ж всё тоже надо рассчитывать. И другой нюанс что например линия 1Х2 имеет некое распределение объёмов кефоф около 2 там больше а 1.2 и 10 меньше...итд итп (я подозреваю что это косвенно повлияло и на выбор Андре в отношении фор---там можно более представительные выборки замутить чем например играя полосу 1.45--1.65 в лин 1Х2 ну или типа того).

Ну и чтоб не быть голословным в отношении мысли что на малых объёмах (да и на средних) всё шатко могу привести пример с критерием---вот допустим П1 в полосе 1.45---1.65
и кефф на ТМ меньше или равен 1.68 посмотрите что попадёт в выборку(и какие профиты) в топовых лигах в предыдущих сезонах (2-3 сез), а потом посмотрите текущий по профитам на П1 на Х и на П2 (при этом обратите внимание--какая лига представлена большим числом пар попавших в критерий).

Отредактировано Bambuk, 09 May 2015 - 03:18.


#57 OFFLINE   Vladislove

    Специалист


  • Участник II
  • ПипПипПип
  • 165 сообщения
53
  • МестоположениеРоссия

Добавлено 09 May 2015 - 07:38

Сообщенияtester.nt, on 09 May 2015 - 00:20, сказал:

Думаю записать какой-то скринкаст по работе с PowerPivot и какой-то футбольной базой, если кому то будет это интересно. Еще бы научится видео с ютуба вставлять в сообщения...
Было бы очень интересно....полностью поддерживаю данную инициативу)

#58 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 09 May 2015 - 07:38

Я уже писал, что в лигах практически нет существенной специфики. Показатели лиги это всего лишь совокупность показателей команд. Специфика лиги заключается, в основном, в уровне вмешательства судей в игру и, возможно, влияние на коэффициенты игры некоторых крупных игроков и типстеров считающих себя специалистами по какой-то лиге, а также аналитиков БК, курирующих это направление. У меня есть показатели и с учетом лиг, но они практически оказывают очень маленькое влияние на итог, так как это ограничение резко уменьшает объем выборки не внося ничего существенного в конечный результат. Судейство вообще вещь темная, и попытки предсказания действий судьи не привели к положительным результатам, так как судья не имеет целей в виде мест и очков, как команды, да и число его судейств значительно меньше, чем число игр команд. Приходится смириться с непредсказуемостью судейства, хотя среди моих проигрышей судейское вмешательство в игру, в виде пенальти или удалений задолго до конца матча, занимает 60-70%. Что касается игроков и аналитиков, то все их действия отражаются в коэффициентах и в вероятностях исхода, которые для меня и являются рейтингами команд и которые обязательно учитываются во всех критериях в виде заданных допустимых отклонений от расчетной букмекерской вероятности на П1.

#59 OFFLINE   Bambuk

    Специалист


  • mp
  • 6322 сообщения
602

Добавлено 09 May 2015 - 14:51

Сообщенияandre48, on 09 May 2015 - 07:38, сказал:

Я уже писал, что в лигах практически нет существенной специфики.
Тогда вот такие данные для лайва -55% +41% +25% итд в зависимости от лиги (Ссылка Здесь) достаточно трудно объяснимы даже с позиции только случайности данного результата так как мне кажется процент с оборота всё равно достаточно высокий получается...хотя конечно тут выборки не очень большие, но тогда надо наверно уточнить о каких объёмах данных при обработке конкретной пары мы говорим.
Меня интересует Ваше мнение по поводу степеней доверия тем или иным объёмам в выборке при среднем кефе допустим около 2. и скорее всего результаты для пары не совсем то же самое что результаты для какой-то априорно заданной области в пространстве признаков--потому как даже в посте выше что я привёл критерий будет собирать в основном только команды французского чемпионата, а как тогда можно сказать что лиги не имеют специфики? Скорее всего дела обстоят так что по каким-то вещам их можно скопом смотреть, а по каким-то нет.

#60 OFFLINE   andre48

    Специалист


  • mp
  • 1622 сообщения
286
  • МестоположениеМосква

Добавлено 09 May 2015 - 15:55

Непонятно что это за данные. В разных лигах разные по своим характеристикам команды, поэтому возможны и разные результаты по разным лигам для одних и тех же критериев отбора. При этом, чем меньшее количество игр попадает в выборку, тем возможна большая дифференциация в результатах. Уровень доверия зависит не только от размера выборки и уровня дифференциации результатов, но и, в значительной мере, от структуры этого результата. Например, при выборке по одному критерию для анализируемой пары может быть преимущество домашней команда +15% при 300 играх в выборке, а по другому критерию преимущество гостей в +25% при 10 играх в выборке. Если считать усредненный средневзвешенный результат, что обычно и делается, то получится вариант, при котором имеется преимущество домашней команды примерно в +14% за 310 игр. При этом, очень часто, эти критерии не встречаются одновременно или встречаются крайне редко. В результате играть домашнюю команду при такой структуре итогового результата было бы опрометчиво, хотя формально играть можно. В реальности, как правило, в итоговом результате всегда есть большое число критериев выборки и их сочетаний, которые дают разнонаправленную эффективность игры. И структура это только один из факторов дополнительно влияющий на степень доверия. Есть и другие факторы, например, стабильность критериев во времени или стабильность внутри диапазона коэффициентов в выборке для анализируемой пары. Во многом по этим причинам, анализ по критериям без учета и центрирования параметров конкретной пары, который Вы здесь предлагали, дает очень большие ошибки в определении payout и может привести к хроническим проигрышам при формально хороших результатах анализа.