•         

- - - - -

Теннис и вероятность исхода в 85.27%. Ищу людей, для накопления на старость.


#1   pin

    Специалист


  • Участник II
  • 156
13
  • Местоположениеhell

28 May 2016 - 00:25

Парни и девчата, привет.
Я тут обучил машину делать прогнозы в 85.27% на исход события в теннисе.
Собственно вопрос, как по максимом выжить из этого? Делать stoplosы, но сколько тиков или быть может какая стратегия есть?
Готов к разумному диалогу, для того, чтобы заработать совместно денег.
Умею кодить на python и как следствие могу автоматизировать процесс. Но, что Вы можете?

Так же вопрос к другим людям, которые своим модели построили, какой % прогноза у вас? Какие модели и технологии использовали?
У меня есть сервер в 260Г оперативы, два проца Intel® Xeon® CPU E5-2630 v3 @ 2.40GHz и как следствие 32 ядра , всё это под unix системе на ssd дисках. Систему оптимизирована для работы с ssd. Готов поучаствовать в процессе накопления на пенсию, но опять же, что Вы можете предложить?

Кстати, можно попробовать и на других видах спорта попробовать свои силы. Но нужны статистические ресурсы и Ваш аналитический опыт.
Для тех кто строит свои модели, как следствие, да, я использую метод обучения с учителем.

#2   serg11231

    Специалист


  • mp
  • 1179
283

28 May 2016 - 06:36

Какие кэфы с таким процентом заходят? Прогнозы на что? Победа в матче, движение, или что-то еще?

#3   pin

    Специалист


  • Участник II
  • 156
13
  • Местоположениеhell

28 May 2016 - 09:13

Какие кэфы с таким процентом заходят? Прогнозы на что? Победа в матче, движение, или что-то еще?
Перед началом. Итог, кто победит, а кто нет. Но заметил, что лучше ставить во время игры, так как кэф не всегда самый большой в начале.

#4   Bambuk

    Специалист


  • mp
  • 6322
602

28 May 2016 - 09:47

Парни и девчата, привет.
Я тут обучил машину делать прогнозы в 85.27% на исход события в теннисе.
Собственно вопрос, как по максимом выжить из этого? Делать stoplosы, но сколько тиков или быть может какая стратегия есть?
Готов к разумному диалогу, для того, чтобы заработать совместно денег.
Умею кодить на python и как следствие могу автоматизировать процесс. Но, что Вы можете?

Так же вопрос к другим людям, которые своим модели построили, какой % прогноза у вас? Какие модели и технологии использовали?
У меня есть сервер в 260Г оперативы, два проца Intel® Xeon® CPU E5-2630 v3 @ 2.40GHz и как следствие 32 ядра , всё это под unix системе на ssd дисках. Систему оптимизирована для работы с ssd. Готов поучаствовать в процессе накопления на пенсию, но опять же, что Вы можете предложить?

Кстати, можно попробовать и на других видах спорта попробовать свои силы. Но нужны статистические ресурсы и Ваш аналитический опыт.
Для тех кто строит свои модели, как следствие, да, я использую метод обучения с учителем.

Вы бы не % захода указали а % с оборота и каков объём...а так --это разговор ни о чём...можно тупо ставить на кефф 1.02 и получить процент выше вашего без всяких НС. Теперь далее--какой сигнал использован в качестве обучающего. Допустим можно так--вин="1" -ставим луз="0" далее всё как обычно--строим сети разной архитектуры
и с разными вариантами сигналов смотрим чё имеем....Однако такой способ обучения имеет недостаток...представьте на минуту что Вы построили сеть с SOFTMAX функцией на выходе. и У БК точно такая же хрень имея тупо типа "вероятности" БК выкатит вам кефф на 5-6% меньше чем нужно...то есть важна процедура принятия решения (иначе вы просто проиграете не смотря на то что имеете сигнал нужного вам уровня) Без софтмакс вы в любом случае получаете какой-то ответ--вот какой ответ вы именно получаете (это например может быть число какое-то или строго "1" "0"-не ставим)...

Имея ответы сети надо проверить ---что там по реальной статистике получается и какой кефф--в целом нужно на баланс в выборке ориентироваться и по нему вырабатывать процедуру принятия решения... Можно ж вообще сделать 2-3...итд сети с разными входными сигналами их обучать а потом брать исход если мнения сетей совпадают...да тут в целом много всяких заморочек и тонкостей. Так как в каком-то смысле можно сказать что НС работает как экстраполятор...то надо как-то изловчится обучать сеть не переобучая её (без лишней детализации процесса ибо может быть глобальная тнденция на которую наложен случайный процесс)...
Это похоже чем-то на сумму двух синусойд--одна допустим имеет более низкую частоту и выше амплитуду а другая ВЧ и имеет амплитуду поменьше.
Если сеть переучена то на новых данных которые в обучении не участвовали результаты будут заметно хуже особенно если новый сезон специфический турнир или типа того (тест конечно можно провести выделив часть данных из общей кучи 10-15% например но они будут немного отличаться допустим от нового сезона если допустим обучать для футбола и брать 2-3 или скока там ХЗ ... сезонов уже прошедших для подбора весовых коэффициентов).....
Так вот отсель вопрос---ваш % указан для чего? Если это % самой сети то это не то что надо (надо процент на новом тесте--фактически надо три множества для более внятных выводов о работе НС).

#5   serg11231

    Специалист


  • mp
  • 1179
283

28 May 2016 - 10:29

Перед началом. Итог, кто победит, а кто нет. Но заметил, что лучше ставить во время игры, так как кэф не всегда самый большой в начале.
вы намеренно вопрос о кэфах проигнорировали? без них о чем говорить-то?

#6   pin

    Специалист


  • Участник II
  • 156
13
  • Местоположениеhell

28 May 2016 - 12:28

Вы бы не % захода указали а % с оборота и каков объём...а так --это разговор ни о чём...можно тупо ставить на кефф 1.02 и получить процент выше вашего без всяких НС. Теперь далее--какой сигнал использован в качестве обучающего. Допустим можно так--вин="1" -ставим луз="0" далее всё как обычно--строим сети разной архитектуры
и с разными вариантами сигналов смотрим чё имеем....Однако такой способ обучения имеет недостаток...представьте на минуту что Вы построили сеть с SOFTMAX функцией на выходе. и У БК точно такая же хрень имея тупо типа "вероятности" БК выкатит вам кефф на 5-6% меньше чем нужно...то есть важна процедура принятия решения (иначе вы просто проиграете не смотря на то что имеете сигнал нужного вам уровня) Без софтмакс вы в любом случае получаете какой-то ответ--вот какой ответ вы именно получаете (это например может быть число какое-то или строго "1" "0"-не ставим)...

Имея ответы сети надо проверить ---что там по реальной статистике получается и какой кефф--в целом нужно на баланс в выборке ориентироваться и по нему вырабатывать процедуру принятия решения... Можно ж вообще сделать 2-3...итд сети с разными входными сигналами их обучать а потом брать исход если мнения сетей совпадают...да тут в целом много всяких заморочек и тонкостей. Так как в каком-то смысле можно сказать что НС работает как экстраполятор...то надо как-то изловчится обучать сеть не переобучая её (без лишней детализации процесса ибо может быть глобальная тнденция на которую наложен случайный процесс)...
Это похоже чем-то на сумму двух синусойд--одна допустим имеет более низкую частоту и выше амплитуду а другая ВЧ и имеет амплитуду поменьше.
Если сеть переучена то на новых данных которые в обучении не участвовали результаты будут заметно хуже особенно если новый сезон специфический турнир или типа того (тест конечно можно провести выделив часть данных из общей кучи 10-15% например но они будут немного отличаться допустим от нового сезона если допустим обучать для футбола и брать 2-3 или скока там ХЗ ... сезонов уже прошедших для подбора весовых коэффициентов).....
Так вот отсель вопрос---ваш % указан для чего? Если это % самой сети то это не то что надо (надо процент на новом тесте--фактически надо три множества для более внятных выводов о работе НС).

Я только обучил её. % получил следующим образом из всего количества игр 80% ушло на обучение, а 20% на проверку. Именно эти 20% и показали 85%. Так правильно проверять или есть какой ещё интересный способ?

вы намеренно вопрос о кэфах проигнорировали? без них о чем говорить-то?

Я же Вам сказал, что у меня нет таких данных, так как прогноз делается до начала игры и я только обучил данный алгоритм. Кстати, как именно кэфы могут помочь в оценке?

#7   serg11231

    Специалист


  • mp
  • 1179
283

28 May 2016 - 13:10

Я же Вам сказал, что у меня нет таких данных, так как прогноз делается до начала игры и я только обучил данный алгоритм. Кстати, как именно кэфы могут помочь в оценке?
Эээ, как могут помочь кэфы? Да грош цена вашим данным без кэфов. Если вы 1.1 прогнозируете на 85% то это просто минус безо всяких дальнейших разговоров. Если же у вас 1.8 так заходят, то при любой финстратегии будет плюс, и никакие помощники вам не нужны.

#8   pin

    Специалист


  • Участник II
  • 156
13
  • Местоположениеhell

28 May 2016 - 13:26

Эээ, как могут помочь кэфы? Да грош цена вашим данным без кэфов. Если вы 1.1 прогнозируете на 85% то это просто минус безо всяких дальнейших разговоров. Если же у вас 1.8 так заходят, то при любой финстратегии будет плюс, и никакие помощники вам не нужны.
Учту.
Вот он сейчас прогнозирует Pablo Cuevas | Tomas Berdych, что победит Pablo. На него сейчас кэф 2.3
Ernests Gulbis | Jo-Wilfried Tsonga - Ernests проиграет на Tsonga кэф 1.5
David Goffin | Nicolas Almagro - David win кэф 1.5

Посмотрим, как сыграют :)

#9   maladroit

    Специалист


  • Участник II
  • 261
25
  • МестоположениеRussia

28 May 2016 - 18:14

Tsonga в отказку пошел

#10   pin

    Специалист


  • Участник II
  • 156
13
  • Местоположениеhell

28 May 2016 - 19:30

Tsonga в отказку пошел
Эх... а ведь вёл в игре. Посмотрим, как остальные сыграют.

#11   pin

    Специалист


  • Участник II
  • 156
13
  • Местоположениеhell

28 May 2016 - 20:08

David Goffin проиграл и Tsonga выиграл. (0.8314, 0.64)
Pablo Cuevas - первый сэт взял, но дальше всё слил. (0.5125, 0.505)
Tsonga вёл в счёте, но потом пошёл в отказ. (0.7977, 0.61)
Вот таков итог, можно с таким работать?

В скобках проценты вероятности исхода.

#12   hobby

    Специалист


  • mp
  • 2001
485

29 May 2016 - 06:13

Это не итог. Для понимания нужно ставок 50, лучше больше. И матч Тсонги не в счет, по правилам ставка возвращается, если отказ в первом сете. Что не помешало бы, так это связать вероятность и кэф и смотреть, где он, валуй. Не вообще валуй, а именно в вашем алгоритме. Тут статистки нужна конкретного алгоритма.

#13   pin

    Специалист


  • Участник II
  • 156
13
  • Местоположениеhell

29 May 2016 - 06:16

Это не итог. Для понимания нужно ставок 50, лучше больше. И матч Тсонги не в счет, по правилам ставка возвращается, если отказ в первом сете. Что не помешало бы, так это связать вероятность и кэф и смотреть, где он, валуй. Не вообще валуй, а именно в вашем алгоритме. Тут статистки нужна конкретного алгоритма.

Спасибо за направление движения :) Пойду тестировать и допиливать.

#14   Nicolas

    Специалист


  • Участник II
  • 141
23

30 May 2016 - 10:42

Спасибо за направление движения :) Пойду тестировать и допиливать.
Какой стаж в ставках ? Если умеешь кодить на питоне то возможно сработаемся .. оставь свои контакты

#15   Bambuk

    Специалист


  • mp
  • 6322
602

30 May 2016 - 12:34

Я только обучил её. % получил следующим образом из всего количества игр 80% ушло на обучение, а 20% на проверку. Именно эти 20% и показали 85%. Так правильно проверять или есть какой ещё интересный способ?



Я же Вам сказал, что у меня нет таких данных, так как прогноз делается до начала игры и я только обучил данный алгоритм. Кстати, как именно кэфы могут помочь в оценке?
Способ примерно такой (вы вникнете в саму суть --почему именно так надо)....
Предположим взяли мы какие-то турниры (ну или сезоны если допустим футбол) по годам -пусть три года последних. пусть на 2-ух годах поучили по вашей методе
85% примерно взяли на обучение 15% тест . Но вот эти 15% они как бы от одной колбасы как кусок отрезали (качество похожее ведь будет у колбысы...ну и тут типа такого, не смотря на то что можно случайно брать из разных мест(клевать типа жирок) а не "отрезать шматок" 15%)) потом вы взяли новое множество и начали его пробивать...вот часто получается что процент заметно падает (ну представьте что колбасу в подвале каком-то на потной ляшке замесили и вот типа нате вам...по виду -то вроде докторская...но не докторская..эт. точно...ну и тут типа того).....надо немного пройти по данным
на новом множестве ...свежем в общем и там посмотреть . И вот можно поэкспериментировать--вы обучите сеть чего-то там предсказывать на двух-трёх годах а потом имейте какой-то год в запасе и посмотрите--будет ли плюс по балансу..... % по частоте события он по идее вам зачем? Его на хлеб же не намажешь (всегда надо смотреть баланс по банку и % с оборота...просадки...устойчивость показателей игры по годам итд итп.....).

Основная беда с этими сетями что разные люди их обучать по-разному.....и ко всему прочему там можно получать разные веса стартуя с разных начальных-опорных планов (часто там случайно выбирают с чего стартовать)...и потом там гимор в том--что можно попасть в какой-то локальный экстремум..или вообще переучить сеть (тогда на новой колбасе там % очень сильно может упасть).....

#16   Bambuk

    Специалист


  • mp
  • 6322
602

30 May 2016 - 16:24

Если не совсем понятно написал...то вот тут на стр.25 посмотрите https://www.hse.ru/d...D0%BB%D1%8F.pdf

#17   pin

    Специалист


  • Участник II
  • 156
13
  • Местоположениеhell

30 May 2016 - 18:15

Спасибо за советы и критику.
Я сейчас меняю тактику. Хочу обучить за другие периоды временных лет и проверить её на 2016 году. Колбаса будет же другой?

#18   Nicolas

    Специалист


  • Участник II
  • 141
23

31 May 2016 - 06:16

Если не совсем понятно написал...то вот тут на стр.25 посмотрите https://www.hse.ru/d...D0%BB%D1%8F.pdf
Бамбук у вас есть готовая Нейросеть ?

#19   Bambuk

    Специалист


  • mp
  • 6322
602

31 May 2016 - 07:36

Бамбук у вас есть готовая Нейросеть ?
Зачем? У меня программа есть...она строит за 5 минут сеть (но там абсолютно чёрный ящик..я даже весов не вижу и предобработку исходных входных сигналов)...
А сам я писать не умею на языках каких-то программирования. Простенькие сети можно для экспериментов делать даже в екселе а веса подбирать поиском решения.
Обычно предварительно надо повозится с исходными данными и как-то их раздербанить на подмножества---это если делать жёсткую какую-то конструкцию по архитектуре и входным сигналам....дело в том что на сеть-то можно что угодно подавать---хоть шум стадиона в децибелах хоть число зрителей итд...но надо-то избавится от сигналов которые создают шум и мало влияют на тенденции, которые сеть по сути и ищет (через построение функциональной зависимости выход=Ф(вход))...дело в том что если разделить общие данные на подмножества помельче то в каждом из них может оказаться актуальным свой набор и причём этот набор может зависеть(и зависит) от вида ставок под который сеть делается(допустим на линию 1Х2 или ТМ-ТБ2.5 можно создать разные входные сигналы и строить свои сети...хотя можно по идее и одинаковые наборы)....

Можно вообще отойти от традиционных подходов которые озвучены в нете а идти своими путями (немного не стандартными)---для примера просто приведу парочку.
Обычно вин-кодируют "1" а луз "0" (то есть состоялся исход или нет)...но алгоритм тогда просто строит сеть похоже на то как БК даёт оценку (то есть где кефф ниже там более вероятно что исход состоится и ответ сети по сигналу будет выше--это если она ддаёт ответы в интервале 0--1 но для тоталов я б лучше взял гиперболический тангенс или типа такой функции там интервал от -1...1)---исходя из сей преамбулы сеть не нужна..по кефам и так видно "ответ"....

Я брал вот такой вариант для экспериментов-----в пространстве признаков для пары команд(которая имеет набор параметров-признаков) выбирается оболочка(шар)
с ценнтром--признаки пары и обучается сеть на множестве попавшем внутрь шара.

Можно попробовать вот так(но я так не делал а всё собираюсь тока но руки не доходят)--в базе данных для каждой пары выделив оболочку(радиус шара надо экспериментально подобрать и он по идее может плавать в зависимости от каких-то параметров или параметра). потом для этой кучи попавшей в оболочку расчитывается вот такая хрень Выручено/поставлено-1 это число заносим в БД. Тогда сеть будет строить не ответ по принципу ВИН-ЛОЗ а по принципу % с оборота на шаре....(ибо число нами заносимое в БД умноженное на 100% и есть % с оборота по смыслу это типа КР-1 у валуйщиков но не на одну пару а на некоторую кучку похожих на исходную пар).....но тут конечно тока на пальцах просто а пое...аться придётся...хоть с подбором входных сигналов хоть с объёмом шара....

#20   Nicolas

    Специалист


  • Участник II
  • 141
23

31 May 2016 - 09:51

Зачем? У меня программа есть...она строит за 5 минут сеть (но там абсолютно чёрный ящик..я даже весов не вижу и предобработку исходных входных сигналов)...
А сам я писать не умею на языках каких-то программирования. Простенькие сети можно для экспериментов делать даже в екселе а веса подбирать поиском решения.
Обычно предварительно надо повозится с исходными данными и как-то их раздербанить на подмножества---это если делать жёсткую какую-то конструкцию по архитектуре и входным сигналам....дело в том что на сеть-то можно что угодно подавать---хоть шум стадиона в децибелах хоть число зрителей итд...но надо-то избавится от сигналов которые создают шум и мало влияют на тенденции, которые сеть по сути и ищет (через построение функциональной зависимости выход=Ф(вход))...дело в том что если разделить общие данные на подмножества помельче то в каждом из них может оказаться актуальным свой набор и причём этот набор может зависеть(и зависит) от вида ставок под который сеть делается(допустим на линию 1Х2 или ТМ-ТБ2.5 можно создать разные входные сигналы и строить свои сети...хотя можно по идее и одинаковые наборы)....

Можно вообще отойти от традиционных подходов которые озвучены в нете а идти своими путями (немного не стандартными)---для примера просто приведу парочку.
Обычно вин-кодируют "1" а луз "0" (то есть состоялся исход или нет)...но алгоритм тогда просто строит сеть похоже на то как БК даёт оценку (то есть где кефф ниже там более вероятно что исход состоится и ответ сети по сигналу будет выше--это если она ддаёт ответы в интервале 0--1 но для тоталов я б лучше взял гиперболический тангенс или типа такой функции там интервал от -1...1)---исходя из сей преамбулы сеть не нужна..по кефам и так видно "ответ"....

Я брал вот такой вариант для экспериментов-----в пространстве признаков для пары команд(которая имеет набор параметров-признаков) выбирается оболочка(шар)
с ценнтром--признаки пары и обучается сеть на множестве попавшем внутрь шара.

Можно попробовать вот так(но я так не делал а всё собираюсь тока но руки не доходят)--в базе данных для каждой пары выделив оболочку(радиус шара надо экспериментально подобрать и он по идее может плавать в зависимости от каких-то параметров или параметра). потом для этой кучи попавшей в оболочку расчитывается вот такая хрень Выручено/поставлено-1 это число заносим в БД. Тогда сеть будет строить не ответ по принципу ВИН-ЛОЗ а по принципу % с оборота на шаре....(ибо число нами заносимое в БД умноженное на 100% и есть % с оборота по смыслу это типа КР-1 у валуйщиков но не на одну пару а на некоторую кучку похожих на исходную пар).....но тут конечно тока на пальцах просто а пое...аться придётся...хоть с подбором входных сигналов хоть с объёмом шара....
ясно , где можно скачать вашу программу ? она платная ?