Объединение усилий по сбору и организации БД по футболу
#61 OFFLINE
Posted 09 May 2015 - 16:50
Этот факт ведь наглядно даёт о себе знать в начале сезона---когда данных формально нет (кроме ретро) и ко всему прочему их число вообще не может иметь какую-то значимость для расчёта любого критерия с моей точки зрения. Дело в том что при той структуре и механизме обработки данных которая в теме я не вижу как там можно иначе поступить как заблаговременно забить побольше признаков в базу а использовать не весь набор а какие-то сочетания...но заранее подобрать их. В противном случае надо предусмотреть процедуру обмена данными между вычислительной частью и той частью где данные сохраняются или возможно там какими-то порциями их извлекать и обрабатывать...но тогда всё равно придётся порождать какие-то промежуточные подбазы что ли (не знаю как правильно обозвать)..... А как тогда можно обработать БД по застолблённым параметрам? тут кроме перебора и априорного фиксирования набора критериев (под которые потом и берутся команды или пары для ставок) и ни чё на ум не приходит....
#62 OFFLINE
Posted 09 May 2015 - 17:55
#63 OFFLINE
Posted 09 May 2015 - 20:37
andre48, on 09 May 2015 - 17:55, said:
А что эта вероятность характеризует--она формально показывает оцениваемое букмекерами распределение долей выигрышей Ф2+0.5 и П1 это типа для осмысления рисков что ли???
#64 OFFLINE
Posted 09 May 2015 - 21:25
#65 OFFLINE
Posted 09 May 2015 - 21:46
andre48, on 09 May 2015 - 21:25, said:
Edited by andre48, 09 May 2015 - 21:49.
#66 OFFLINE
Posted 09 May 2015 - 21:52
andre48, on 09 May 2015 - 21:25, said:
#67 OFFLINE
Posted 09 May 2015 - 22:03
Edited by Bambuk, 09 May 2015 - 22:06.
#68 OFFLINE
Posted 10 May 2015 - 09:53
Bambuk, on 09 May 2015 - 21:52, said:
Edited by andre48, 10 May 2015 - 09:54.
#69 OFFLINE
Posted 10 May 2015 - 18:42
Bambuk, on 09 May 2015 - 16:50, said:
Я так сразу не могу вам показать все нюансы работы, т.к. сначала надо показать основы. А Вы, в свою очередь, не представляете доступного функционала и поэтому возникают такие вопросы. Но, я постараюсь эту ситуацию исправить. Уже снял первый скринкаст по работе со сводными таблицами. Пока ничего сложного, но это только первые шаги. Дальше хочу сделать обзор всей рабочей схемы, от загрузки данных, предварительных расчетов каких то показателей и до непосредственного анализа уже собранной воедино базы разных лиг и разных сезонов.
Когда вы будете понимать как это работает, то разговор скорее всего перейдет больше на конкретику и работу с инструментом. Например, будут возникать вопросы, как рассчитать и добавить тот или иной показатель в базу, да еще так, чтобы с ним можно было удобно работать и он показывал нам именно то, что мы хотим увидеть.
Bambuk, on 09 May 2015 - 22:03, said:
Если это будет нужно, то буду интегрировать это в свой инструмент. Правда, не понимаю, что такое окно. Это количество последних игр? В моем случае это делается добавлением вычисляемого столбца. Динамически менять их пока не очень удобно, но рассчитать их можно хоть с десяток с разными диапазонами и они будут хранится (скорее, рассчитываться) в базе. Это почти никак не будет влиять на быстродействие системы. Но отображать их можно по надобности и разными наборами от одного до десяти.
andre48, on 10 May 2015 - 09:53, said:
К этому вопросу я пришел после месяца своих исследований. Вроде как все было, но чего-то не хватало. И столкнувшись несколько раз с потребностью что-то посчитать, я также решил эту проблему удваиванием базы. С этим вопросом то и пришел сюда на форум, но оказалось, что никто из читателей с этим не сталкивался. А позже сумел автоматизировать эту процедуру на этапе загрузки данных.
#70 OFFLINE
Posted 10 May 2015 - 19:00
andre48, on 10 May 2015 - 09:53, said:
Есть надежда, что для определения качества игры подойдут данные с детальной статистикой матча (удары, владение мячом, отборы, потери, ошибки и т.д.). А если эти данные были бы поминутно (да еще и с координатами точки события на поле, хи-хи), то можно было бы моделировать динамику игры, основываясь только на цифрах. И смотреть, где команда проявляет активность, а где затухает, разбивая игру, например, на диапазоны по 5-15 минут.
Такие данные в открытом доступе уже есть, но их распарсить немного сложновато. Да и это следующий этап (а может и через один-два) работы. Сейчас наращивается основа: элементарная база, стандартизация обработки данных, выбор и расчет характеристик и техника работы с инструментом. И далеко забегать на перед не хочется, чтобы не потерять опоры под ногами.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Подскажите, будьте добры, как видео с ютуба вставить в сообщение. Можно в ЛС.
Edited by tester.nt, 10 May 2015 - 19:01.
#71 OFFLINE
Posted 10 May 2015 - 19:13
Просто кидаю ссылку.
Видео 1: Введение в работу со сводными таблицами Excel (на примере данных с football-data.co.uk)
https://www.youtube....h?v=-nPnUb8Xdas
#72 OFFLINE
Posted 10 May 2015 - 19:48
andre48, on 10 May 2015 - 09:53, said:
Я однозначно отделяю игры на своем поле от игр на чужом (отделяю мух от котлет), дабы не париться о назначении справедливого соотношения весов параметров на разных полях (своем / чужом) . Это упрощает логику : а) команда А играет на своем поле против всех команд (Б и других), играющих на чужом поле; б) команда Б играет на чужом поле против всех команд (А и других), играющих на своем поле. И точка.
#73 OFFLINE
Posted 10 May 2015 - 20:05
tester.nt, on 10 May 2015 - 18:42, said:
К этому вопросу я пришел после месяца своих исследований. Вроде как все было, но чего-то не хватало. И столкнувшись несколько раз с потребностью что-то посчитать, я также решил эту проблему удваиванием базы. С этим вопросом то и пришел сюда на форум, но оказалось, что никто из читателей с этим не сталкивался. А позже сумел автоматизировать эту процедуру на этапе загрузки данных.
Окно тут можно понимать как число игр(обычно последних) по которым вычисляется характеристика можно 2 игры а можно 22 итд ...я думаю лучше наделать несколько пусть даже пока и не нужных вроде бы окон чем потом пересчитывать (можно даже согласовать окна чтоб получать например окно 16 или 20 по двум ДГ размерностей в два раза меньше...а в принципе тут я думаю произвольно можно но учесть что лиги у нас тоже могут сильно разница по объёмам например 24 и 16 очень большая разница).
У меня есть окна которые привязаны не к числу игр а к числу записей--похоже как бы на временной интервал условно...но такое окно может конечно дербанить тур... и там число игр плавает а не фиксировано(так было проще на начальном этапе организовать вычислялово в экселе).
Хорошо бы придумать как можно помечать команды маркерами при выполнении набора изменяемых условий (причём набор условий может и ветвления какие-то иметь и маркеры могут быть многоуровневые (можно сказать типа "разноцветные" 1,2,3....-номера "цвета" при желании номера можно перевести и в уровни допустим и загнать всё в требуемый диапазон)....Например если мы захотим провести простое сравнение--как сыграла команда с аналогичными из текущего в предыдущем сезоне (самый простой пример) и сделать заключение-лучше или хуже (лучше-хуже надо как-то формализовать через параметры которые в БД а то это понятие растяжимое...) вот пометили допустим 1 если не хуже...а потом допустим нам надо понять как сама куча играет с которой мы считаем резы какие-то--надо опять дать характеристику куче для текущего чемпа и ретро....итд итп.
Вулкан, on 10 May 2015 - 19:48, said:
Я однозначно отделяю игры на своем поле от игр на чужом (отделяю мух от котлет), дабы не париться о назначении справедливого соотношения весов параметров на разных полях (своем / чужом) . Это упрощает логику : а) команда А играет на своем поле против всех команд (Б и других), играющих на чужом поле; б) команда Б играет на чужом поле против всех команд (А и других), играющих на своем поле. И точка.
Edited by Bambuk, 10 May 2015 - 20:06.
#74 OFFLINE
Posted 10 May 2015 - 20:21
Edited by Bambuk, 10 May 2015 - 20:29.
#75 OFFLINE
Posted 10 May 2015 - 20:31
Вулкан, on 10 May 2015 - 19:48, said:
Я однозначно отделяю игры на своем поле от игр на чужом (отделяю мух от котлет), дабы не париться о назначении справедливого соотношения весов параметров на разных полях (своем / чужом) . Это упрощает логику : а) команда А играет на своем поле против всех команд (Б и других), играющих на чужом поле; б) команда Б играет на чужом поле против всех команд (А и других), играющих на своем поле. И точка.
Edited by andre48, 10 May 2015 - 20:35.
#76 OFFLINE
Posted 10 May 2015 - 21:36
tester.nt, on 10 May 2015 - 19:13, said:
Просто кидаю ссылку.
Видео 1: Введение в работу со сводными таблицами Excel (на примере данных с football-data.co.uk)
https://www.youtube....h?v=-nPnUb8Xdas
Ссылка почему-то нормально не вставилась...
Попытка номер 2
Видео 1: Введение в работу со сводными таблицами Excel (на примере данных с football-data.co.uk)
Ссылка на видео
#77 OFFLINE
Posted 10 May 2015 - 22:13
Bambuk, on 10 May 2015 - 20:05, said:
У меня есть окна которые привязаны не к числу игр а к числу записей--похоже как бы на временной интервал условно...но такое окно может конечно дербанить тур... и там число игр плавает а не фиксировано(так было проще на начальном этапе организовать вычислялово в экселе).
Хорошо бы придумать как можно помечать команды маркерами при выполнении набора изменяемых условий (причём набор условий может и ветвления какие-то иметь и маркеры могут быть многоуровневые (можно сказать типа "разноцветные" 1,2,3....-номера "цвета" при желании номера можно перевести и в уровни допустим и загнать всё в требуемый диапазон)....Например если мы захотим провести простое сравнение--как сыграла команда с аналогичными из текущего в предыдущем сезоне (самый простой пример) и сделать заключение-лучше или хуже (лучше-хуже надо как-то формализовать через параметры которые в БД а то это понятие растяжимое...) вот пометили допустим 1 если не хуже...а потом допустим нам надо понять как сама куча играет с которой мы считаем резы какие-то--надо опять дать характеристику куче для текущего чемпа и ретро....итд итп.
В той схеме работы, которую я предлагаю, пересчет - это не столь долгое занятие. Добавление нового окна, при заготовленной заранее формуле, занимает минуту времени. Но, есть возможность вообще построить такую схему, при которой нам нужно будет выбрать на фильтре диапазон, а очки внутри данного диапазона будут считаться автоматически. Причем, диапазон может состоять из нескольких частей. Визуально такие фильтры выглядят красиво и с ними очень легко и удобно работать. Причем, можно делать всякие интересные вещи. Например, если на слайсере Week выбрать 10,11,12,13 недели, то очки команд будет считать только в тех неделях, но по всем годам. Или это могут быть не очки, а наш профит. А вот как выглядят фильтры:
Дальше. Подмечать команды маркерами также как добавлять новые характеристики. Вообще, когда мы добавляем новую характеристику, то она добавляется на все матчи без исключения. Поэтому, чтобы посмотреть кучу, надо всего лишь выбрать в фильтре, например, единицу (которая маркер), проставленную автоматически возле каждой пары. И по этой куче можно создавать любые сводки в любых разрезах: как куча распределяется по диапазону коэффициентов, по тоталу голов, по общему результату,... короче, распределение можно смотреть по любым наборам характеристик. Кстати, гляньте видео, которое я заснял. Там пытался рассказать об основных механизмах работы сводной таблицы.
#78 OFFLINE
Posted 10 May 2015 - 22:41
Или возможно я не врубаюсь в механизмы обработки данных в базах и там может можно обойти сие.... Там кстати в БД некоторые параметры могут вычисляться только макросами допустим..то в этом случае есть выход перезаписать быстро столбец базы а потом допустим начать выбирать по нему?
Edited by Bambuk, 10 May 2015 - 22:46.
#79 OFFLINE
Posted 10 May 2015 - 22:45
Bambuk, on 10 May 2015 - 22:41, said:
Или возможно я не врубаюсь в механизмы обработки данных в базах и там может можно обойти сие....
Вы говорите, что маркер - это выполнение набора условий. Если мы условия знаем, то какая проблема их запрограммировать в формулу?
Edited by tester.nt, 10 May 2015 - 22:47.
#80 OFFLINE
Posted 10 May 2015 - 23:07
Bambuk, on 10 May 2015 - 22:41, said: