Перепрыгнеть в содержание


- - - - -

Парсер betexplorer


1 ответ в эту тему

#1 OFFLINE   senyai7

    Новичок


  • Участник
  • Пип
  • 29 сообщения
0

Добавлено 19 July 2017 - 13:17

Здравствуйте уважаемые !

Нужен совет знающих людей по разработке компьютерной программы

Что есть на данный момент :

Парсер с betexplorer ( написан на JAVA ) с настраиваемым списком лиг, который парсит результаты прошлых матчей и сохраняет их в csv фаил при экспорте реализован расчет разных турнирных показателей типа очки и текущая форма.



Так же у меня есть готовый список критериев около 60 штук ( хотя комбинации критериев и диапазонов можно задать и больше ) по которым на мой взгляд целесообразно фильтровать базу на начальном этапе .

На текущий момент в базе около 500 сезонов и 140 000 матчей

Ссылки на пример части базы и текстовый фаил с пояснениями для понимания структуры базы
https://yadi.sk/i/ZdLgo8w63LCFgQ

https://yadi.sk/d/I2qAqmbJ3LCFyq


Вкратце о структуре базы

Страна

Лига

Сезон

Дата

Время

Месяц

День

Команда 1

Команда 2

Класс команды 1

Класс команды 2

Голов забито 1 ком

Голов забито 2 ком

Результат

Разница в счете

Коэф-ты ( пинакл) 1х2

Коэфты на форы по равной линии

Коэф-ты на форы с покупкой

Игр всего 1 команда

Очков всего 1 команда

Побед 1 команда проц

Ничей 2 проц

Поражений 2проц


Игр всего 2 команда

Очков всего 2 команда

Побед 2 команда проц

Ничей 2 проц

Поражений 2 проц

Те же данные с учетом поля

Процент побед в 1 и в 2м с учетом поля

Сравнение результатов между командами за 2 ,3 ,4 ,5 матчей








На данный момент я могу вручную с помощью фильтров эксель задать некую комбинацию критериев чтобы провести анализ конкретного матча

Например:
1 коэффициент на п1 в диапазоне 1,9-2,1
2 разница в очках общее 15 %
3 разница в очках с учетом поля 25 %
4 разница в набранных очках за 4 матча с учетом поля 50 %

И посмотреть количество игр в выборке по заданным условия далее на основе процентного соотношения результатов вывести некий средний коэффициент

Например, по приведенным выше условиям в базе нашлось 155 матчей

П1-84
Х-40
П2-31

Если провести такой анализ по разным критериям, то можно вывести для себя некий средний коэффициент сравнить его с коэффициентом букмекера и принять решение делать ставку на конкретный матч или нет

Проблема в том, что для получения более-менее объективной картины по конкретному матчу нужно провести такой анализ по большому количеству критериев и вручную это сделать очень тяжело, то есть стоит задача

1 добавить в парсер возможность сбора будущих матчей

2 автоматизировать процесс чтобы программа сама производила расчет по всем заданным комбинациям критериев и выводила расчет вероятностей и эффективностей по каждому матчу



Однако на данный момент программист который писал парсер не может доделать следующий и самый важный этап программы расчет вероятностей и эффективностей так как :

Он не учел, что для фильтрации базы по кол-ву очков и другим показателям нужно чтобы эти очки были рассчитаны для каждого матча и изначально спроектировал базу так, что расчет очков и других показателей идёт в процессе выгрузки. А как перепроектировать ее так, чтобы этот расчет шел в процессе сбора матчей он пока не знает

Поэтому на данный момент работа над проектом приостановлена





Вопросы


1 Как добиться того чтобы парсер сохранял по заданной структуре ( аналогично прошлым ) будущие матчи ?

2 Возможно ли теоретически решить эту проблему без перепрограммирования базы рассчитывая показатели вероятностей и эффективности

Либо напрямую в эксель с помощью веб программирования или импортировать выгруженный парсером csv фаил в acess 1c или clipper и запрограммировать необходимые расчеты там?




Вот кстати, что написал уважаемый Andre48 по этому поводу

посчитать нужные Вам характеристики можно, если Вы сумеете определить границы чемпионатов по годам плюс обеспечите однозначное название всех команд плюс обеспечите полноту информации по всем играм чемпионата без пропусков.
У меня все базы в dbf файлах, так как не нашел ничего, что работало бы быстрее, программирование ведется на очень старом языке Clipper Summer 87, так как он быстрее работает, чем следующие версии и используется компилятор не Clipper, а кроссплатформенный Harbour, что позволяет еще примерно в 3 раза уменьшить время обработки и снимает многие ограничения компилятора Clipper.
Для получения нужной информации нужно создать рабочую базу в которой каждый матч будет записан дважды. Один раз в обычном виде, а второй раз (с какой-то меткой) в перевернутом так, чтобы в поле домашней команды попала гостевая и наоборот. В результате в одном поле окажутся все игры со всеми данными любой команды в чемпионате. Расположив игры команды во времени (например, проиндексировав это поле по названию команды и дате игры) в порядке возрастания можно легко посчитать количество очков набранное командой на момент начала любой игры ( в том числе и с учетом поля) и записать это значение в базу для дальнейшего использования. Посчитав другие параметры, их тоже можно записать в базу данных для каждой игры.

Однако сам я не программист и поэтому боюсь, что не смогу это технически реализовать в связи с этим прошу совета у знающих людей

Всем спасибо за внимание !

#2 OFFLINE   wist

    Специалист


  • Участник II
  • ПипПипПипПип
  • 604 сообщения
26

Добавлено 19 July 2017 - 15:17

Сообщенияsenyai7, on 19 July 2017 - 13:17, сказал:


Нужен совет знающих людей по разработке компьютерной программы
........................... что написал уважаемый Andre48 по этому поводу
....................

Я говорю сразу...что незнающий... :D
Насколько помню у мэтра Andre48 вся соль в payout, а уже потом всякие выборки вдоль и поперек базы ..

Проще говоря, выборка по базе без положительного payout, преодолевающего маржу Бука бессмысленна....
Теоретически эфто так...
Практически все несколько по другому...

За бесплатно маловероятно, чтобы Вам кто то помог в Вашем вопросе...но бывают и альтруисты...вот Бамбук Бамбукович может дать совет... :D