Либы, которые нужны: keras, TKinter, tensorflow
Как запускать: python3 main_runner.py
Как запустить UI: python3 table.py
, в строку в table можно передать партию матча.
~ План:
-
- неинтерактивный UI, который просто рисует доску
-
- обучить простую модель с учителем, без фичей - на вход доска, заполненная 1, 0, -1, на выходе - доска с ожиданием выигрыша. Ходим туда, где максимум.
-
- добавить к пункту выше фичи - переворот, симметричный поворот, ходить только в ближние поля.
-
- сделать так, чтобы модель могла играть хотя-бы с самим собой. Возможно это стоит сделать до пункта 3.
-
- т.к. ожидания от обучения с учителем очень низкие, то добавим дерево разбора случаев, чем-то напоминающее дерево Монте-карло (но это не то).
-
- тут мощности обучения с учителем подходят к концу, пора бы уже RL внедрять. Сначала скопирую модель с крестиков-ноликов, которые были 3x3 и придумаю, как эту модель применить тут.
-
- сделать нормальную модель на RL
-
- (опционально) Нужно сделать интерактивный UI, чтобы показать комиссии нашего
крутого и сильногобота.
- (опционально) Нужно сделать интерактивный UI, чтобы показать комиссии нашего
Пункты 1-5 нужно сделать до начала марта. Остальное - не знаю, как пойдет по сложности.