Skip to content

Latest commit

 

History

History
21 lines (17 loc) · 2.06 KB

README.md

File metadata and controls

21 lines (17 loc) · 2.06 KB

Darin

Либы, которые нужны: keras, TKinter, tensorflow
Как запускать: python3 main_runner.py
Как запустить UI: python3 table.py, в строку в table можно передать партию матча.

~ План:

    • неинтерактивный UI, который просто рисует доску
    • обучить простую модель с учителем, без фичей - на вход доска, заполненная 1, 0, -1, на выходе - доска с ожиданием выигрыша. Ходим туда, где максимум.
    • добавить к пункту выше фичи - переворот, симметричный поворот, ходить только в ближние поля.
    • сделать так, чтобы модель могла играть хотя-бы с самим собой. Возможно это стоит сделать до пункта 3.
    • т.к. ожидания от обучения с учителем очень низкие, то добавим дерево разбора случаев, чем-то напоминающее дерево Монте-карло (но это не то).
    • тут мощности обучения с учителем подходят к концу, пора бы уже RL внедрять. Сначала скопирую модель с крестиков-ноликов, которые были 3x3 и придумаю, как эту модель применить тут.
    • сделать нормальную модель на RL
    • (опционально) Нужно сделать интерактивный UI, чтобы показать комиссии нашего крутого и сильного бота.

Пункты 1-5 нужно сделать до начала марта. Остальное - не знаю, как пойдет по сложности.

UI: table