이 레포지터리는 Johannes Gätjen의 Semantlich (소스코드)를 포크하여, 한국어로 플레이할 수 있도록 수정한 버전인 꼬맨틀 (소스코드)을 원하는 만큼 플레이할 수 있도록 만든 버전입니다.
Download Word2Vec and dictionary data:
cd data
wget https://dl.fbaipublicfiles.com/fasttext/vectors-crawl/cc.ko.300.vec.gz
gzip -d cc.ko.300.vec.gz
wget https://github.com/spellcheck-ko/hunspell-dict-ko/releases/download/0.7.92/ko-aff-dic-0.7.92.zip
unzip ko-aff-dic-0.7.92.zip
Filter and save word2vec in DB
python filter_words.py
python process_vecs.py
Start server
gunicorn main:app