-
Установить все необходимые библиотеки из списка. Можно сделать пакетно через
pip install -r requirements.txt
Для установки gensim может понадобиться Microsoft Visual C++ 14.0. Для этого надо скачать Build Tools for Visual Studio и выбрать в появившемя окне "Рабочие нагрузки средства сборки" (Visual С++ build tools). И ждать :)_Решение этой проблемы на StackOverFlow)
-
В code/web положить папку models, которую можно скачать по ссылке.
model description cross_muse_ext.bin Объединённые в одну модель очищенные от мусора русские и английские эмбеддинги MUSE, которые мы пополнили векторами слов из текстов статей common_tok_muse_ext_<версия>.bin Вектора всех текстов статей из базы и задач из NLPub.tsv (начинаются с TASK::) Допускаются следующие форматы моделей:
- .bin(.gz)
- .vec(.gz), txt(.gz)
- gensim native
-
Указать используемую версию [базы данных] в rusnlp.cfg и названия моделей векторов в models.tsv.
-
В code/web/run_nlp.py заменить static_url_path на абсолютный путь к папке code/web/data (в начале поставить
/
).
- Запустите сервер через
python code/web/nlp_server.py
- Запустите веб-интерфейс через
python code/web/run_nlp.py
Совет: можно указатьdebug=True
в параметрахapp_rusnlp.run()
, чтобы изменения подгружались автоматически.