Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список.
SQL скрипт размещен на github. Переходим, ищем words-russian-particles, жмем download.
words-russian-particles.sql.gz — база частиц, таблица particles.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы particles
База содержит 488 слов и словосочетаний. Список, возможно, не полный, т.к. определение слова или словосочетания как «частицы», зависит от контекста.
- IID, int — суррогатный ключ, скопирован из основной базы.
- word, varchar[100] — словоформа.
- code, int — код словоформы.
База данных
Данная запись опубликована в 15.03.2017 00:06 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 15, 2017 г.
Список предлогов извлечен из базы морфологии русского языка. Предлоги, как оказалось, обладают кое-какой морфологией, некоторые из них склоняются по падежам. Я не смог четко сформулировать как происходит склонение, потому не стал создавать "нормализованную" ...
Читать
Март 13, 2017 г.
Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт!
Такой файл сложно вообще чем-либо ...
Читать
Март 14, 2017 г.
Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки - нормализованный список и числительные с морфологией.
SQL скрипты баз размещены на github. Переходим, ищем в списке "words-russian-numerals", жмем download. ...
Читать
Март 14, 2017 г.
В данной базе объединены причастия и деепричастия. Таблицы получены из общей базы морфологии. В первой таблице содержится перечень "нормализованных" слов, а вторая база включает их морфологию.
SQL скрипты в виде дампа размещены на github. Переходим, ...
Читать