Частицы в русском языке, скачать как SQL дамп

Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список.

SQL скрипт размещен на github. Переходим, ищем words-russian-particles,  жмем download.

words-russian-particles.sql.gz — база частиц, таблица particles.

Внимание! Скрипт содержит «DROP TABLE if exists».

Описание таблицы particles

База содержит 488 слов и словосочетаний. Список, возможно, не полный, т.к. определение слова или словосочетания как «частицы», зависит от контекста.

  • IID, int — суррогатный ключ, скопирован из основной базы.
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.

Написать комментарий

Мало букафф? Читайте есчо !

Морфологический словарь русского языка в виде SQL скрипта

Март 13, 2017 г.

Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт! Такой файл сложно вообще чем-либо ...

Читать

Полный перечень союзов в русском языке

Март 14, 2017 г.

База данных по части речи "союзы" получена из общей базы морфологии слов русского языка. Т.к. союзы не обладают какой либо морфологией, то получилась одна таблица с перечнем слов. SQL скрипт размещены на github. Переходим, жмем download. words-russian-conjunctions.sql.gz ...

Читать

 

Комментарии к «Частицы в русском языке, скачать как SQL дамп»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: