Частицы в русском языке, скачать как SQL дамп

Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список.

SQL скрипт размещен на github. Переходим, ищем words-russian-particles,  жмем download.

words-russian-particles.sql.gz — база частиц, таблица particles.

Внимание! Скрипт содержит «DROP TABLE if exists».

Описание таблицы particles

База содержит 488 слов и словосочетаний. Список, возможно, не полный, т.к. определение слова или словосочетания как «частицы», зависит от контекста.

  • IID, int — суррогатный ключ, скопирован из основной базы.
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.

Написать комментарий

Мало букафф? Читайте есчо !

База данных русских наречий, SQL скрипт

Март 14, 2017 г.

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы. SQL скрипты размещены на github. Переходим, жмем download. words-russian-adverbs.sql.gz - ...

Читать

Морфологический словарь русского языка в виде SQL скрипта

Март 13, 2017 г.

Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт! Такой файл сложно вообще чем-либо ...

Читать

 

Комментарии к «Частицы в русском языке, скачать как SQL дамп»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: