База прилагательных в виде MySQL скрипта

Здесь представлены две таблицы, полученные из общей базы морфологии слов русского языка. Одна содержит все прилагательные в «нормальной форме», т.е. в мужского рода, ед. числа, именительного падежа. Вторая таблица содержит морфологию прилагательных, все словоформы, в т.ч. прилагательные в краткой форме.

SQL скрипты размещены на github. Переходим, жмем download.

words-russian-adjectives.sql.gz —  база прилагательных без морфологии, таблица adjectives.

words-russian-adjectives-morf.sql.gz — база прилагательных с морфологией, таблица adjectives_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы adjectives

Прилагательные в форме именительного падежа, ед. числе, муж рода, либо прилагательные с неизменяемой формой. Всего — 29492 слова.

  • IID, int — суррогатный ключ
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(’неизм’) — указывает на прилагательное с неизменяемой формой или содержит NULL.

Описание таблицы adjectives_morf

Содержит 856,128 словоформ прилагательных русского языка. Склонения по родам, падежам, ед/мн число, степени сравнения + короткие формы

  • IID, int — суррогатный ключ
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(’неизм’) — указывает на прилагательное с неизменяемой формой или содержит NULL.
  • plural, boolean — множественное число.
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.
  • comp, enum(‘сравн’, ‘прев’) — сравнительные формы.
  • short, boolean — признак краткой формы.

Написать комментарий

Мало букафф? Читайте есчо !

Морфологический словарь русского языка в виде SQL скрипта

Март 13, 2017 г.

Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт! Такой файл сложно вообще чем-либо ...

Читать

Местоимения, база в виде sql скрипта

Март 15, 2017 г.

Местоимения извлечены из базы морфологии русского языка. Они могут склоняются по родам, падежам и образуют три видовые группы. Я не стал вдаваться в детали склонения, чтобы создавать "нормализованную" выборку. Возможно, сделаю это в следующем релизе на ...

Читать

 

Комментарии к «База прилагательных в виде MySQL скрипта»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий:

Много комментариев в “База прилагательных в виде MySQL скрипта”

  1. Alex:

    Добрый день
    Скрипт прилагательныхх words-russian-adjectives-morf.sql
    обрывается вначале, на букве в
    Можно ли выложить полную версию?