Русские глаголы, sql база

Здесь представлены две выборки, полученные из общей базы морфологии. «Нормализованная» выборка содержит инфинитивы глаголов, а вторая таблица — инфинитивы + словоформы.

SQL скрипты размещены на github. Переходим, ищем файлы words-russian-verbs, жмем download.

words-russian-verbs.sql.gz —  база глаголов в неопределенной форме, таблица verbs.

words-russian-verbs-morf.sql.gz — база прилагательных с морфологией, таблица verbs_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы verbs

Глаголы в инфинитивной форме. Всего — 22600 слов.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • transit, enum(‘перех’, ‘непер’, ‘пер/не’) — переходность глагола.
  • perfect, boolean — признак совершенной формы.
  • face, enum(‘безл’) — лицо. Поле сохранено для безличных глаголов.
  • kind, enum(‘1вид’, ‘2вид’) — вид глагола.

Описание таблицы verbs_morf

Содержит 467,722 словоформ глаголов. Склонения по лицам, временам, родам, числам. Возвратные формы глагола (на -сь, -ся). Повелительная и страдательные формы, и, конечно, инфинитив.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • plural, boolean — множественное число
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • transit, enum(‘перех’, ‘непер’, ‘пер/не’) — переходность глагола.
  • perfect, boolean — признак совершенной формы глагола.
  • face, enum(‘1-е’, ‘2-е’, ‘3-е’, ‘безл’) — лицо.
  • kind, enum(‘1вид’, ‘2вид’) — вид.
  • time, enum(‘прош’, ‘наст’, ‘буд’) — временная форма.
  • inf, boolean — признак инфинитива.
  • vozv, boolean — признак возвратной формы глагола.
  • nakl, enum(‘пов’, ‘страд’) — наклонение или залог.

Написать комментарий

Мало букафф? Читайте есчо !

Список стран ISO 3166 в виде sql - дампа

Февраль 8, 2013 г.

Мне потребовался этот перечень для счета-фактуры. И как следовало из описания код и название страны должны соответствовать общероссийскому классификатору ...

Читать

Русские числительные в виде sql дампа

Март 14, 2017 г.

Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки - нормализованный список и числительные с морфологией. SQL скрипты баз размещены на github. Переходим, ищем в списке "words-russian-numerals", жмем download. ...

Читать

 

Комментарии к «Русские глаголы, sql база»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий:

Много комментариев в “Русские глаголы, sql база”

  1. Илья:

    «Описание таблицы verbs_morf
    Содержит 467,722 словоформ глаголов. Склонения по лицам, временам, родам, числам.»

    Только у глаголов не склонение, а спряжение. Склонение по падежам у существительных, местоимений и прилагательных