Русские глаголы, sql база

Здесь представлены две выборки, полученные из общей базы морфологии. «Нормализованная» выборка содержит инфинитивы глаголов, а вторая таблица — инфинитивы + словоформы.

SQL скрипты размещены на github. Переходим, ищем файлы words-russian-verbs, жмем download.

words-russian-verbs.sql.gz —  база глаголов в неопределенной форме, таблица verbs.

words-russian-verbs-morf.sql.gz — база прилагательных с морфологией, таблица verbs_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы verbs

Глаголы в инфинитивной форме. Всего — 22600 слов.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • transit, enum(‘перех’, ‘непер’, ‘пер/не’) — переходность глагола.
  • perfect, boolean — признак совершенной формы.
  • face, enum(‘безл’) — лицо. Поле сохранено для безличных глаголов.
  • kind, enum(‘1вид’, ‘2вид’) — вид глагола.

Описание таблицы verbs_morf

Содержит 467,722 словоформ глаголов. Склонения по лицам, временам, родам, числам. Возвратные формы глагола (на -сь, -ся). Повелительная и страдательные формы, и, конечно, инфинитив.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • plural, boolean — множественное число
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • transit, enum(‘перех’, ‘непер’, ‘пер/не’) — переходность глагола.
  • perfect, boolean — признак совершенной формы глагола.
  • face, enum(‘1-е’, ‘2-е’, ‘3-е’, ‘безл’) — лицо.
  • kind, enum(‘1вид’, ‘2вид’) — вид.
  • time, enum(‘прош’, ‘наст’, ‘буд’) — временная форма.
  • inf, boolean — признак инфинитива.
  • vozv, boolean — признак возвратной формы глагола.
  • nakl, enum(‘пов’, ‘страд’) — наклонение или залог.

Написать комментарий

Мало букафф? Читайте есчо !

База прилагательных в виде MySQL скрипта

Март 14, 2017 г.

Здесь представлены две таблицы, полученные из общей базы морфологии слов русского языка. Одна содержит все прилагательные в "нормальной форме", т.е. в мужского рода, ед. числа, именительного падежа. Вторая таблица содержит морфологию прилагательных, все ...

Читать

Вводные слова, база данных

Март 14, 2017 г.

База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу. SQL скрипт размещен на github. Переходим, жмем download. words-russian-introductors.sql.gz ...

Читать

 

Комментарии к «Русские глаголы, sql база»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: