Здесь представлены две выборки, полученные из общей базы морфологии. «Нормализованная» выборка содержит инфинитивы глаголов, а вторая таблица — инфинитивы + словоформы.
SQL скрипты размещены на github. Переходим, ищем файлы words-russian-verbs, жмем download.
words-russian-verbs.sql.gz — база глаголов в неопределенной форме, таблица verbs.
words-russian-verbs-morf.sql.gz — база прилагательных с морфологией, таблица verbs_morf.
Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.
Описание таблицы verbs
Глаголы в инфинитивной форме. Всего — 22600 слов.
- IID, int — суррогатный ключ
- word, varchar[100] — словоформа.
- code, int — код словоформы.
- transit, enum(‘перех’, ‘непер’, ‘пер/не’) — переходность глагола.
- perfect, boolean — признак совершенной формы.
- face, enum(‘безл’) — лицо. Поле сохранено для безличных глаголов.
- kind, enum(‘1вид’, ‘2вид’) — вид глагола.
Описание таблицы verbs_morf
Содержит 467,722 словоформ глаголов. Склонения по лицам, временам, родам, числам. Возвратные формы глагола (на -сь, -ся). Повелительная и страдательные формы, и, конечно, инфинитив.
- IID, int — суррогатный ключ
- word, varchar[100] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- plural, boolean — множественное число
- gender, enum(‘муж’,’жен’,’ср’) — род.
- transit, enum(‘перех’, ‘непер’, ‘пер/не’) — переходность глагола.
- perfect, boolean — признак совершенной формы глагола.
- face, enum(‘1-е’, ‘2-е’, ‘3-е’, ‘безл’) — лицо.
- kind, enum(‘1вид’, ‘2вид’) — вид.
- time, enum(‘прош’, ‘наст’, ‘буд’) — временная форма.
- inf, boolean — признак инфинитива.
- vozv, boolean — признак возвратной формы глагола.
- nakl, enum(‘пов’, ‘страд’) — наклонение или залог.
«Описание таблицы verbs_morf
Содержит 467,722 словоформ глаголов. Склонения по лицам, временам, родам, числам.»
Только у глаголов не склонение, а спряжение. Склонение по падежам у существительных, местоимений и прилагательных
Согласен, Илья, вы правы.