Русские глаголы, sql база

Здесь представлены две выборки, полученные из общей базы морфологии. «Нормализованная» выборка содержит инфинитивы глаголов, а вторая таблица — инфинитивы + словоформы.

SQL скрипты размещены на github. Переходим, ищем файлы words-russian-verbs, жмем download.

words-russian-verbs.sql.gz —  база глаголов в неопределенной форме, таблица verbs.

words-russian-verbs-morf.sql.gz — база прилагательных с морфологией, таблица verbs_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы verbs

Глаголы в инфинитивной форме. Всего — 22600 слов.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • transit, enum(‘перех’, ‘непер’, ‘пер/не’) — переходность глагола.
  • perfect, boolean — признак совершенной формы.
  • face, enum(‘безл’) — лицо. Поле сохранено для безличных глаголов.
  • kind, enum(‘1вид’, ‘2вид’) — вид глагола.

Описание таблицы verbs_morf

Содержит 467,722 словоформ глаголов. Склонения по лицам, временам, родам, числам. Возвратные формы глагола (на -сь, -ся). Повелительная и страдательные формы, и, конечно, инфинитив.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • plural, boolean — множественное число
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • transit, enum(‘перех’, ‘непер’, ‘пер/не’) — переходность глагола.
  • perfect, boolean — признак совершенной формы глагола.
  • face, enum(‘1-е’, ‘2-е’, ‘3-е’, ‘безл’) — лицо.
  • kind, enum(‘1вид’, ‘2вид’) — вид.
  • time, enum(‘прош’, ‘наст’, ‘буд’) — временная форма.
  • inf, boolean — признак инфинитива.
  • vozv, boolean — признак возвратной формы глагола.
  • nakl, enum(‘пов’, ‘страд’) — наклонение или залог.

Мало букафф? Читайте есчо !

База данных русских слов - существительные

Март 13, 2017 г.

Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая - только существительные в именительном падеже ед. числа. Скачать SQL скрипт можно с github. ...

Читать

База прилагательных в виде MySQL скрипта

Март 14, 2017 г.

Здесь представлены две таблицы, полученные из общей базы морфологии слов русского языка. Одна содержит все прилагательные в "нормальной форме", т.е. в мужского рода, ед. числа, именительного падежа. Вторая таблица содержит морфологию прилагательных, все ...

Читать

База данных русских наречий, SQL скрипт

Март 14, 2017 г.

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы. SQL скрипты размещены на github. Переходим, жмем download. words-russian-adverbs.sql.gz - ...

Читать

Морфологический словарь русского языка в виде SQL скрипта

Март 13, 2017 г.

Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт! Такой файл сложно вообще чем-либо ...

Читать
 

Комментарии к «Русские глаголы, sql база»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий:

Много комментариев в “Русские глаголы, sql база”

  1. Илья:

    «Описание таблицы verbs_morf
    Содержит 467,722 словоформ глаголов. Склонения по лицам, временам, родам, числам.»

    Только у глаголов не склонение, а спряжение. Склонение по падежам у существительных, местоимений и прилагательных