Русские числительные в виде sql дампа

Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки — нормализованный список и числительные с морфологией.

SQL скрипты баз размещены на github. Переходим, ищем в списке «words-russian-numerals»жмем download.

words-russian-numerals.sql.gz —  база числительных без морфологии, таблица numerals.

words-russian-numerals-morf.sql.gz — база числительных с морфологией, таблица numerals_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы numerals

«Нормализованный» список числительных. Всего — 106 слов.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных :
    • количественное числительное,
    • порядковое числительное,
    • собирательное числительное,
    • неопределённо-количественное числительное.

Описание таблицы numerals_morf

Содержит 1582 словоформы числительных русского языка. Склонения по родам, падежам, ед/мн число.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных.
  • plural, boolean — множественное число.
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.

Написать комментарий

Мало букафф? Читайте есчо !

База данных русских наречий, SQL скрипт

Март 14, 2017 г.

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы. SQL скрипты размещены на github. Переходим, жмем download. words-russian-adverbs.sql.gz - ...

Читать

База причастий и деепричастий русского языка

Март 14, 2017 г.

В данной базе объединены причастия и деепричастия. Таблицы получены из общей базы морфологии. В первой таблице содержится перечень "нормализованных" слов, а вторая база включает их морфологию. SQL скрипты в виде дампа размещены на github. Переходим, ...

Читать

 

Комментарии к «Русские числительные в виде sql дампа»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: