Русские числительные в виде sql дампа

Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки — нормализованный список и числительные с морфологией.

SQL скрипты баз размещены на github. Переходим, ищем в списке «words-russian-numerals»жмем download.

words-russian-numerals.sql.gz —  база числительных без морфологии, таблица numerals.

words-russian-numerals-morf.sql.gz — база числительных с морфологией, таблица numerals_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы numerals

«Нормализованный» список числительных. Всего — 106 слов.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных :
    • количественное числительное,
    • порядковое числительное,
    • собирательное числительное,
    • неопределённо-количественное числительное.

Описание таблицы numerals_morf

Содержит 1582 словоформы числительных русского языка. Склонения по родам, падежам, ед/мн число.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных.
  • plural, boolean — множественное число.
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.

Мало букафф? Читайте есчо !

База данных русских слов - существительные

Март 13, 2017 г.

Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая - только существительные в именительном падеже ед. числа. Скачать SQL скрипт можно с github. ...

Читать

Список стран ISO 3166 в виде sql - дампа

Февраль 8, 2013 г.

Мне потребовался этот перечень для счета-фактуры. И как следовало из описания код и название страны должны соответствовать общероссийскому классификатору ...

Читать

База данных русских наречий, SQL скрипт

Март 14, 2017 г.

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы. SQL скрипты размещены на github. Переходим, жмем download. words-russian-adverbs.sql.gz - ...

Читать

База предикативов

Март 15, 2017 г.

База данных предикативов сформирована выборкой из базы морфологии слов русского языка. Мы в школе не изучали эту часть речи. Думаю, лингвисты тоже с трудом отличают предикативы то от междометий, то от наречий. SQL скрипт размещен на github. Переходим ...

Читать
 

Комментарии к «Русские числительные в виде sql дампа»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: