Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки — нормализованный список и числительные с морфологией.
SQL скрипты баз размещены на github. Переходим, ищем в списке «words-russian-numerals», жмем download.
words-russian-numerals.sql.gz — база числительных без морфологии, таблица numerals.
words-russian-numerals-morf.sql.gz — база числительных с морфологией, таблица numerals_morf.
Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.
Описание таблицы numerals
«Нормализованный» список числительных. Всего — 106 слов.
- IID, int — суррогатный ключ.
- word, varchar[60] — словоформа.
- code, int — код словоформы.
- type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных :
- количественное числительное,
- порядковое числительное,
- собирательное числительное,
- неопределённо-количественное числительное.
Описание таблицы numerals_morf
Содержит 1582 словоформы числительных русского языка. Склонения по родам, падежам, ед/мн число.
- IID, int — суррогатный ключ.
- word, varchar[60] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных.
- plural, boolean — множественное число.
- gender, enum(‘муж’,’жен’,’ср’) — род.
- wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.