Русские числительные в виде sql дампа

Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки — нормализованный список и числительные с морфологией.

SQL скрипты баз размещены на github. Переходим, ищем в списке «words-russian-numerals»жмем download.

words-russian-numerals.sql.gz —  база числительных без морфологии, таблица numerals.

words-russian-numerals-morf.sql.gz — база числительных с морфологией, таблица numerals_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы numerals

«Нормализованный» список числительных. Всего — 106 слов.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных :
    • количественное числительное,
    • порядковое числительное,
    • собирательное числительное,
    • неопределённо-количественное числительное.

Описание таблицы numerals_morf

Содержит 1582 словоформы числительных русского языка. Склонения по родам, падежам, ед/мн число.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных.
  • plural, boolean — множественное число.
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.

Написать комментарий

Мало букафф? Читайте есчо !

Морфологический словарь русского языка в виде SQL скрипта

Март 13, 2017 г.

Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт! Такой файл сложно вообще чем-либо ...

Читать

Местоимения, база в виде sql скрипта

Март 15, 2017 г.

Местоимения извлечены из базы морфологии русского языка. Они могут склоняются по родам, падежам и образуют три видовые группы. Я не стал вдаваться в детали склонения, чтобы создавать "нормализованную" выборку. Возможно, сделаю это в следующем релизе на ...

Читать

 

Комментарии к «Русские числительные в виде sql дампа»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: