Русские числительные в виде sql дампа

Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки — нормализованный список и числительные с морфологией.

SQL скрипты баз размещены на github. Переходим, ищем в списке «words-russian-numerals»жмем download.

words-russian-numerals.sql.gz —  база числительных без морфологии, таблица numerals.

words-russian-numerals-morf.sql.gz — база числительных с морфологией, таблица numerals_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы numerals

«Нормализованный» список числительных. Всего — 106 слов.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных :
    • количественное числительное,
    • порядковое числительное,
    • собирательное числительное,
    • неопределённо-количественное числительное.

Описание таблицы numerals_morf

Содержит 1582 словоформы числительных русского языка. Склонения по родам, падежам, ед/мн число.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных.
  • plural, boolean — множественное число.
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.

Мало букафф? Читайте есчо !

База предикативов

Март 15, 2017 г.

База данных предикативов сформирована выборкой из базы морфологии слов русского языка. Мы в школе не изучали эту часть речи. Думаю, лингвисты тоже с трудом отличают предикативы то от междометий, то от наречий. SQL скрипт размещен на github. Переходим ...

Читать

Местоимения, база в виде sql скрипта

Март 15, 2017 г.

Местоимения извлечены из базы морфологии русского языка. Они могут склоняются по родам, падежам и образуют три видовые группы. Я не стал вдаваться в детали склонения, чтобы создавать "нормализованную" выборку. Возможно, сделаю это в следующем релизе на ...

Читать

Вводные слова, база данных

Март 14, 2017 г.

База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу. SQL скрипт размещен на github. Переходим, жмем download. words-russian-introductors.sql.gz ...

Читать

База данных русских слов - существительные

Март 13, 2017 г.

Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая - только существительные в именительном падеже ед. числа. Скачать SQL скрипт можно с github. ...

Читать
 

Комментарии к «Русские числительные в виде sql дампа»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: