Русские числительные в виде sql дампа

Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки — нормализованный список и числительные с морфологией.

SQL скрипты баз размещены на github. Переходим, ищем в списке «words-russian-numerals»жмем download.

words-russian-numerals.sql.gz —  база числительных без морфологии, таблица numerals.

words-russian-numerals-morf.sql.gz — база числительных с морфологией, таблица numerals_morf.

Внимание! Скрипты содержат «DROP if exists» соответствующих таблиц.

Описание таблицы numerals

«Нормализованный» список числительных. Всего — 106 слов.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных :
    • количественное числительное,
    • порядковое числительное,
    • собирательное числительное,
    • неопределённо-количественное числительное.

Описание таблицы numerals_morf

Содержит 1582 словоформы числительных русского языка. Склонения по родам, падежам, ед/мн число.

  • IID, int — суррогатный ключ.
  • word, varchar[60] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(‘поряд’,’кол’,’собир’,’неопр’) — подтипы числительных.
  • plural, boolean — множественное число.
  • gender, enum(‘муж’,’жен’,’ср’) — род.
  • wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.

Мало букафф? Читайте есчо !

Морфологический словарь русского языка в виде SQL скрипта

Март 13, 2017 г.

Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт! Такой файл сложно вообще чем-либо ...

Читать

База данных русских наречий, SQL скрипт

Март 14, 2017 г.

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы. SQL скрипты размещены на github. Переходим, жмем download. words-russian-adverbs.sql.gz - ...

Читать

Предлоги в русском языке, sql база всех предлогов

Март 15, 2017 г.

Список предлогов извлечен из базы морфологии русского языка. Предлоги, как оказалось, обладают кое-какой морфологией, некоторые из них склоняются по падежам. Я не смог четко сформулировать как происходит склонение, потому не стал создавать "нормализованную" ...

Читать

База предикативов

Март 15, 2017 г.

База данных предикативов сформирована выборкой из базы морфологии слов русского языка. Мы в школе не изучали эту часть речи. Думаю, лингвисты тоже с трудом отличают предикативы то от междометий, то от наречий. SQL скрипт размещен на github. Переходим ...

Читать
 

Комментарии к «Русские числительные в виде sql дампа»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: