База данных русских наречий, SQL скрипт

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы.

SQL скрипты размещены на github. Переходим, жмем download.

words-russian-adverbs.sql.gz — база наречий без морфологии, таблица adverbs.

words-russian-adverbs-morf.sql.gz — база наречий с морфологией, таблица adverbs_morf.

Внимание! Скрипты содержат «DROP if exists» для соответствующих таблиц.

Описание таблицы adverbs

«Нормализация» наречий состояла только в отбрасывании форм степени сравнения. Это позволило сократить число словоформ почти вдвое. Классификация оставлена. Всего — 8477 слов.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.

Описание таблицы adverbs_morf

Содержит 16056 словоформ наречий русского языка.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.
  • comp, enum(‘сравн’, ‘прев’) — качественные наречия, образованные от качественных прилагательных могут иметь степени сравнения.

Написать комментарий

Мало букафф? Читайте есчо !

База причастий и деепричастий русского языка

Март 14, 2017 г.

В данной базе объединены причастия и деепричастия. Таблицы получены из общей базы морфологии. В первой таблице содержится перечень "нормализованных" слов, а вторая база включает их морфологию. SQL скрипты в виде дампа размещены на github. Переходим, ...

Читать

Вводные слова, база данных

Март 14, 2017 г.

База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу. SQL скрипт размещен на github. Переходим, жмем download. words-russian-introductors.sql.gz ...

Читать

 

Комментарии к «База данных русских наречий, SQL скрипт»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: