База данных русских наречий, SQL скрипт

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы.

SQL скрипты размещены на github. Переходим, жмем download.

words-russian-adverbs.sql.gz — база наречий без морфологии, таблица adverbs.

words-russian-adverbs-morf.sql.gz — база наречий с морфологией, таблица adverbs_morf.

Внимание! Скрипты содержат «DROP if exists» для соответствующих таблиц.

Описание таблицы adverbs

«Нормализация» наречий состояла только в отбрасывании форм степени сравнения. Это позволило сократить число словоформ почти вдвое. Классификация оставлена. Всего — 8477 слов.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.

Описание таблицы adverbs_morf

Содержит 16056 словоформ наречий русского языка.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.
  • comp, enum(‘сравн’, ‘прев’) — качественные наречия, образованные от качественных прилагательных могут иметь степени сравнения.

Написать комментарий

Мало букафф? Читайте есчо !

База предикативов

Март 15, 2017 г.

База данных предикативов сформирована выборкой из базы морфологии слов русского языка. Мы в школе не изучали эту часть речи. Думаю, лингвисты тоже с трудом отличают предикативы то от междометий, то от наречий. SQL скрипт размещен на github. Переходим ...

Читать

Вводные слова, база данных

Март 14, 2017 г.

База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу. SQL скрипт размещен на github. Переходим, жмем download. words-russian-introductors.sql.gz ...

Читать

 

Комментарии к «База данных русских наречий, SQL скрипт»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: