База данных русских наречий, SQL скрипт

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы.

SQL скрипты размещены на github. Переходим, жмем download.

words-russian-adverbs.sql.gz — база наречий без морфологии, таблица adverbs.

words-russian-adverbs-morf.sql.gz — база наречий с морфологией, таблица adverbs_morf.

Внимание! Скрипты содержат «DROP if exists» для соответствующих таблиц.

Описание таблицы adverbs

«Нормализация» наречий состояла только в отбрасывании форм степени сравнения. Это позволило сократить число словоформ почти вдвое. Классификация оставлена. Всего — 8477 слов.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.

Описание таблицы adverbs_morf

Содержит 16056 словоформ наречий русского языка.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.
  • comp, enum(‘сравн’, ‘прев’) — качественные наречия, образованные от качественных прилагательных могут иметь степени сравнения.

Мало букафф? Читайте есчо !

Полный перечень союзов в русском языке

Март 14, 2017 г.

База данных по части речи "союзы" получена из общей базы морфологии слов русского языка. Т.к. союзы не обладают какой либо морфологией, то получилась одна таблица с перечнем слов. SQL скрипт размещены на github. Переходим, жмем download. words-russian-conjunctions.sql.gz ...

Читать

Вводные слова, база данных

Март 14, 2017 г.

База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу. SQL скрипт размещен на github. Переходим, жмем download. words-russian-introductors.sql.gz ...

Читать

Список стран ISO 3166 в виде sql - дампа

Февраль 8, 2013 г.

Мне потребовался этот перечень для счета-фактуры. И как следовало из описания код и название страны должны соответствовать общероссийскому классификатору ...

Читать

База причастий и деепричастий русского языка

Март 14, 2017 г.

В данной базе объединены причастия и деепричастия. Таблицы получены из общей базы морфологии. В первой таблице содержится перечень "нормализованных" слов, а вторая база включает их морфологию. SQL скрипты в виде дампа размещены на github. Переходим, ...

Читать
 

Комментарии к «База данных русских наречий, SQL скрипт»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: