База данных русских наречий, SQL скрипт

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы.

SQL скрипты размещены на github. Переходим, жмем download.

words-russian-adverbs.sql.gz — база наречий без морфологии, таблица adverbs.

words-russian-adverbs-morf.sql.gz — база наречий с морфологией, таблица adverbs_morf.

Внимание! Скрипты содержат «DROP if exists» для соответствующих таблиц.

Описание таблицы adverbs

«Нормализация» наречий состояла только в отбрасывании форм степени сравнения. Это позволило сократить число словоформ почти вдвое. Классификация оставлена. Всего — 8477 слов.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.

Описание таблицы adverbs_morf

Содержит 16056 словоформ наречий русского языка.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.
  • comp, enum(‘сравн’, ‘прев’) — качественные наречия, образованные от качественных прилагательных могут иметь степени сравнения.

Мало букафф? Читайте есчо !

Предлоги в русском языке, sql база всех предлогов

Март 15, 2017 г.

Список предлогов извлечен из базы морфологии русского языка. Предлоги, как оказалось, обладают кое-какой морфологией, некоторые из них склоняются по падежам. Я не смог четко сформулировать как происходит склонение, потому не стал создавать "нормализованную" ...

Читать

База прилагательных в виде MySQL скрипта

Март 14, 2017 г.

Здесь представлены две таблицы, полученные из общей базы морфологии слов русского языка. Одна содержит все прилагательные в "нормальной форме", т.е. в мужского рода, ед. числа, именительного падежа. Вторая таблица содержит морфологию прилагательных, все ...

Читать

База данных русских слов - существительные

Март 13, 2017 г.

Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая - только существительные в именительном падеже ед. числа. Скачать SQL скрипт можно с github. ...

Читать

Полный перечень союзов в русском языке

Март 14, 2017 г.

База данных по части речи "союзы" получена из общей базы морфологии слов русского языка. Т.к. союзы не обладают какой либо морфологией, то получилась одна таблица с перечнем слов. SQL скрипт размещены на github. Переходим, жмем download. words-russian-conjunctions.sql.gz ...

Читать
 

Комментарии к «База данных русских наречий, SQL скрипт»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: