База данных русских наречий, SQL скрипт

База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы.

SQL скрипты размещены на github. Переходим, жмем download.

words-russian-adverbs.sql.gz — база наречий без морфологии, таблица adverbs.

words-russian-adverbs-morf.sql.gz — база наречий с морфологией, таблица adverbs_morf.

Внимание! Скрипты содержат «DROP if exists» для соответствующих таблиц.

Описание таблицы adverbs

«Нормализация» наречий состояла только в отбрасывании форм степени сравнения. Это позволило сократить число словоформ почти вдвое. Классификация оставлена. Всего — 8477 слов.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.

Описание таблицы adverbs_morf

Содержит 16056 словоформ наречий русского языка.

  • IID, int — суррогатный ключ
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.
  • code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
  • type_sub, enum(’обст’,’опред’,’вопр’) — подтипы наречий, классификация по значению — обстоятельственные, определительные и вопросительные.
  • type_ssub, enum(‘кач’,’спос’,’степ’,’места’,’напр’,’врем’,’цель’,’причин’) — под-подтипы классификации — способа и образа действия, качественные, места действия, цели, причины и времени.
  • comp, enum(‘сравн’, ‘прев’) — качественные наречия, образованные от качественных прилагательных могут иметь степени сравнения.

Мало букафф? Читайте есчо !

Частицы в русском языке, скачать как SQL дамп

Март 15, 2017 г.

Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список. SQL скрипт размещен на github. Переходим, ищем words-russian-particles,  жмем download. ...

Читать

Полный перечень союзов в русском языке

Март 14, 2017 г.

База данных по части речи "союзы" получена из общей базы морфологии слов русского языка. Т.к. союзы не обладают какой либо морфологией, то получилась одна таблица с перечнем слов. SQL скрипт размещены на github. Переходим, жмем download. words-russian-conjunctions.sql.gz ...

Читать

База данных русских слов - существительные

Март 13, 2017 г.

Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая - только существительные в именительном падеже ед. числа. Скачать SQL скрипт можно с github. ...

Читать

Список стран ISO 3166 в виде sql - дампа

Февраль 8, 2013 г.

Мне потребовался этот перечень для счета-фактуры. И как следовало из описания код и название страны должны соответствовать общероссийскому классификатору ...

Читать
 

Комментарии к «База данных русских наречий, SQL скрипт»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: