Список предлогов извлечен из базы морфологии русского языка. Предлоги, как оказалось, обладают кое-какой морфологией, некоторые из них склоняются по падежам. Я не смог четко сформулировать как происходит склонение, потому не стал создавать «нормализованную» выборку.
SQL скрипт размещен на github. Переходим, ищем words-russian-prepositions-morf, жмем download.
words-russian-prepositions-morf.sql.gz — база предлогов, таблица prepositions_morf.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы prepositions_morf
Таблица хранит 411 предлогов. Некоторые допускают склонение по падежам.
- IID, int — суррогатный ключ, скопирован из основной базы.
- word, varchar[100] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.
База данных
Данная запись опубликована в 15.03.2017 00:27 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 13, 2017 г.
Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая - только существительные в именительном падеже ед. числа.
Скачать SQL скрипт можно с github. ...
Читать
Март 14, 2017 г.
База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу.
SQL скрипт размещен на github. Переходим, жмем download.
words-russian-introductors.sql.gz ...
Читать
Март 15, 2017 г.
Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список.
SQL скрипт размещен на github. Переходим, ищем words-russian-particles, жмем download. ...
Читать
Март 14, 2017 г.
В данной базе объединены причастия и деепричастия. Таблицы получены из общей базы морфологии. В первой таблице содержится перечень "нормализованных" слов, а вторая база включает их морфологию.
SQL скрипты в виде дампа размещены на github. Переходим, ...
Читать