Список предлогов извлечен из базы морфологии русского языка. Предлоги, как оказалось, обладают кое-какой морфологией, некоторые из них склоняются по падежам. Я не смог четко сформулировать как происходит склонение, потому не стал создавать «нормализованную» выборку.
SQL скрипт размещен на github. Переходим, ищем words-russian-prepositions-morf, жмем download.
words-russian-prepositions-morf.sql.gz — база предлогов, таблица prepositions_morf.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы prepositions_morf
Таблица хранит 411 предлогов. Некоторые допускают склонение по падежам.
- IID, int — суррогатный ключ, скопирован из основной базы.
- word, varchar[100] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.
База данных
Данная запись опубликована в 15.03.2017 00:27 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 14, 2017 г.
База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу.
SQL скрипт размещен на github. Переходим, жмем download.
words-russian-introductors.sql.gz ...
Читать
Март 13, 2017 г.
Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт!
Такой файл сложно вообще чем-либо ...
Читать
Март 14, 2017 г.
Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки - нормализованный список и числительные с морфологией.
SQL скрипты баз размещены на github. Переходим, ищем в списке "words-russian-numerals", жмем download. ...
Читать
Март 13, 2017 г.
Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая - только существительные в именительном падеже ед. числа.
Скачать SQL скрипт можно с github. ...
Читать