База данных по части речи «союзы» получена из общей базы морфологии слов русского языка. Т.к. союзы не обладают какой либо морфологией, то получилась одна таблица с перечнем слов.
SQL скрипт размещены на github. Переходим, жмем download.
words-russian-conjunctions.sql.gz — база союзов, таблица conjunctions.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы conjunctions
База содержит 322 союза. Наряду с простыми союзами вроде «и», «но», тут вы найдете сложные союзы вроде «в результате того что» и «с таким расчетом, чтоб». Т.е. они включают в себя последовательность из нескольких слов и даже знаки препинания.
- IID, int — суррогатный ключ
- word, varchar[100] — словоформа.
- code, int — код словоформы.
База данных
Написать комментарий
Данная запись опубликована в 14.03.2017 17:05 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 13, 2017 г.
Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт!
Такой файл сложно вообще чем-либо ...
Читать
Март 14, 2017 г.
База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы.
SQL скрипты размещены на github. Переходим, жмем download.
words-russian-adverbs.sql.gz - ...
Читать