База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу.
SQL скрипт размещен на github. Переходим, жмем download.
words-russian-introductors.sql.gz — база вводных слов, таблица introductors.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы introductors
Перечень содержит 210 слов и словосочетаний. Список, наверняка, не полный, т.к. определение слова или словосочетания как «вводного слова», зависит от контекста.
- IID, int — суррогатный ключ, скопирован из основной базы.
- word, varchar[100] — словоформа.
- code, int — код словоформы.
База данных
Данная запись опубликована в 14.03.2017 17:21 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 15, 2017 г.
Местоимения извлечены из базы морфологии русского языка. Они могут склоняются по родам, падежам и образуют три видовые группы. Я не стал вдаваться в детали склонения, чтобы создавать "нормализованную" выборку. Возможно, сделаю это в следующем релизе на ...
Читать
Март 14, 2017 г.
В данной базе объединены причастия и деепричастия. Таблицы получены из общей базы морфологии. В первой таблице содержится перечень "нормализованных" слов, а вторая база включает их морфологию.
SQL скрипты в виде дампа размещены на github. Переходим, ...
Читать
Март 14, 2017 г.
База данных по части речи "союзы" получена из общей базы морфологии слов русского языка. Т.к. союзы не обладают какой либо морфологией, то получилась одна таблица с перечнем слов.
SQL скрипт размещены на github. Переходим, жмем download.
words-russian-conjunctions.sql.gz ...
Читать
Март 15, 2017 г.
Список предлогов извлечен из базы морфологии русского языка. Предлоги, как оказалось, обладают кое-какой морфологией, некоторые из них склоняются по падежам. Я не смог четко сформулировать как происходит склонение, потому не стал создавать "нормализованную" ...
Читать