Местоимения извлечены из базы морфологии русского языка. Они могут склоняются по родам, падежам и образуют три видовые группы. Я не стал вдаваться в детали склонения, чтобы создавать «нормализованную» выборку. Возможно, сделаю это в следующем релизе на GIT.
SQL скрипт размещен на github. Переходим, ищем words-russian-pronouns, жмем download.
words-russian-pronouns-morf.sql.gz — база местоимений, таблица pronouns_morf.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы pronouns_morf
Таблица хранит 1916 словоформ местоимений. Некоторые их них допускают склонение по падежам, роду, могут иметь ед/мн число.
- IID, int — суррогатный ключ, скопирован из основной базы.
- word, varchar[100] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- type, set(’прл’,’сущ’,’нар’,’мест’) — часть речи. В данной таблице вы встретите комбинации местоимение + прилагательное, местоимение + существительное, местоимение + наречие, характеризующие тип местоимения.
- plural, boolean — множественное число.
- gender, enum(‘муж’,’жен’,’ср’) — род.
- wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.
База данных
Данная запись опубликована в 15.03.2017 01:15 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 14, 2017 г.
Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки - нормализованный список и числительные с морфологией.
SQL скрипты баз размещены на github. Переходим, ищем в списке "words-russian-numerals", жмем download. ...
Читать
Февраль 8, 2013 г.
Мне потребовался этот перечень для счета-фактуры. И как следовало из описания код и название страны должны соответствовать общероссийскому классификатору ...
Читать
Март 14, 2017 г.
База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу.
SQL скрипт размещен на github. Переходим, жмем download.
words-russian-introductors.sql.gz ...
Читать
Март 14, 2017 г.
База наречий получена из общей базы морфологии слов русского языка. Она состоит их двух таблиц : только нормализованные наречия и наречия + словоформы.
SQL скрипты размещены на github. Переходим, жмем download.
words-russian-adverbs.sql.gz - ...
Читать