Местоимения извлечены из базы морфологии русского языка. Они могут склоняются по родам, падежам и образуют три видовые группы. Я не стал вдаваться в детали склонения, чтобы создавать «нормализованную» выборку. Возможно, сделаю это в следующем релизе на GIT.
SQL скрипт размещен на github. Переходим, ищем words-russian-pronouns, жмем download.
words-russian-pronouns-morf.sql.gz — база местоимений, таблица pronouns_morf.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы pronouns_morf
Таблица хранит 1916 словоформ местоимений. Некоторые их них допускают склонение по падежам, роду, могут иметь ед/мн число.
- IID, int — суррогатный ключ, скопирован из основной базы.
- word, varchar[100] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- type, set(’прл’,’сущ’,’нар’,’мест’) — часть речи. В данной таблице вы встретите комбинации местоимение + прилагательное, местоимение + существительное, местоимение + наречие, характеризующие тип местоимения.
- plural, boolean — множественное число.
- gender, enum(‘муж’,’жен’,’ср’) — род.
- wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.
База данных
Данная запись опубликована в 15.03.2017 01:15 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 14, 2017 г.
База данных междометий получена из базы морфологии русского языка. Т.к. междометия не обладают какой либо морфологией, я сформировал только одну таблицу.
SQL скрипт размещены на github. Переходим, жмем download.
words-russian-interjections.sql.gz ...
Читать
Март 14, 2017 г.
Здесь представлены две таблицы, полученные из общей базы морфологии слов русского языка. Одна содержит все прилагательные в "нормальной форме", т.е. в мужского рода, ед. числа, именительного падежа. Вторая таблица содержит морфологию прилагательных, все ...
Читать
Март 15, 2017 г.
Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список.
SQL скрипт размещен на github. Переходим, ищем words-russian-particles, жмем download. ...
Читать
Март 14, 2017 г.
Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки - нормализованный список и числительные с морфологией.
SQL скрипты баз размещены на github. Переходим, ищем в списке "words-russian-numerals", жмем download. ...
Читать