Местоимения извлечены из базы морфологии русского языка. Они могут склоняются по родам, падежам и образуют три видовые группы. Я не стал вдаваться в детали склонения, чтобы создавать «нормализованную» выборку. Возможно, сделаю это в следующем релизе на GIT.
SQL скрипт размещен на github. Переходим, ищем words-russian-pronouns, жмем download.
words-russian-pronouns-morf.sql.gz — база местоимений, таблица pronouns_morf.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы pronouns_morf
Таблица хранит 1916 словоформ местоимений. Некоторые их них допускают склонение по падежам, роду, могут иметь ед/мн число.
- IID, int — суррогатный ключ, скопирован из основной базы.
 
- word, varchar[100] — словоформа.
 
- code, int — код словоформы.
 
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
 
- type, set(’прл’,’сущ’,’нар’,’мест’) — часть речи. В данной таблице вы встретите комбинации местоимение + прилагательное, местоимение + существительное, местоимение + наречие, характеризующие тип местоимения.
 
- plural, boolean — множественное число.
 
- gender, enum(‘муж’,’жен’,’ср’) — род.
 
- wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’) — падежи.
 
					
					База данных
					
						
							Данная запись опубликована в 15.03.2017  01:15 и размещена в рубрике На первой полосе.
																Вы можете перейти в конец страницы и оставить ваш комментарий.
							
						
					
					
					
				Мало букафф? Читайте есчо !
					
						
						Март 15, 2017 г.
						
						База данных предикативов сформирована выборкой из базы морфологии слов русского языка. Мы в школе не изучали эту часть речи. Думаю, лингвисты тоже с трудом отличают предикативы то от междометий, то от наречий.
SQL скрипт размещен на github. Переходим ...
						Читать
					 
					
						
						Март 14, 2017 г.
						
						Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки - нормализованный список и числительные с морфологией.
SQL скрипты баз размещены на github. Переходим, ищем в списке "words-russian-numerals", жмем download. ...
						Читать
					 
					
						
						Март 13, 2017 г.
						
						Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая - только существительные в именительном падеже ед. числа.
Скачать SQL скрипт можно с github. ...
						Читать
					 
					
						
						Март 14, 2017 г.
						
						База данных междометий получена из базы морфологии русского языка. Т.к. междометия не обладают какой либо морфологией, я сформировал только одну таблицу.
SQL скрипт размещены на github. Переходим, жмем download.
words-russian-interjections.sql.gz ...
						Читать