База данных по части речи «союзы» получена из общей базы морфологии слов русского языка. Т.к. союзы не обладают какой либо морфологией, то получилась одна таблица с перечнем слов.
SQL скрипт размещены на github. Переходим, жмем download.
words-russian-conjunctions.sql.gz — база союзов, таблица conjunctions.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы conjunctions
База содержит 322 союза. Наряду с простыми союзами вроде «и», «но», тут вы найдете сложные союзы вроде «в результате того что» и «с таким расчетом, чтоб». Т.е. они включают в себя последовательность из нескольких слов и даже знаки препинания.
- IID, int — суррогатный ключ
- word, varchar[100] — словоформа.
- code, int — код словоформы.
База данных
Данная запись опубликована в 14.03.2017 17:05 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 15, 2017 г.
База данных предикативов сформирована выборкой из базы морфологии слов русского языка. Мы в школе не изучали эту часть речи. Думаю, лингвисты тоже с трудом отличают предикативы то от междометий, то от наречий.
SQL скрипт размещен на github. Переходим ...
Читать
Март 13, 2017 г.
Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт!
Такой файл сложно вообще чем-либо ...
Читать
Март 14, 2017 г.
База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу.
SQL скрипт размещен на github. Переходим, жмем download.
words-russian-introductors.sql.gz ...
Читать
Март 15, 2017 г.
Местоимения извлечены из базы морфологии русского языка. Они могут склоняются по родам, падежам и образуют три видовые группы. Я не стал вдаваться в детали склонения, чтобы создавать "нормализованную" выборку. Возможно, сделаю это в следующем релизе на ...
Читать