Частицы в русском языке, скачать как SQL дамп

Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список.

SQL скрипт размещен на github. Переходим, ищем words-russian-particles,  жмем download.

words-russian-particles.sql.gz — база частиц, таблица particles.

Внимание! Скрипт содержит «DROP TABLE if exists».

Описание таблицы particles

База содержит 488 слов и словосочетаний. Список, возможно, не полный, т.к. определение слова или словосочетания как «частицы», зависит от контекста.

  • IID, int — суррогатный ключ, скопирован из основной базы.
  • word, varchar[100] — словоформа.
  • code, int — код словоформы.

Мало букафф? Читайте есчо !

Морфологический словарь русского языка в виде SQL скрипта

Март 13, 2017 г.

Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт! Такой файл сложно вообще чем-либо ...

Читать

База предикативов

Март 15, 2017 г.

База данных предикативов сформирована выборкой из базы морфологии слов русского языка. Мы в школе не изучали эту часть речи. Думаю, лингвисты тоже с трудом отличают предикативы то от междометий, то от наречий. SQL скрипт размещен на github. Переходим ...

Читать

База междометий, встречающихся в русском языке, в виде скрипта sql

Март 14, 2017 г.

База данных междометий получена из базы морфологии русского языка. Т.к. междометия не обладают какой либо морфологией, я сформировал только одну таблицу. SQL скрипт размещены на github. Переходим, жмем download. words-russian-interjections.sql.gz ...

Читать

Предлоги в русском языке, sql база всех предлогов

Март 15, 2017 г.

Список предлогов извлечен из базы морфологии русского языка. Предлоги, как оказалось, обладают кое-какой морфологией, некоторые из них склоняются по падежам. Я не смог четко сформулировать как происходит склонение, потому не стал создавать "нормализованную" ...

Читать
 

Комментарии к «Частицы в русском языке, скачать как SQL дамп»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: