Список частиц извлечен из полной базы морфологии слов русского языка. Никаких изменений в морфологии частицы не предполагают, потому получился простой список.
SQL скрипт размещен на github. Переходим, ищем words-russian-particles, жмем download.
words-russian-particles.sql.gz — база частиц, таблица particles.
Внимание! Скрипт содержит «DROP TABLE if exists».
Описание таблицы particles
База содержит 488 слов и словосочетаний. Список, возможно, не полный, т.к. определение слова или словосочетания как «частицы», зависит от контекста.
- IID, int — суррогатный ключ, скопирован из основной базы.
- word, varchar[100] — словоформа.
- code, int — код словоформы.
База данных
Данная запись опубликована в 15.03.2017 00:06 и размещена в рубрике На первой полосе.
Вы можете перейти в конец страницы и оставить ваш комментарий.
Мало букафф? Читайте есчо !
Март 14, 2017 г.
Здесь представлены две таблицы, полученные из общей базы морфологии слов русского языка. Одна содержит все прилагательные в "нормальной форме", т.е. в мужского рода, ед. числа, именительного падежа. Вторая таблица содержит морфологию прилагательных, все ...
Читать
Март 14, 2017 г.
База данных «вводных слов» извлечена из базы морфологии слов русского языка. Вводные слова не обладают какой либо морфологией, я сформировал только одну таблицу.
SQL скрипт размещен на github. Переходим, жмем download.
words-russian-introductors.sql.gz ...
Читать
Март 13, 2017 г.
Нашел словари на сайте speakrus.ru. Все круто, но почему то распространяется в виде текстовых файлов. К примеру, морфологический словарь из 4 159 394 словоформ для 142 792 лемм - это текстовая портянка 220 мегабайт!
Такой файл сложно вообще чем-либо ...
Читать
Март 14, 2017 г.
Числительные извлечены из базы морфологии слов русского языка. Произведено две выборки - нормализованный список и числительные с морфологией.
SQL скрипты баз размещены на github. Переходим, ищем в списке "words-russian-numerals", жмем download. ...
Читать