Здесь представлены две выборки из общей базы морфологии слов русского языка. Одна выборка включает в себя существительные вместе со словоформами, а другая — только существительные в именительном падеже ед. числа.
Скачать SQL скрипт можно с github. Переходим, жмем download.
words-russian-nouns.sql.gz — база существительных без морфологии, таблица nouns.
words-russian-nouns-morf.sql.gz — база существительных с морфологией, таблица nouns_morf.
Описание таблицы nouns
Содержит 65500 существительных в именительном падеже, ед. числе.
- IID, int — суррогатный ключ
- word, varchar[60] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- gender, enum(‘муж’,’жен’,’ср’,’общ’) — род
- wcase, enum(‘им’) — только именительный падеж или NULL для слов, которые не имеют падежных форм. Последние — это в своём большинстве заимствованные иностранные слова.
- soul, boolean — признак одушевленности.
Описание таблицы nouns_morf
Содержит 767,694 словоформ существительных русского языка, в том числе во множественном числе.
- IID, int — суррогатный ключ
- word, varchar[60] — словоформа.
- code, int — код словоформы.
- code_parent, int — код родителя словоформы, согласно иерархии в исходном файле.
- plural, boolean — множественное число
- gender, enum(‘муж’,’жен’,’ср’,’общ’) — род
- wcase, enum(‘им’,’род’,’дат’,’вин’,’тв’,’пр’,’зват’,’парт’,’мест’, ’счет’) — 10 падежей. Кроме шести хорошо известных из школьного курса: именительного, родительного, дательного, винительного, творительного и предложного, есть ещё 4 падежа — звательный, счетный падеж (счетная форма), партитив и местный падеж — локатив.
- soul, boolean — признак одушевленности.
К сожалению, не удалось открыть файл
Там много файлов, какой из них?
Я в шоке, кто-то ведь явно пол-жизни потерял, чтобы собрать все слова в базу данных
Люди годы тратят на спидраны игр, а тут хоть что то потенциально полезное для общества :)
в коротком запросе отсутствуют существительные, у которых только множественное число, например ножницы
фантастический труд!
подсажите, пожалуйста, фронтендеру, как добраться до сокровищ?
т.е. — где почитать, о том, как перенести данные в локальную базу?
спасибо
Это SQL (MySQL) скрипт.
1. Создайте базу,
2. скачайте файлы скрипта,
3. выполните скрипт на созданной базе.