Сами по себе нормальные формы (НФ) не требуют введения суррогатных (искусственных) ключей, но на практике их часто используют при нормализации, особенно начиная со 2НФ и 3НФ. Давайте разберём подробнее.
Что такое суррогатный ключ?
Суррогатный ключ (или искусственный, технический ключ) — это поле, которое не несёт бизнес-смысла, но используется как уникальный идентификатор. Например, id
в таблице студентов:
1 2 3 4 |
id | имя | группа ---+---------+-------- 1 | Иванов | ИТ-101 2 | Петрова | ИТ-102 |
Нормальные формы и суррогатные ключи
Нормальная форма | Требует ли суррогатный ключ? | Комментарий |
---|---|---|
1НФ | Нет | Можно использовать составной ключ |
2НФ | Нет | Главное — зависимость от всего составного ключа |
3НФ | Нет | Главное — отсутствие транзитивных зависимостей |
4НФ, 5НФ, 6НФ | Нет | Формально не требуют, но с составными ключами становится неудобно |
Важно отметить, что суррогатный ключ не заменяет нормализацию. Иногда ошибочно считают: «у нас есть id
— всё нормализовано» — это не так. Суррогатный ключ — лишь техническое удобство. Он не влияет на зависимость атрибутов, которую проверяют при нормализации.
Почему на практике суррогатные ключи используют почти всегда?
Производительность: целочисленные id
быстрее индексируются и сравниваются.
Изменения атрибутов не влияют на ключ. Если фамилия ‘Иванов’ используется как ключ, но вдруг потребовалось её изменить, например, ‘Иванов’, оказался ‘Иванченко’, то придется менять не только сам первичный ключ и но и все места, где он был задействован как внешний ключ.
В примере со студентами, мы можем иметь ситуацию с однофамильцами, например двух Ивановых на курсе. Тогда, в качестве уникального ключа, придется использовать фамилию + номер группы, составной ключ. Но это не решит проблему полностью, ведь оба Ивановых могут быть студентами одной группы.
Все подобные кейсы решаются введением суррогатный ключей.
Хотя нормальные формы не требуют введения суррогатных ключей, на практике они часто применяются для упрощения связей, улучшения читаемости SQL-запросов и ускорения операций с БД. Главное — понимать, что нормализация проверяет семантику зависимостей, а не структуру ключей.