General error 1366 incorrect string value…

Сегодня зачищал PDOException: SQLSTATE: General error: 1366. Происходила ошибка при записи в базу UTF строк, содержащих неизвестные базе данных UTF символы. По логам было ясно, что и куда пытается сохранить программа.

Путей решения маячило целых два:

  • «научить» базу понимать эти символы,
  • убирать символы, вызывающие проблему.

Но сначала хотелось разобраться, чем одни UTF символы отличаются от других. Я не вдавался в подробности того как кодируется UTF, какие они бывают.

Оказалось, что UTF содержит символы, кодируемые последовательностью от 1 до 4 байт. Вот как они шифруются в бинарном коде:

В моем случае проблемы с базой вызвали 4х байтные символы.

«Учим» базу

Можно поменять тип поля на BLOB, чтобы база не производила проверку валидности UTF. А можно проверить всю цепочку соединения с базой, чтобы переключиться на поддержку кодировки utf8mb4.

Лично мне, вся эта псевдографика, которая засунута в 4х-байтные таблицы utf, совершенна не нужна, потому я пойду вторым путем.

Убираем 4х-байтные символы UTF из текста

Для PHP получился вот такой шаблон для замены:

Если вдруг понадобится «почикать» 3х байтные, вот пример регулярного выражения и для него:

Мало букафф? Читайте есчо !

Увеличить timeout в Mocha

Январь 5, 2023 г.

Тайм-аут, установленный в мокке по умолчанию равен 2сек, чего вполне достаточно для большинства тестов. Если вам не хватает, то используйте при вызове дополнительный параметр --timeout, время задаётся в мс, например, 10 секунд: [crayon-6910fa52b4e61200439527/] ...

Читать

Арифметические операции в консоли UNIX

Сентябрь 12, 2018 г.

Как произвести в bash/sh простейшие вычисления? Давайте рассмотрим несколько примеров. Операции с целыми числами Пока вас интересуют целочисленные вычисления, вы можете пользоваться командами встроенными в bash. Вот 6 арифметических команд, которые ...

Читать

Суперкомпьютеры

Июль 27, 2016 г.

Размышления о мощных компьютерах возникли на почве прочтения статьи о намерениях Китая к 2020 году построить вычислительную систему с вычислительной мощностью ...

Читать

Вставляем объект views в нужное место шаблона средствами PHP

Сентябрь 9, 2016 г.

Мощный, всепоглощающий, великий и ужасный модуль VIEWS. Очень коварный, он толкает программиста с пути "только хардкор" и разработки на PHP на скользкую ...

Читать
 

Комментарии к «General error 1366 incorrect string value…»

Понравилась статья? Есть вопросы? - пишите в комментариях.



Комментарий: