Поиск дубля в массиве на PHP

Оказывается, очень частая задача в тестовых заданиях соискателей — это поиск дубля в массиве. В зависимости от нюансов конкретного задания, могут просить:

найти все дубли или один единственный дубль;
использовать в решении самый быстрый алгоритм;
найти вообще все повторяющиеся варианты.

Я рассмотрю здесь частное решение (целых три варианта), которое вы подкрутите для своего случая. Это поиск единственного дубля в массиве чисел.

Итак, пусть $A — произвольный массив чисел. Напишем функцию, которая ищет близнеца или возвращает FALSE.

Скоростной вариант

Самый первый и самый быстрый вариант поиска — это положиться только на функции PHP без каких либо свои циклов и ветвлений.

function array_find_twins($A) {
   $N = array_flip(array_count_values($A)); 
   return isset($N[2]) ? $N[2] : FALSE;
}

function array_find_twins($A) {

$N = array_flip(array_count_values($A));

return isset($N[2]) ? $N[2] : FALSE;

}

Мы посчитали число значений, а потом просто вывернули массив. Если дублей было несколько — останется только один. Если нужно другое число повторений — используйте другой ключ на выходе (не 2, а 3, 4..).

PHP гораздо быстрее работает внутри собственных откомпилированных функций, нежели с вашими алгоритмами, какими бы они не были гениальными.

Вариант с сортировкой

Здесь мы сортируем массив, чтобы потом «вручную» просканировать его и найти рядом стоящих близнецов.

Так мы обнаружим любое повторяющееся произвольное число раз значение (т.е. тройняшек, и т.д.)

function array_find_twins2($A) {
   sort($A, SORT_NUMERIC);
   $last = -1;
   foreach($A as $value) {
      if ($last == $value) {
         return $value;
      }
      $last = $value;
   }
   return FALSE;
}

function array_find_twins2($A) {

sort($A, SORT_NUMERIC);

$last = -1;

foreach($A as $value) {

if ($last == $value) {

return $value;

}

$last = $value;

}

return FALSE;

}

Если по условиям задачи массив уже отсортирован, то sort() можно убрать. Останется сканер массива, быстродействие которого линейно зависит от размеров массива.

В среднем, этот вариант в 2-3 раза медленнее предыдущего (на диапазоне от 1к до 100 к элементов).

Перекладываем из одной корзины в другую

Самый тормозной, неэффективный из трех.

Мы перебираем вх. массив ($A), складывая элементы в другой ($B). Но если в нем ($B) уже есть искомое значение, то вуаля! мы нашли близнеца.

function array_find_twins3($A) {
   $B = array();
   $last = -1;
   foreach($A as $value) {
      if (in_array($value, $B)) return $value;
      $B[] = $value;
   }
   return FALSE;
}

function array_find_twins3($A) {

$B = array();

$last = -1;

foreach($A as $value) {

if (in_array($value, $B)) return $value;

$B[] = $value;

}

return FALSE;

}

В некоторых случаях, такая конструкция бывает востребована. Например, когда вы должны провести какие вычисления с каждым элементом, а потом уже принимать решение об эквивалентности.

Этот вариант на 2 порядка хуже первого решения.

Если у вас есть другие варианты — присылайте :).

Написать комментарий

Данная запись опубликована в 20.06.2017 23:26 и размещена в рубрике PHP. Вы можете перейти в конец страницы и оставить ваш комментарий.

Мало букафф? Читайте есчо !

Конвертируем HTML в PDF

Ноябрь 6, 2012 г.

Есть разные пути, простые и сложные (вплоть до написания своей PHP библиотеки для конвертации HTML в PDF). Но мы трудным путем не пойдем, а воспользуемся готовым сервером, выполняющим данный экспорт. Для самых ленивых приведу пример его использования ...

Читать

Создание файла на Google Drive через API

Ноябрь 10, 2023 г.

Работа с API гугл - это ещё та головоломка, тут переплетены и вечно обновляемые версии API, не прозрачные процедуры авторизации и запутанная консоль разработчика. ...

Читать

Грузим картинку в поле image в Drupal

Март 1, 2016 г.

Из кода программы на PHP мы попытаемся загрузить картинку в публикацию сайта на Drupal 7. Здесь описана логика и показан код всех операций. Постановка задачи Эта задача является частью задачи импорта статьи, извлеченной из HTML кода веб-страницы ...

Читать

PHP код для калькулятора боёв Dragons of Atlantis

Июль 3, 2012 г.

Выкладываю php код, по просьбе Blagtoof. Забавно, что это кому то может быть нужно. :) А мне не жалко. Забросил по понятным причинам саму игру. Скачать как файл (download php code as text file). [crayon-6a6fc90614caf629003057/]

Читать

Комментарии к «Поиск дубля в массиве на PHP»

Понравилась статья? Есть вопросы? - пишите в комментариях.

Много комментариев в “Поиск дубля в массиве на PHP”

Никита:

23 января 2018 в 02:44

Есть куда более простой способом.
$array = array (1,2,3,3,3,2);
$array_uniq = array_unique($array);

print_r(array_diff_key($array, $array_uniq));

Ответить
- admin:
  
  25 января 2018 в 16:38
  
  Спасибо, Никита. Тоже годный пример.
  Хотя первый вариант по-проще будет.
  И тут, видимо, ещё можно добавить как последний штрих — array_unique().
  
  function array_find_twins_Nikita_remix($A) {
  return array_unique(array_diff_key($A, array_unique($A)));
  }
  
  Ответить

Имя (обязательно)	Е-майл (не будет опубликован на сайте, обязательно для заполнения)
Комментарий: