Поиск одинаковых данных в ячейках excel. Поиск и удаление дубликатов в Microsoft Excel

В этом материале речь пойдёт об инструментах выявления дублирующихся фото. В частности, сегодня в нашем обзоре побывают сразу шесть программ для поиска дубликатов фотографий на компьютере под управлением Windows. Мы сравним и выберем среди них лучшие и самые быстрые.

Поиск одинаковых фотографий: программы и их сравнение

Причин востребованности программ для поиска одинаковых фото на компьютере может быть несколько, например:

  • Ваша коллекция могла разрастись настолько, что дубликаты уже занимают немало места;
  • Вам нужен инструмент, который найдёт одинаковые или похожие фотографии, избавив вас от необходимости просматривать эти изображения самостоятельно.

В нашей подборке нашлось место для шести интересных программ, четыре из которых распространяются бесплатно. Ниже по тексту мы:

  1. Расскажем о каждой из этих программ для поиска и поможем вам быстрее сориентироваться в их интерфейсе;
  2. Проведём сравнение всех программ, в котором посмотрим, как они справляются с поиском одинаковых изображений при их лёгком видоизменении;
  3. Проверим насколько программы хорошо могут справиться с большим набором фото весом в несколько гигабайт.

Найти дубликаты фотографий с помощью Image Comparer

Первая программа в нашем обзоре, ищущая дубликаты фото, называется Image Comparer. Её сильные стороны: неплохая функциональность и переведённый на русский язык интерфейс, включая подробную справочную информацию.

Теперь о недостатках. Первый – программа не бесплатная. Впрочем, стоимость лицензии составляет гуманные 350 рублей (хотя на сайте почему-то указана цифра 500). Вдобавок первые 30 дней вы можете использовать Image Comparer бесплатно.

Второй негативный момент заключается в лёгкой запутанности, которая может смутить неопытного пользователя. Например, для того чтобы провести поиск в рамках одной папки (в которую могут быть вложены и другие) вам нужно нажать на кнопку «создать галерею» и выбрать нужный каталог, в котором будет проводиться сканирование.

Далее вам тут же предложат дать имя и сохранить файл создаваемой галереи в любое удобное место (этот файл нужен будет самой программе). Как только это будет сделано, перед вами в виде списка или миниатюр откроется перечень всех изображений в указанной папке и её подпапках:

Кнопки, отмеченные стрелками, запускают поиск дубликатов. Первая кнопка – поиск в рамках одной галереи (выбранной вами папки), вторая кнопка чуть правее – в рамках нескольких галерей. Мы пошли по первому варианту.

Следом программа предложила создать ещё один служебный файл, в котором будут сохраняться результаты для дальнейшего удобного к ним доступа. Собственно, создание файла для галереи и вот этого файла с результатами поиска как раз и может немного запутать неопытного юзера. Впрочем, далее всё уже просто. Перед вами появятся найденные дубликаты:

Их можно просматривать в виде миниатюр или же, щёлкнув по вкладке «пары изображений», перейти к виду, где фотографии будут уже сравниваться между собой:

Ползунок по центру позволяет регулировать порог схожести изображений. Установите 100% и перед вами останется только список идеально похожих друг на друга одинаковых картинок. Более низкие значения отобразят лишь схожие фотографии.

В настройках можно увидеть огромный список форматов от базовых JPG и PNG до более экзотических, с которыми работает программа. Форматы можно добавлять и исключить из поиска. Также можно настроить учёт отражённых и перевёрнутых картинок.

  • Программа Image Comparer. Официальный сайт ;
  • Язык: русский;

Нахождение одинаковых фотографий в три клика с VisiPics

Следующая программа – VisiPics. В отличие от рассмотренной выше Image Comparer, VisiPics является бесплатным приложением, также специализирующемся на дубликатах фото. Увы, локализации на русский здесь нет, но расстраиваться по этому поводу точно не стоит: всё очень просто и предельно понятно.

С помощью боковой панельки навигации (мы обвели её в рамку) выберите нужный каталог. Далее нажмите стрелочку со значком «+», чтобы добавить эту папку в список, по которому будет вестись поиск. При желании таким же образом вы можете выбрать ещё несколько папок. Наконец, третьим шагом нажмите кнопку Play, чтобы запустить процесс нахождения дубликатов.

Справа от неё располагается специальный ползунок, где вы можете настраивать уровень «внимательности» программы. В случае установленного по умолчанию базового уровня VisiPics обнаружила для нас лишь две группы дубликатов, одна из которых состояла из трёх изображений, а другая из двух:

Это те изображения, которые программа считает практически идентичными дубликатами. Однако если вы понизите ползунок до уровня Loose, то находиться будут и просто похожие друг на друга изображения. В нашем случае при установке Loose вместо Basic приложение нашло ещё четыре (в итоговом тесте ниже – 5) группы дубликатов, а одну из двух уже найденных дополнило ещё одной картинкой:

Дополнительных опций у программы относительно немного. Здесь можно настроить поиск в подпапках (по умолчанию он включён), отображение скрытых папок, учёт фотографий, повёрнутых на 90 градусов. На вкладке loader можно попросить VisiPics игнорировать мелкие файлы или, наоборот, картинки в слишком большом разрешении. Последнее важно для скорости.

  • Программа VisiPics. Официальный сайт ;
  • Язык: английский;
  • Распространение: бесплатно.

Программа для поиска дубликатов Awesome Duplicate Photo Finder

Если вы ищете именно предельно простую программу для качественного поиска дублирующихся фото и изображений, в которой было бы элементарно легко разобраться, то обратите внимание на Awesome Duplicate Photo Finder. Интерфейс здесь на английском, но он настолько прост, что разберётся в нём каждый.

С помощью кнопки «+» укажите нужный для поиска каталог или несколько каталогов, после чего нажмите Start Search и по ним начнётся поиск. Опция Scan Subdirectories по умолчанию включена и отвечает за поиск в подпапках. Со своими задачами программа справляется, находя как весьма похожие:

Так и чуть более отличающиеся между собой картинки:

В настройках программы вы можете задать соответствие в 100%, если вам нужны исключительно абсолютно одинаковые фотографии.

Самих настроек, как видите, немного. Пожалуй, самое печальное, что работает программа всего с пятью основными форматами: BMP, JPG, PNG, GIF и TIFF. Причём последний по умолчанию не учитывается.

Также есть опции для обеспечения удаления дубликатов напрямую в корзину и отключения всплывающего подтверждения. Ещё программа умеет обновляться автоматически.

    Официальный сайт ;
  • Язык: английский;
  • Распространение: бесплатно.

Приложение Similar Images Finder встречает нас недобрым сообщением на английском о том, что за него нужно заплатить $34. Тем не менее на протяжении 30 дней программа готова поработать бесплатно. Следом появляется окно, предлагающее выбрать каталоги для поиска дубликатов:

Из него же мы узнаём, что Similar Images Finder поддерживает 29 форматов изображений, причём пользователь может выбирать конкретные форматы для поиска или исключать лишние. В списке, помимо прочего, можно наблюдать ico и wbmp.

При нажатии Next вы запустите поиск дубликатов, а когда он будет закончен, нажмите Next ещё раз, чтоб увидеть дополнительные настройки. Регулируя их, вы сможете более тщательно настроить то, что отобразится в списке результатов. Наконец, нажав Next в третий раз, вы увидите уже и сам результат:

Перейти к следующей найденной картинке можно нажатием миниатюрной стрелочки в верхнем правом углу. Весь список найденных дубликатов открывается кликом по большой кнопке вверху с адресами текущих файлов.

В свою очередь, нажатие кнопки Next внизу приведёт к завершающему этапу работы. Там программа выведет список того, что, по её мнению, точно является дубликатами и предложит их удалить. На скриншоте выше Similar Images Finder справилась с изображением, куда был добавлен водяной знак, а также изменён контраст гистограммы.

Различая между картинками программа посчитала на уровне 5,5%. При этом в другом примере, где на вторую картинку нами был добавлен сильный эффект размытия, отличия, по версии приложения, почему-то составили всего 1,2%:

Увы, программа, находя реальные дубликаты, по умолчанию показывает и многие совсем непохожие друг на друга изображения, как будто в них есть что-то общее:

  • Программа Similar Images Finder. Официальный сайт ;
  • Язык: английский;
  • Распространение: платно, 30 дней бесплатного использования.

Универсальный поиск дубликатов с Duplicate Remover Free

Duplicate Remover Free – единственная в нашем обзоре программа, которая сосредоточена всё же не конкретно на дубликатах фотографий, а на поиске дубликатов в целом.

Как показывает практика, такие универсальные решения не очень хорошо проявляют себя в задачах, связанных с какой-то более узкой областью.

Однако одной такой программе мы сегодня даём шанс. Как подсказывает слово Free – распространяется она бесплатно. Вторым достоинством приложения является русский язык, а третьим – относительная современность на фоне других программ в этой подборке, многие из которых, к огромному сожалению, не обновлялись уже долгие годы.

Вам следует кликнуть по кнопке «добавить директорию» и выбрать нужные папки. По умолчанию программа в заданном каталоге не нашла для нас вообще ничего, однако, когда вверху вместо «точные дубликаты» мы выбрали пункт «похожие изображения», тут же были найдены четыре группы дубликатов, одна из которых состояла сразу из трёх файлов:

Дополнительных возможностей у приложения совсем немного. В частности, вы можете исключать из поиска файлы до и после определённого размера.

  • Программа Duplicate Remover Free. Официальный сайт ;
  • Язык: русский;
  • Распространение: бесплатно.

Поиск совпадающих фото по различным алгоритмам с AntiDupl

Заключительный участник нашего обзора – программа AntiDupl может приглянуться вам сразу по нескольким причинам. Во-первых, она бесплатная. Во-вторых, у неё русский интерфейс. Последнее, впрочем, не очевидно. Для того чтобы включить русский, откройте меню View и в разделе Language выберете соответствующий пункт:

В отличие от других, эта программа не инсталлируется, а находится в самораспаковывающемся архиве, который извлекает её вместе с необходимыми файлами в отдельную папку.

Чтобы подготовить поиск дубликатов кликните по кнопке с подписью Open и в появившемся окне добавьте нужные каталоги:

Следом можно нажимать Ок, а потом активировать на панели инструментов зелёную кнопку «начать поиск». Используя базовый алгоритм, программа нашла для нас несколько групп дубликатов:

Переключив вверху алгоритм на более вольный SSIM, мы получили уже на две группы дубликатов больше, а после увеличения «свободы» поиска с 20 до 35% программа выдала нам ещё более подробный список:

При этом во всех случаях действительно нашлись как минимум заметно похожие друг на друга изображения. Так что не брезгуйте экспериментировать с настройками.

Дополнительных опций у программы немало:

На вкладке «поиск» можно узнать, что AntiDupl поддерживает 13 форматов, среди которых помимо традиционных JPG/PNG, есть ICON, PSD и EXIF. Разумеется, форматы можно выбирать. Ещё в опциях есть проверка на дефекты, блочность и размытость, причём в последних двух случаях можно задавать порог. Есть возможность искать в скрытых и системных каталогах.

  • Программа AntiDupl. ;
  • Язык: русский;
  • Распространение: бесплатно.

При поиске дубликатов часть пользователей интересует именно 100% соответствие, чтобы избавиться от дублей в своей коллекции. Однако нередко возникает и задача найти просто похожие картинки.

И вот здесь огромное пространство для возможных отличий. Этот могут быть разные форматы, разрешения, обрезанные версии одного и того же изображения, добавление рамок и водяных знаков, изменённые цвета и подписи на картинках.

Мы постарались учесть большинство из этих факторов и после всех проб создали в итоге небольшой набор с более чем шестью десятками картинок. В них мы создали девять групп дубликатов. Скажем честно, на истину в последней инстанции наш опыт точно не претендует, но попробовать было интересно. Результаты следующие:

  • Duplicate Remover Free: нашёл лишь 3 группы дубликатов;
  • Similar Images Finder: нашёл 4 группы, но неудобный интерфейс, множество ложных результатов и при этом платность приложения сильно испортили общее впечатление;
  • AntiDupl по умолчанию нашёл 3 типа дубликатов, установка алгоритма SSIM увеличила результат поиска до 5 групп;
  • VisiPics при базовом уровне поиска нашёл лишь 2 группы дубликатов, однако установка ползунка на уровень Loose позволила найти уже 7 групп;
  • Awesome Duplicate Photo Finder нашёл 7 групп дубликатов;
  • Image Comparer также сумел обнаружить 7 групп.

При этом Image Comparer сумел найти изображения, которые пропустили Awesome Duplicate Photo Finder и VisiPics, а те, в свою очередь, восполнили пробелы Image Comparer.

Самые быстрые программы для поиска дубликатов фото

В то же время, качество программы ещё зависит и от её скорости. 60+ картинок – это, конечно же, не то, с чем могут работать пользователи. Поэтому мы провели ещё один тест. На этот раз на скорость. Для этого мы взяли подборку из 4450 самых разных изображений, общий вес которой превысил 2.1 ГБ.

Две программы из этого обзора, увы, в тесте не заняли никакого места. Как выяснилось, Similar Images Finder, за который просят 34 доллара, в бесплатной версии готов зараз обработать не более 200 изображений.

В свою очередь, универсальный поисковик дубликатов Duplicate Remover Free, столкнувшись с каталогом серьёзного размера, более пяти минут интенсивно работал, а потом основательно завис. Остальные программы показали следующее время:

  • AntiDupl: 0:39;
  • Image Comparer: 1:02 (35 секунд на создание галереи и 27 на поиск);
  • VisiPics: 2:37;
  • Awesome Duplicate Photo Finder: 3:17.

В итоге в тесте на скорость в лидеры явно выбились Image Comparer и AntiDupl. На обработку нашего архива у них ушло около или же, в случае AntiDupl, меньше минуты.

Заключение

Подведём итоги. Если вам нужно найти не одинаковые, а именно похожие фотографии, отличающиеся, например, подписью или водяным знаком, то лучше остальных с этой задачей справятся Image Comparer, Awesome Duplicate Photo Finder и VisiPics в режиме работы Loose.

В плане скорости обработки многочисленной коллекции изображений безусловные лидеры – AntiDupl и Image Comparer.

Наконец, в плане удобства интерфейса нам понравились Image Comparer и VisiPics, с ходу позволяющие визуально оценить все группы дубликатов. В свою очередь, за наглядность сравнения характеристик отдельных дубликатов мы также отметим AntiDupl.

Удаление одинаковых файлов (копий одного и того же файла) или папок может освободить свободное дисковое пространство и уменьшает ненужный мусор в системе, что благоприятно отражается на быстродействии системы. Иногда дубликаты создаются самим пользователем (например, одни и те же фотографии копируются в разные папки, находящиеся внутри одного физического диска), в некоторых случаях они остаются после использования различного программного обеспечения. Функцию поиска ненужных копий выполняют множество приложений, большинство которых распространяются по статусу free (бесплатно ). Опишем работу нескольких таких приложений.

Удаление дубликатов с помощью Total Commander

Используем Dupeguru

Данное ПО разработано исключительно для сканирования системы на наличие копий и не выполняет иные функции.


AllDup для определения дубликатов

Дизайн программы выполнен в красивом и удобном для использования стиле. Сразу же после запуска появляется окно с кратким руководством по поиску дубликатов. Можно искать по всему физическому диску целиком, отметив галочкой нужные локальные диски.

Или добавить отдельные папки, нажав на стрелочку возле кнопки «Исходные папки » и выбрав в выпадающем списке «Добавить папки ».

Давайте попробуем найти дубликаты в папке Games в локальном диске «С:\»

Активируем вкладку «Метод поиска », настраиваем критерии. По умолчанию активен параметр поиска дубликатов только по схожим именам , при необходимости отмечаем галочкой нужные настройки . Желательно включить поиск и по расширениям , иначе ПО может показать файлы со схожими именами, даже если они не являются копиями друг друга.

После, нажимаем кнопку начало поиска .

После завершения откроется новое окно с результатами , в котором отмечаем галочками ненужные файлы , щелкаем правой кнопкой мышки по файлу , который предполагается очистить от дубликатов (открываем контекстное меню) и выбираем «Удалить все остальные файлы из этой группы навсегда », чтобы удалить копии. При этом сам оригинал останется не тронутым, удалятся только дубликаты.

Как использовать DuplicateCleaner Free

Очень продуманное приложение для поиска и удаления дубликатов на компьютере. При этом можно выполнять поиск всех файлов в обычном режиме, искать копии изображений или музыки, или одинаковых папок.

Запускаем приложение . Первым делом настраиваем критерии поиска, для этого в разделе «Дополнительные опции » отмечаем настройку «С тем же именем » и переходим во вкладку «Сканировать путь »

Выбираем папку , нажимаем кнопку добавления выбранной папки в включенные пути и жмем кнопку «Сканировать ».

Дожидаемся окончания сканирования, в котором будет отображена статистика обнаруженных дубликатов в отдельном окне. Закрываем окно.

Во вкладке «Дубликаты Файлов » списком отображаются одинаковые файлы, отмечаем ненужные и нажимаем меню «Вид », выбираем пункт «Удаления файлов »

В открывшемся окне нажимаем «Удалить файл(ы) ». При этом желательно включить удаление в Корзину , чтобы можно было восстановить нужные файлы.

Рассмотрим, к ак найти и выделить одинаковые значения в Excel. Нам поможет условное форматирование. Что такое условное форматирование и как с ним работать, смотрите в статье "Условное форматирование в Excel" . Выделить повторяющиеся значения в Excel можно как во всей таблицы, так и в определенном диапазоне (строке, столбце). А функция " Фильтр в Excel " поможет их скрыть, если нужно. Рассмотрим несколько способов.
Первый способ .
Как найти одинаковые значения в Excel .
Например, число, фамилию, т.д. Как это сделать, смотрите в статье «Как выделить ячейки в Excel ».
Второй способ.
Как выделить повторяющиеся значения в Excel . В этой таблице нам нужно выделить год рождения 1960. Выделяем столбец «Год рождения». На закладке «Главная» в разделе «Стили» нажимаем кнопку «Условное форматирование». Затем в разделе «Правила выделенных ячеек» выбираем «Повторяющиеся значения».
В появившемся диалоговом окне выбираем, что нам нужно выделить: повторяющиеся или уникальные значения. Выбираем цвет заливки ячейки или цвет шрифта.
Подробнее смотрите в статье «Выделить дату, день недели в Excel при условии» .
Нажимаем «ОК». В столбце D выделились все года – 1960.

Можно в условном форматировании тоже в разделе «Правила выделенных ячеек» выбрать функцию «Содержит текст». Написать этот текст (например, фамилию, цифру, др.), и все ячейки с этим текстом выделятся цветом. Мы написали фамилию «Иванов». Есть еще много способов найти одинаковые значения в Excel и выделить их не только цветом, но и словами, числами, знаками. Можно настроить таблицу так, что дубли будут не только выделяться, но и считаться. Можно выделить повторяющиеся значения с первого слова, а можно выделять дубли со второго и далее. Обо всем этом и другом читайте в статье "

При работе с таблицей или базой данных с большим количеством информации возможна ситуация, когда некоторые строки повторяются. Это ещё больше увеличивает массив данных. К тому же, при наличии дубликатов возможен некорректный подсчет результатов в формулах. Давайте разберемся, как в программе Microsoft Excel отыскать и удалить повторяющиеся строки.

Найти и удалить значения таблицы, которые дублируются, возможно разными способами. В каждом из этих вариантов поиск и ликвидация дубликатов – это звенья одного процесса.

Способ 1: простое удаление повторяющихся строк

Проще всего удалить дубликаты – это воспользоваться специальной кнопкой на ленте, предназначенной для этих целей.


Способ 2: удаление дубликатов в «умной таблице»

Дубликаты можно удалить из диапазона ячеек, создав умную таблицу.


Этот способ является наиболее универсальным и функциональным из всех описанных в данной статье.

Способ 3: применение сортировки

Данный способ является не совсем удалением дубликатов, так как сортировка только скрывает повторные записи в таблице.


После этого, повторяющиеся записи будут скрыты. Но их показ можно в любой момент включить повторным нажатием на кнопку «Фильтр» .

Способ 4: условное форматирование

Найти повторяющиеся ячейки можно также при помощи условного форматирования таблицы. Правда, удалять их придется другим инструментом.


После этого произойдет выделение ячеек с повторяющимися значениями. Эти ячейки вы потом при желании сможете удалить вручную стандартным способом.

Внимание! Поиск дублей с применением условного форматирования производится не по строке в целом, а по каждой ячейке в частности, поэтому не для всех случаев он является подходящим.

Способ 5: применение формулы

Кроме того, найти дубликаты можно применив формулу с использованием сразу нескольких функций. С её помощью можно производить поиск дубликатов по конкретному столбцу. Общий вид данной формулы будет выглядеть следующим образом:

ЕСЛИОШИБКА(ИНДЕКС(адрес_столбца;ПОИСКПОЗ(0;СЧЁТЕСЛИ(адрес_шапки_столбца_дубликатов: адрес_шапки_столбца_дубликатов (абсолютный); адрес_столбца;)+ЕСЛИ(СЧЁТЕСЛИ(адрес_столбца;; адрес_столбца;)>1;0;1);0));"")


После этих действий в столбце «Дубликаты» отобразятся повторяющиеся значения.

Но, данный способ все-таки слишком сложен для большинства пользователей. К тому же, он предполагает только поиск дублей, но не их удаление. Поэтому рекомендуется применять более простые и функциональные решения, описанные ранее.

Как видим, в Экселе есть множество инструментов предназначенных для поиска и удаления дублей. У каждого из них есть свои особенности. Например, условное форматирование предполагает поиск дублей только по каждой ячейке в отдельности. К тому же, не все инструменты могут не только искать, но и удалять повторяющиеся значения. Наиболее универсальный вариант – это создание «умной таблицы». При использовании данного способа можно максимально точно и удобно настроить поиск дубликатов. К тому же, их удаление происходит моментально.

Если Вы работаете с большими количеством информации в Excel и регулярно добавляете ее, например, данные про учеников школы или сотрудников компании, то в таких таблицах могут появиться повторяющиеся значения, другими словами – дубликаты.

В данной статье мы рассмотрим, как найти, выделить, удалить и посчитать количество повторяющихся значений в Эксель.

Как найти и выделить

Найти и выделить дубликаты в документе можно, используя условное форматирование в Эксель . Выделите весь диапазон данных в нужной таблице. На вкладке «Главная» кликните на кнопочку «Условное форматирование» , выберите из меню «Правила выделения ячеек» «Повторяющиеся значения» .

В следующем окне выберите из выпадающего списка «повторяющиеся» , и цвет для ячейки и текста, в который нужно закрасить найденные дубликаты. Затем нажмите «ОК» и программа выполнит поиск дубликатов.

В примере Excel выделил розовым всю одинаковую информацию. Как видите, данные сравниваются не построчно, а выделяются одинаковые ячейки в столбцах. Поэтому выделена ячейка «Саша В.» . Таких учеников может быть несколько, но с разными фамилиями.

Как посчитать

Если Вам нужно найти и посчитать количество повторяющихся значений в Excel, создадим для этого сводную таблицу Excel. Добавляем в исходную столбец «Код» и заполняем его «1» : ставим 1, 1 в первых двух ячейка, выделяем их и протягиваем вниз. Когда будут найдены дубликаты для строк, каждый раз значение в столбце «Код» будет увеличиваться на единицу.

Выделяем все вместе с заголовками, переходим на вкладку «Вставка» и нажимаем кнопочку «Сводная таблица» .

Чтобы более подробно узнать, как работать со сводными таблицами в Эксель , прочтите статью перейдя по ссылке.

В следующем окне уже указаны ячейки диапазона, маркером отмечаем «На новый лист» и нажимаем «ОК» .

Справой стороны перетаскиваем первые три заголовка в область «Названия строк» , а поле «Код» перетаскиваем в область «Значения» .

В результате получим сводную таблицу без дубликатов, а в поле «Код» будут стоять числа, соответствующие повторяющимся значениям в исходной таблице – сколько раз в ней повторялась данная строка.

Для удобства, выделим все значения в столбце «Сумма по полю Код» , и отсортируем их в порядке убывания.

Думаю теперь, Вы сможете найти, выделить, удалить и даже посчитать количество дубликатов в Excel для всех строк таблицы или только для выделенных столбцов.

Оценить статью: