Павел спросил: "Алексей, просветите пожалуйста, почему камера в любом смартфоне уже лет 5 как находит лицо человека мгновенно и в любых условиях, а поиск Яндекса сбивается на рисунок на рубашке? Кроме того, в описании сервиса ни слова о распознавании лиц... "Похожие - показывает похожие предметы" (не людей!). Не потому ли, что поиск в сети именно по лицу доступен только специальным службам и не разрешён к использованию простым смертным? Как оборудование для скрытой аудио-видеозаписи, например?" Отвечаю длинно, надеюсь, в записи блога развернутый ответ останется нетронутым. Различие между реализацией технологии поиска изображений у Яндекса и "в телефонах" (читай - у разработчиков зарубежного ПО) основывается на особенностях юрисдикции. В России над Яндексом в части обработки персональных данных (ПДн) кружат как коршуны регуляторы, т.е. госструктуры, которые обязаны осуществлять контроль соблюдения требований законодательства и наказывать, если что-то не соблюдается. В части ПДн регуляторы Роскомнадзор, ФСБ, ФСТЭК, Генпрокуратура. А ПДн упомянул я потому, что лицо человека - персональные данные высшей категории - биометрические. Так вот если Яндекс начнет искать именно по лицу , то даже получение галереи изображений лиц по результатам поиска считается обработкой ПДн со всеми вытекающими последствиями. Приказы ФСБ и ФСТЭК требуют сразу организовать очень серьезную защиту ПДн, это крайне дорого с учетом объемов обрабатываемых данных, плюс попадаешь в плановые и внеплановые проверки регуляторов - в общем, затратная и со всех сторон невыгодная история. Еще есть просто невыполнимое технически требование получения согласия на обработку ПДн у субъектов ПДн - нас самих. То-есть мое лицо нельзя выдавать в качестве результатов поиска, пока я не подпишу установленной формы согласие на обработку ПДн. И нас таких с Вами потенциально - миллионы. Как получить со всех согласие? Да никак. Яндекс выкрутился из этой ситуации элегантно. Он заявил, что ищет похожее изображение в целом, а не конкретно лицо. И технически реализовал это просто. По умолчанию поиск изображений проводится по той части изображения, которая ограничивается рамкой. А это при запуске сервиса поиска само всё изображение "целиком". Далее алгоритм выделяет на изображении некоторые области, даже не распознавая их как сущности типа "рубашка", "лицо", "дамская сумочка", "велосипед" и т.д. Это просто области, которые различаются. После этого значимость каждой области рассчитывается примерно по отношению площади этой области к общей площади кадра - и поиск начинается... Пример с рубашкой наиболее нагляден. Если рубашка занимает 4/5 кадра, а голова 1/5, то важность рубашки будет 80%, а головы - лишь 20%. И потому в выдаче первыми будут рубашки, рубашки, рубашки... Но когда "похожие" подойдут к концу, начнется выдача найденных изображений с "головами", и там есть шанс увидеть искомое изображение, если мы ищем всё же лицо. А как же бизнес, ведь не всем нравится разглядывать рубашки вместо лиц? И тут Яндекс показывает высший пилотаж, делая поисковую рамку динамически меняющейся. Можно мышкой потянуть за края рамки, за углы, можно перемещать рамку по кадру - в итоге мы настроимся на лицо человека. Но ключевое тут юридически "мы", а не Яндекс. Яндекс по-прежнему утверждает, что ищет произвольное изображение и не распознает его суть - лицо, рубашка или дамская сумочка. И он прав - ничто не мешало нам выделить хоть велосипед на заднем плане - поиск будет "по велосипедам". Так и выживает Яндекс в юридических джунглях, где каждый готов съесть каждого )). Что же с телефонами? Они производятся за рубежом, где-нибудь в Китае по американской лицензии, и там другая юрисдикция. Законодательство о ПДн тоже строгое, но прецедентное право... Если никто не пожаловался, что его "находят" без его согласия, то и ладно. Пока никто не жаловался, плюс немного иное понятие общедоступных данных - в общем, в зарубежном законодательстве добровольно выложенная фотография как бы уже и не ПДн, а так, общедоступные данные. Вот поэтому зарубежные ресурсы поиска по изображениям по умолчанию выделяют лица на изображениях сами, проводят поиск по ним сами - нет к ним таких требований, как в России... Силовики? Если говорить об Интернете, то в нем все равны. Потому что важно не кто ты в этой жизни, а насколько много цифровых фотографий проиндексировал поисковик до того, как мы оформили свой запрос. И тут нет равного Google, после которого идут другие поисковики, и Яндекс не на последнем месте. В общем, силовики в части поиска изображений в Интернете привилегиями не пользуются - это же в основном иностранный бизнес, у которого никакого пиетета к российским силовикам нет. Платишь - клиент, не платишь - пользуйся в режиме демодоступа или пользуйся бесплатно, как все, если всем бесплатно... С уважением!