Amazon recognition: Amazon Rekognition – видео и изображения

Содержание

Amazon Rekognition – Цены – AWS

Благодаря Amazon Rekognition Custom Labels можно идентифицировать на изображениях те объекты и сцены, которые соответствуют потребностям определенной сферы бизнеса. Для Rekognition Custom Labels может применяться один из двух типов стоимости.

Количество часов обучения
Для построения пользовательской модели Amazon Rekognition Custom Labels необходимо оплатить каждый час обучения системы. Amazon Rekognition Custom Labels может использовать множество вычислительных ресурсов параллельно для более быстрого обучения пользовательской модели. Это означает, что количество оплачиваемых часов может превышать действительный объем затраченного на обучение модели времени. Необходимое количество часов для обучения модели зависит от многих факторов. Например, от количества образов и меток в наборе обучающих данных, а также используемых типов алгоритмов машинного обучения. Обычно на обучение 90% моделей необходимо менее 24 часов. Модели, на обучение которых уходит более 72 часов, автоматически отключаются. Плата в случае автоматического отключения не взимается.

Предположим, что обучение началось в 16:00 и завершилось в 20:30. Для ускорения процесса обучения модели с помощью Amazon Rekognition Custom Labels параллельно использовалось два ресурса. Общий объем оплачиваемого времени обучения составит 9 часов (4,5 часа затраченного времени x 2 ресурса).

Часы на получение логических выводов
Оплата взимается также и за каждый час, в течение которого обученная пользовательская модель остается доступной для обработки изображений. Количество доступных для обработки за один час изображений зависит от многих факторов, таких как размер обрабатываемых изображений и сложность пользовательской модели. В нуждах Amazon Rekognition Custom Labels можно использовать несколько вычислительных ресурсов параллельно для более быстрой обработки пользовательских изображений. Это означает, что количество оплачиваемых часов может превышать действительный объем затраченного на эксплуатацию пользовательской модели времени.

Предположим, что получение логических выводов пользовательской модели началась в 14:00 и завершилась в 17:00, для возможности параллельной обработки изображений было выделено два ресурса. Общий объем оплачиваемого времени получения логических выводов составит 6 часов (3 часа затраченного времени x 2 ресурса).

В случае необходимости периодически обрабатывать группы изображений (раз в день, раз в неделю, в запланированные временные промежутки в течение дня и т. д.) можно воспользоваться возможностью эксплуатации пользовательской модели исключительно в запланированные временные промежутки, отменяя выделение задействованных в обработке изображений ресурсов сразу по завершении работы. Если пользователь не отменит выделение ресурсов, оплата за соответствующие ресурсы продолжит взиматься даже в случае их простоя.

В рамках уровня бесплатного пользования AWS можно начать работу с Amazon Rekognition Custom Labels бесплатно. Уровень бесплатного пользования действителен на протяжении 3 месяцев, включает в себя 10 бесплатных часов обучения и 4 бесплатных часа на получение логических выводов в месяц.

Пример расчета цены 1 – проставление меток на изображениях для веб-сайта

Предположим, пользователь желает упростить для своих клиентов поиск по объектам на веб-сайте для онлайн-заказов туристических путевок. Он определил несколько интересующих его меток (стол для бильярда, столовая, вид на океан и т. д.) и желает обучить свою пользовательскую модель поиску упомянутых выше характеристик на изображениях своего веб-сайта. Предположим, что на обучение такой модели понадобится 10,2 часа. Также предположим, что на получение логических выводов модели пользователю понадобится 0,5 часа в день: на протяжении этого времени будет выполняться обработка всех размещаемых на сайте изображений.

Тип стоимости

Цены

Стоимость использования

10,2 часа на обучение

1 USD за час

10,2 часа x 1 USD за час = 10,20 USD (единоразовая оплата)

0,5 часа на получение логических выводов в день

4 USD за час

0,5 часа в день x 4 USD за час = 2,00 USD за день (регулярная оплата)

Пример расчета цены 2 – идентификация деталей на производственном предприятии

Предположим, что на производственном предприятии необходимо идентифицировать определенные детали механизма по мере их продвижения по сборочной линии. На протяжении всего рабочего дня выполняется фотографирование различных деталей механизма. Допустим, что на обучение такой модели понадобится 11 часов.

Учитывая равномерную загрузку изображений на протяжении всего дня, такая модель должна постоянно функционировать с 9:00 до 17:00 – восемь часов ежедневно.

Тип стоимости

Цены

Стоимость использования

11 часов на обучение

1 USD за час

11 часов x 1 USD за час = 11,00 USD (единоразовая оплата)

8 часов на получение логических выводов в день

4 USD за час

8 часов в день x 4 USD за час = 32,00 USD за день (регулярная оплата)

Пример расчета цены 3 – анализ деятельности лидеров общественного мнения

Предположим, что модель необходима маркетинговому агентству, основной задачей которого является изучение деятельности сотен тысяч лидеров общественного мнения в социальных сетях с целью точно и быстро идентифицировать таких лидеров, которые наилучшим образом будут соответствовать предпочтениям клиентов агентства. Ежедневно эта модель Custom Labels должна обрабатывать 450 000 загруженных лидерами общественного мнения и извлеченных из различных социальных сетей изображений. Допустим, что для ежедневной обработки 440 000 изображений потребуется примерно 44 часа на получение логических выводов модели в день. Также предположим, что на обучение такой модели понадобится 9 часов.

Учитывая внушительный объем работы – 440 000 изображений ежедневно – для удовлетворения нужд агентства необходимо параллельно эксплуатировать не менее двух ресурсов, предназначенных для получения логических выводов.

Тип стоимости	Цены	Стоимость использования
9 часов на обучение	1 USD за час	9 часов x 1 USD за час = 9,00 USD (единоразовая оплата)
44 часа на получение логических выводов в день	4 USD за час	44 часа в день x 4 USD за час = 180,00 USD за день (регулярная оплата)

Amazon Rekognition. Часто задаваемые вопросы: AWS

Общие вопросы

Вопрос. Что такое Amazon Rekognition?

Amazon Rekognition представляет собой сервис, позволяющий легко добавить в приложения мощные инструменты для анализа изображений. Rekognition Image позволяет быстро и легко создавать мощные приложения для поиска, проверки и упорядочивания миллионов изображений. Rekognition Video позволяет получать из сохраненного или потокового видео контекст, учитывающий движение, и анализировать данные.

Rekognition Image представляет собой сервис для анализа изображений, который способен распознавать объекты, сцены и лица, извлечь текст, распознать знаменитостей и выявить неуместное содержимое в изображениях. Этот сервис также дает возможность искать и сопоставлять лица. Rekognition Image основан на проверенной технологии глубокого обучения с возможностью масштабирования, разработанной экспертами Amazon в области компьютерного зрения. Этот сервис позволяет ежедневно анализировать в Prime Photos миллиарды изображений.

Rekognition Image использует модели глубоких нейронных сетей для распознавания и маркировки тысяч объектов и сцен, при этом мы постоянно добавляем новые маркеры и возможности для распознавания лиц. При использовании Rekognition Image вы платите только за анализируемые изображения и хранимые метаданные о лицах.

Rekognition Video – сервис распознавания видеоматериалов, который способен обнаруживать те или иные действия, определять движения людей в кадре, распознавать объекты и знаменитостей, а также выявлять неприемлемое содержимое в видеозаписях, сохраненных в Amazon S3, и видеопотоках Acuity. Rekognition Video позволяет обнаруживать людей и отслеживать их перемещения на видеозаписи, когда они входят в сцену или выходят из нее, даже если лица не видны. Например, этот сервис можно использовать в приложении, которое отправляет оповещения в режиме реального времени, как только кто-нибудь оставит посылку возле вашей двери. Сервис Rekognition Video индексирует метаданные (объекты, действия, сцены, лица и знаменитости), существенно упрощая процедуру поиска по видеозаписи.

Вопрос. Что такое глубокое обучение?

Глубокое обучение – это подраздел машинного обучения и важная область исследований искусственного интеллекта. Цель глубокого обучения – выделение абстракций высокого уровня из несортированных данных с помощью глубоких графов с разными уровнями вычислений, которые представляют собой множество линейных и нелинейных трансформаций. Глубокое обучение основано на общих моделях обработки информации и связей в человеческом мозге. Оно позволяет перейти от запрограммированных вручную функций к новым, обнаруженным в результате обработки очень больших массивов неструктурированных данных. Обучение представляет собой итеративную оценку сотен тысяч параметров в глубоком графе с помощью эффективных алгоритмов.

Ряд архитектур глубокого обучения, таких как сверточные глубокие нейросети (CNN) и рекуррентные нейросети, уже используется в компьютерном зрении, распознавании речи, обработке естественной речи и распознавании звука и показывает блестящие результаты при выполнении различных заданий.

Amazon Rekognition входит в семейство сервисов Amazon AI. Сервисы Amazon AI используют глубокое обучение для распознавания изображений, превращения текста в естественную речь и создания интуитивных интерфейсов живого текстового и голосового взаимодействия.

Вопрос. Требует ли работа с Amazon Rekognition опыта в области глубокого обучения?

Нет. Пользователям Amazon Rekognition не требуется разрабатывать, поддерживать и развивать конвейеры глубокого обучения.

Чтобы грамотно решать задачи из области компьютерного зрения, такие как обнаружение объектов и сцен или анализ и распознавание лиц, системы глубокого обучения должны быть грамотно настроены и обучены на огромных массивах данных с заведомо верными маркировками. Создание, очистка и маркировка исходных данных – это дорогая и трудоемкая работа. Более того, само обучение глубокой нейросети требует огромных вычислительных ресурсов и специального оборудования на базе графических процессоров (GPU).

Amazon Rekognition – полностью управляемый сервис, он уже обучен выполнению задач в области распознавания изображений и видеозаписей, так что пользователю не нужно расходовать время и ресурсы на создание собственных конвейеров глубокого обучения. Amazon Rekognition продолжает интегрировать последние научные разработки и новые исходные данные в свою нейросеть для повышения точности ее работы. Это позволяет пользователям полностью сосредоточиться на проектировании и разработке важных и нужных приложений.

Вопрос. Каковы наиболее распространенные примеры использования Amazon Rekognition?

К наиболее распространенным примерам использования Amazon Rekognition можно отнести следующие.

Библиотека изображений с функцией поиска
Проверка пользователя по лицу
Анализ эмоций
Распознавание лиц
Модерация изображений

К наиболее распространенным примерам использования Rekognition Video можно отнести следующие.

Индексация видеоархивов для упрощения поиска
Удобная фильтрация видеозаписей на основании наличия контента для взрослых или подозрительного контента

Вопрос. Как начать работу с Amazon Rekognition?

Если вы еще не зарегистрировались в сервисе Amazon Rekognition, можно нажать кнопку «Попробовать Amazon Rekognition» на странице сервиса Amazon Rekognition и завершить процесс регистрации. Вам потребуется аккаунт Amazon Web Services. Если такового еще нет, аккаунт будет предложено создать во время регистрации в сервисе. Войдя в систему, можно попробовать Amazon Rekognition на собственных изображениях и видеозаписях через консоль управления Amazon Rekognition или загрузить SDK Amazon Rekognition и начать разработку собственных приложений. Подробную информацию см. в пошаговом Руководстве по началу работы.

Вопрос. Какие API предлагает Amazon Rekognition?

Сервис Amazon Rekognition Image предлагает API для распознавания объектов и сцен, распознавания и анализа лиц, распознавания знаменитостей, выявления неприемлемого содержимого, сравнения и поиска похожих лиц в коллекции и API для управления ресурсами. Rekognition Image также предоставляет API для сравнения лиц и извлечения текста, в то время как Rekognition Video предлагает API для отслеживания людей и управления потоковым видео Acuity. Подробности см. в справке по API Amazon Rekognition.

Вопрос. Какие форматы изображений и видеозаписей поддерживает Amazon Rekognition?

В настоящее время Amazon Rekognition поддерживает графические форматы JPEG и PNG. Изображения передаются в сервис как объекты S3 или массивы байтов. Amazon Rekognition Video может анализировать видеозаписи, сохраненные в корзинах Amazon S3. Кодирование видео должно быть выполнено с использованием кодека H.264. Поддерживаются следующие форматы видеофайлов: MPEG-4 и MOV. Кодек представляет собой программное или аппаратное обеспечение, которое выполняет сжатие данных для более быстрой их передачи и последующее восстановление данных в исходном виде. Кодек H.264 чаще всего используется для записи, сжатия и рассылки видеозаписей. Формат видеофайла может содержать один или несколько кодеков. Если видеофайл в формате MOV или MPEG-4 не поддерживается в Rekognition Video, убедитесь в том, что для кодирования видео использован кодек H.264.

Вопрос. Какие размеры файлов поддерживает Amazon Rekognition?

Amazon Rekognition Image поддерживает изображения в виде объектов S3 размером до 15 МБ и в виде массивов байтов размером до 5 МБ. Amazon Rekognition Video поддерживает видеофайлы размером до 10 ГБ и продолжительностью до 6 часов в виде файла S3.

Вопрос. Как разрешение изображения влияет на точность результата при использовании API Rekognition Image?

Amazon Rekognition работает с самыми разными разрешениями изображений. Для достижения наилучших результатов рекомендуется использовать разрешение VGA (640×480) или выше. При использовании изображений с разрешением QVGA (320×240) и ниже повышается вероятность ошибок при распознавании лиц, объектов или неприемлемого контента, однако Amazon Rekognition может работать с изображениями размером от 80 пикселей в длину/ширину.

Вопрос. Насколько мелкими могут быть объекты для распознавания и анализа в Amazon Rekognition Image?

Рекомендуется отправлять на распознавание изображения, в которых наименьший объект или лицо занимает не менее 5 % размера меньшей стороны изображения (в пикселях). Например, на изображении с разрешением 1600×900 наименьший объект или лицо должны занимать не менее 45 пикселей по каждой стороне.

Вопрос. Как поручить проверку прогнозов сервиса Amazon Rekognition людям?

Сервис Amazon Rekognition напрямую интегрирован с сервисом Amazon Augmented AI (Amazon A2I), поэтому вы можете легко направлять прогнозы с низким уровнем доверия из сервиса Amazon Rekognition Image на проверку людям. Используя API Amazon Rekognition для модерации контента или консоль Amazon A2I, вы можете указать условия, при которых сервис Amazon A2I будет направлять прогнозы рецензентам. В качестве такого условия можно использовать пороговое значение уровня доверия или процент случайной выборки. Если вы зададите пороговое значение уровня доверия, то на проверку людьми сервис Amazon A2I будет отправлять только те прогнозы, у которых уровень доверия ниже заданного значения. Значение уровня доверия можно изменить в любое время, чтобы добиться необходимого баланса между точностью и рентабельностью. Если же указать процент выборки, то на проверку людьми сервис Amazon A2I будет отправлять случайно выбранные прогнозы. Это поможет вам регулярно отслеживать точность прогнозов. Кроме того, веб-интерфейс Amazon A2I включает все указания и инструменты, необходимые рецензентам для выполнения проверок. Дополнительные сведения о том, как реализовать процесс проверки людьми с помощью сервиса Amazon Rekognition, см. на веб-странице Amazon A2I.

Вопрос. Как разрешение видео влияет на точность результата при использовании API в Rekognition Video?

Система обучена распознавать лица размером свыше 32 пикселей (по короткой стороне). То есть минимальный размер лица, которое может распознавать система, варьируется примерно от 1/7 (разрешение QVGA) до 1/30 (разрешение HD 1080p) короткой стороны экрана. Например, для экранов с разрешением VGA точность распознавания лиц, размер которых меньше 1/10 короткой стороны экрана, будет снижена.

Вопрос. Какие еще факторы могут влиять на качество работы API в Rekognition Video?

Помимо разрешения, качество работы API также может зависеть от четкости, скорости движения и позы человека, освещения.

Вопрос. Какие пользовательские видеозаписи лучше всего подходят для работы API Rekognition Video?

Этот API демонстрирует лучшие результаты при использовании любительских и профессиональных видеозаписей с фронтальной съемкой при стандартном освещении и цветовом окружении. Этот API не тестировался в применении к черно-белым записям, записям в инфракрасном спектре, а также при слишком ярком или слишком скудном освещении. В приложениях, чувствительных к ложноположительным срабатываниям, рекомендуется удалить результаты, для которых уровень уверенности не достигает установленного (для конкретного приложения) значения.

Вопрос. В каких регионах AWS доступен Amazon Rekognition?

Список всех регионов, в которых доступен Amazon Rekognition, см. в таблице регионов AWS.

Как Amazon использует новую систему распознавания лиц, и за что её ненавидят

Amazon разработала новую мощную систему для распознавания лиц в режиме реального времени. Нейросетям «кормят» фото и видео, а они определяют, что (или кто) там показывается. Воспользоваться ей может любой пользователь AWS. В США с её помощью шерифы уже успешно ловят преступников, а телестанции находят знаменитостей в живых трансляциях. Но у технологии нашлись и ярые оппоненты. Которые пишут Безосу письма и призывают Amazon немедленно прекратить разработку системы, иначе последствия могут быть самыми непредсказуемыми.

Сервис Amazon Rekognition позволяет встраивать в приложения аналитику изображений и видео, созданную алгоритмами на базе глубокого обучения. Достаточно дать нейронным сетям ваш ролик или ряд картинок, а те поймут, что на них изображено. Система умеет распознавать лица людей, их действия, объекты, окружающую среду. Обнаруживать порнографию или сцену убийства.

Технология для фото была представлена в 2016 году, а для видео – в 2017-м. С тех пор, как это свойственно нейронным сетям, продукт неплохо возмужал, поумнел и научился новым трюкам. Например, на начальном этапе Rekognition не была способна определять контекст снимка – что сейчас делает человек, и что показывает выражение его лица (наслаждение, страх, злость?). Тогда эту технологию Amazon часто сравнивали с Microsoft Cognitive Services, и говорили, что у Microsoft получается лучше.

Но в итоге система от AWS стала намного известнее своего конкурента. Возможно, свою роль сыграло то, что на облачные сервисы Amazon приходится 33% рынка, а на Microsoft – только 13%. Сама Amazon говорит, что её сервис мощнее потому, что она накопила больше данных, которые можно кормить нейронным сетям для их обучения. Как бы то ни было, Rekognition сейчас для публики и властей в США является лицом deep learning для распознавания фото и видео. И сейчас это приносит компании массу проблем.

Как это работает

Rekognition позволяет в режиме реального времени выполнять поиск лиц в коллекциях, хранящих несколько десятков миллионов лиц. Сначала необходимо создать такую коллекцию (или использовать вариант, предоставленный Amazon). Затем сервис проводит по ней быстрый поиск, чтобы найти лица, которые имеют визуальное сходство с лицами людей на фото или видео.

Из рекламы Amazon

Эксперты Amazon в области компьютерного зрения разработали эту систему для ежедневного анализа миллиардов изображений и видео. По слухам (пока неподтвержденным), именно она используется в первых магазинах без касс Amazon Go. На видео она способна даже запоминать, куда пошел тот или иной человек, когда его лица не видно. Технологии обещают большое будущее – например, в поиске пропавших людей или в автоматическом определении подозреваемых в совершении преступлений.

Rekognition также можно использовать для фильтрации неподобающего контента. Сейчас для этого приходится использовать команду модераторов – или рассчитывать, что пользователи сами пометят фото/видео с насилием или сценами сексуального характера в приложениях и в соц. сетях. Amazon уже сейчас позволяет указать, какие вещи нужно автоматически удалять. И в выдаче они даже не появятся: система будет отфильтровывать уже на этапе загрузки.

Сервис постоянно обучается на новых данных, расширяя свои способности и точность распознавания. Причем, за счет феноменальных мощностей AWS, технология стабильна при любом количестве запросов. Её задержка останется неизменной даже при росте количества запросов до десятков миллионов.

Для частных лиц или компаний сервис сдается по цене 10 центов за минуту распознавания архивного или потокового видео (плюс бесплатный анализ 1000 минут видео в месяц в первый год использования). Но сама Amazon видит его в гос. структурах. По специальной программе полиция в США может получить Rekognition всего за $6 в месяц – для сканирования сотен тысяч лиц потенциальных преступников. Несколько первых шерифов такую технологию в своем департаменте уже установили.

Например, в июле прошлого года мужчина зашел в магазин в Орегоне. Взял корзину, набрал в неё самых дорогих товаров. И вышел, не заходя в кассу самообсуживания. У магазина была камера, которая сняла пару фотографий вора, но в обычной ситуации его, скорее всего, никогда бы не нашли – у полиции хватает других задач. К сожалению для преступника, офис шерифа, подвязанный к делу, недавно подключился к технологии Amazon. Лицо магазинного вора прогнали через базу данных с 300 000 фотографий преступников из их округа. Та выдала четырех людей с похожими лицами. Детектив прошерстил их по Facebook – и нашел того самого человека, с теми же чертами лица и в той же толстовке. Всё, дело закрыто.

Полиция говорит, что если однажды человек уже пошел на преступление – большой шанс, что он может сделать это снова. Тут-то их старая фотография и пригодится. У Орегона есть база данных с фотографиями всех пойманных преступников за последние 10 лет. Сейчас её используют в основном для поиска по именам, фамилиям и месту жительства. По лицам на глаз найти в ней кого-то почти нереально, особенно учитывая, что со временем люди выращивают бороды, делают новые прически и так далее. А вот нейросети с задачей справляются за несколько секунд. Полиция округа говорит, что возможности Rekognition сейчас используются ей по 20 раз в день.

Королевская свадьба

Другой вариант того, как Rekognition может быть использована во благо, продемонстрировали в прошлую субботу. Миллионы людей были прикованы к телеэкранам, наблюдая за тем, как принц Гарри женится на американской актрисе Меган Маркл. Свадьба собрала в три раза больше зрителей, чем топовые эпизоды «Игры престолов». Для многих, по правде сказать, это было довольно скучное зрелище. Наблюдать за тем, как какие-то лорды, леди и британские знаменитости разных калибров по очереди собираются и заходят в собор. Толпа людей, из которых ты, дай бог, знаешь десяток. Брр.

Но британская телесеть Sky News нашла выход из этой ситуации. Зрителям её лайвстрима не нужно было гадать, кто это там идет в шапке. Все данные шли через облако AWS. И Rekognition в прямом эфире узнавала всех знаменитостей с видео, и под каждым выдавала подпись с его именем, фамилией и титулом. В окне рядом же можно было посмотреть, кем этот человек приходится Гарри и Меган, и узнать о нём дополнительную информацию. Как это работало в режиме реального времени, можно посмотреть тут. Справа можно выбрать, какую знаменитость вы хотите увидеть, и вас переключат на тот момент, когда Rekognition засекла её прибытие. Круто.

Путь к авторитаризму

Далеко не все разделяют радужные чувства по поводу новой технологии. В этот вторник Американский союз гражданских свобод (ACLU) и 40 поддержавших его организаций выпустили заявление, рассказывая о том, какие скрытые опасности таит в себе использование Rekognition. Они также направили открытое письмо Джеффу Безосу, призывая его прекратить давать технологию в руки третьих лиц, и остановить разработку новых «систем надзора, которые вредят гражданскому обществу». Распознавание лиц, конечно, не является чем-то революционным, но, по мнению авторов письма, то, как это делает Amazon, является крайне опасным и может задать прецедент.

Суть такая. После недавних протестов черных американцев, считающих, что полиция относится к ним с предвзятостью, всех охранников правопорядка в США заставили носить на себе камеры. Чтобы в случае чего можно было определить, был ли офицер виноват в ситуации. Amazon активно рекламирует возможности использования Rekognition именно вместе с такими камерами. Чтобы, скажем, в режиме реального времени система могла на ухо прошептать полицейскому «Справа в черной куртке и белой кепке идет подозреваемый в трёх убийствах». Но лидер движения Black Lives Matter Малькия Цирил говорит, что он не верит новой технологии, и она, наоборот, сделает жизнь меньшинств хуже:

Это рецепт авторитаризма и катастрофы. Amazon не должен даже близко заниматься подобным, и если мы можем что-то об этом сделать, они и не будут.

Камеры на теле полицейских не следят за полицейскими. Они следят за теми, на кого смотрят полицейские, – за нами, за общинами, за такими людьми, как я.

Технология – инструмент. Предлагая такой инструмент в контексте крайнего расизма и жестокости можно только усилить этот расизм и жестокость. Учитывая вычислительные мощности Amazon, вы, по сути, перестаете подпитывать эту систему дискриминации с помощью батарейки, и вместо этого подключаете ее к атомной электростанции. Вы увеличиваете не только скорость, но и масштаб того, как государство может вмешиваться в наши жизни.

Rekognition может позволить полиции в режиме реального времени обнаруживать, кто присоединился к протесту. Или кто является нелегальным иммигрантом. «Это представляет фатальную угрозу общинам», – организации пишут в своем письме к Amazon. – «Люди должны иметь возможность свободно ходить по улице, без страха быть наблюдаемыми государством».

Малькия Цирил во главе протеста

В приложении к письму ACLU опубликовала серию внутренних писем между Amazon и правоохранительными органами в Орегоном, которую она получила через официальный запрос. Ничего криминального там, конечно, нет, но интересно, что даже сами шерифы во время общения с представителями Amazon были слегка на нервах по поводу того, «как это может воспринять публика». И просили замедлить внедрение новых систем, чтобы дать людям время адаптироваться.

Там же есть переписки с полицией Калифорнии и Аризоны, которые спрашивали Орегон, насколько эффективной оказалась их новая система, и насколько быстро её можно внедрить. Оказалось, что офису шерифа установка Rekognition обошлась всего в $400 – чтобы загрузить 305 тысяч фото с профилями в систему. И $6 в месяц для продолжения пользования сервисом. Дешевле, чем два биг-мака.

На претензии общественных организаций AWS ответили в заявлении, что если клиенты не следуют букве закона, их отключают от сервиса. И пообещали впредь пристальнее следить за тем, как используется их технология.

Из заявления Amazon:

Качество нашей жизни сегодня было бы намного хуже, если бы мы запрещали каждое новое изобретение всякий раз, когда какие-то люди могли найти способ им злоупотреблять. Представьте, если вам нельзя было бы купить компьютер, потому что его можно использовать для нелегальной активности?

Но успокоить людей не так просто, и страхи общества по поводу систем слежки, использующих алгоритмы глубокого обучения, в Штатах продолжают нарастать. Несколько недель назад около дюжины сотрудников Google уволились в качестве протеста против решения поисковика объединиться с Министерством обороны США в разработке «Проекта Мейвен». Этот проект создает AI, который будет анализировать и определять объекты в поле видимости дрона (скажем, при поиске террористов ИГИЛ). Сотрудники Google были против того, чтобы их технологии использовались для убийства людей.

Rekognition, тем временем, уже существует, и по многим показателям оказывается намного мощнее. Системе безразлично, какой контент ей «скармливают» – видео с дрона, телепередачу, запись камеры из магазина. Она может за долю секунды распознать до 100 лиц в фотографиях толпы, и определить, кому они принадлежат. Единственное, что ей нужно – достаточно серьезная база данных, с которой эти лица можно было бы сравнить. К счастью (для Amazon, но не для правозащитников), такая база данных есть у полиции. В 2016-м исследователи из Университета Джорджтауна обнаружили, что в ней находится каждый второй взрослый американец – 117 млн человек. Причем большинство из этих записей не афишируются и никем не регулируются.

Расовый вопрос

Еще одна большая критика всех американских систем распознавания лиц, и Rekognition в частности, касается их «предвзятости» по отношению к женщинам, неграм и мусульманам. Если вкратце, суть в том, что нейросети тренируются в основном на фото белых мужчин – просто из-за того, что их больше. Как результат, технология учится очень хорошо отличать таких мужчин от всех других, и для них работает практически без ошибок.

А вот для женщин и чернокожих эти нейросистемы, как правило, работают хуже. Исследование MIT, например, показало, что одна похожая система, использующая алгоритмы глубокого обучения, в 35% случаев думала, что темнокожие женщины являются мужчинами – хотя для белых женщин ошибок практически не было.

Rekognition, конечно, намного умнее. Но всё-таки если на каждую фотографию белого подозреваемого в среднем найдется три-четыре «похожих» лица в базе данных, то для негра она может выдать двадцать или тридцать результатов. Из которых полицейским будет проще найти «того самого», даже если в действительности это не преступник. В результате, опасаются эксперты, процент обысков и арестов среди расовых меньшинств с такой системой может только возрасти. А Америке сейчас только этого не хватало.

Данные FRVT. Чем выше линия – тем больше процент ошибок. Зеленый – белые, красный – черные.

Успешный пример работы похожей технологии в Китае, где полиция в режиме реального времени отслеживает преступников и определяет «людей с низким социальным капиталом» при помощи их фотографии и отпечатков пальцев, критиков Rekognition не впечатляет. Они говорят, в Китае, с его гомогенизированным населением, таким системам работать проще, чем в Америке, учитывая её культурное и расовое разнообразие. Плюс, возможно, китайскому гражданскому обществу и не нравится такое вмешательство государства в частную жизнь людей, просто оно недостаточно организовано, чтобы что-то возразить.

Финальный аргумент противников Rekognition – FRVT. Уже больше года Национальный институт стандартов и технологий в США тестирует системы от десятков компаний, разрабатывающих свои технологии распознавания лиц. Чтобы проверить, какая работает точнее, и у кого какие недостатки в сравнении с остальными. Проект называется Facial Recognition Vendor Test. Именно из него в основном берется информация о том, что всех не-белых не-мужчин системы распознают хуже (из 62 образцов в прошлом году только 4 не показали почти никаких отклонений в зависимости от расы). Amazon свою систему для тестирования институту не предоставляет – что дает скептикам повод еще раз сказать, что «что-то здесь не так».

А вы на чьей стороне, ACLU или Amazon? Дали бы государству своё лицо в базу данных?

P.S. Доставлять покупки из Amazon и других магазинов США можно с Pochtoy.com. У нас самые низкие цены, от $8,99 за полкило. И $7 на счет всех читателей, которые регистрируются с кодом Geektimes.

Факты о распознавании лиц с помощью искусственного интеллекта

Оценка схожести – это статистическая мера вероятности того, что два лица на изображении принадлежат одному и тому же человеку, при анализе в сервисе Amazon Rekognition. Например, изображение, которому была присвоена оценка схожести на уровне 95 %, означает, что среди всех проанализированных сервисом Rekogniton лиц, это изображение имело сходство на 95 % с искомым лицом. Более высокая оценка схожести означает более высокую вероятность того, что оба изображения принадлежат одному человеку. Таким образом, даже сходство на уровне 99 % не гарантирует положительного совпадения.

Это обусловлено тем, что Rekognition использует вероятностную систему, где детерминирование невозможно с абсолютной точностью и является предположением.

Именно здесь применяется порог схожести. Порог схожести – это самая низкая оценка схожести, которую приложение, использующее сервис Rekognition, готово принять в качестве возможного совпадения. Выбор пороговых значений оказывает важнейшее влияние на результаты поиска. Количество неверных идентификаций (ложных результатов), которые может себе позволить клиент, напрямую зависит от установленного порогового значения. Клиент может выбрать соответствующее значение на основании своих потребностей и сценариев использования приложения.

Мы рекомендуем устанавливать значение на уровне 99 % в сценариях использования, где важно получить высокоточное совпадение. Например, в сценариях обеспечения общественной безопасности и правопорядка первым этапом часто является сужение круга лиц, чтобы специалист мог в оперативном порядке проверить и рассмотреть возможные варианты на основании собственных суждений.

С другой стороны, многие сценарии использования не требуют анализа ответов сервиса Amazon Rekognition с участием человека. Например, аутентификация по второму фактору с помощью карточки сотрудника и лица с распознаванием сервисом Amazon Rekognition с высокой оценкой схожести (99 %). Или в приложениях личных фотоальбомов, где допускается несколько неверных совпадений, можно использовать более низкое пороговое значение – 80 %. Клиенты могут задать порог схожести в соответствии с требованиями и особенностями своего сценария использования.

Обнаружение и анализ лиц — Amazon Rekognition

Amazon Rekognition может обнаруживать лица на изображениях и видео. В этом разделе рассматриваются вопросы, не связанные с хранением
операции по анализу лиц. С помощью Amazon Rekognition вы можете получить информацию о
где лица
обнаруживаются на изображении или видео, ориентиры на лице, такие как положение глаз,
а также
обнаруженные эмоции (например, радость или грусть).Вы также можете сравнить лицо
в
изображение с лицами, обнаруженными на другом изображении.

Когда вы предоставляете изображение, содержащее лицо, Amazon Rekognition обнаруживает лицо
на изображении анализирует
черты лица лица, а затем возвращает процентную оценку достоверности для
лицо и
атрибуты лица, обнаруженные на изображении.

В этом разделе приведены примеры анализа лиц как изображений, так и видео. Для большего
Информацию об использовании Amazon Rekognition API см. в разделах Работа с изображениями и Работа с сохраненными видео.

Модели обнаружения лиц, используемые Amazon Rekognition Image и Amazon Rekognition
Видео не поддерживает обнаружение
лиц в мультипликационных / анимационных персонажах или нечеловеческих существ.Если вы хотите обнаружить
героев мультфильмов на изображениях или видео, мы рекомендуем использовать Amazon Rekognition Custom
Этикетки.
Для получения дополнительной информации см.
Руководство разработчика пользовательских меток Amazon Rekognition.

Вы можете использовать операции хранения для сохранения метаданных лица для
лица, обнаруженные на изображении.Позже вы можете искать сохраненные лица как на изображениях, так и на
видео. Например, это позволяет искать
для конкретного человека в видео. Для получения дополнительной информации см. Поиск лиц в коллекции.

Что такое Amazon Rekognition? — Amazon Rekognition

Amazon Rekognition упрощает добавление анализа изображений и видео в ваши приложения.
Ты только
предоставить изображение или видео в API Amazon Rekognition, и служба сможет идентифицировать
объекты,
люди, текст, сцены и действия.Он также может обнаружить любой неприемлемый контент.
Amazon Rekognition также обеспечивает высокоточный анализ лица, сравнение лиц,
и возможности поиска лица. Вы можете
обнаруживать, анализировать и сравнивать лица для самых разных сценариев использования, включая пользовательские
проверка, каталогизация, подсчет людей и общественная безопасность.

Amazon Rekognition основан на той же проверенной, хорошо масштабируемой технологии глубокого обучения.
разработан специалистами по компьютерному зрению Amazon для анализа миллиардов изображений и
видео
повседневная.Для использования не требуется опыта машинного обучения. Amazon Rekognition включает
простой,
простой в использовании API, который может быстро проанализировать любое изображение или видеофайл, хранящийся в
Amazon S3.
Amazon Rekognition постоянно учится на новых данных, и мы постоянно добавляем
новые лейблы и
черты лица сравнения к сервису.Дополнительные сведения см. В разделе часто задаваемых вопросов по Amazon Rekognition.

Распространенные варианты использования Amazon Rekognition:

Библиотеки изображений и видео с возможностью поиска — Amazon Rekognition создает изображения
и сохраненные видео с возможностью поиска, чтобы вы могли обнаруживать объекты и сцены, которые появляются в
их.
Подтверждение пользователя по лицу —
Amazon Rekognition позволяет вашим приложениям подтверждать личность пользователей с помощью
сравнивая свое живое изображение с эталонным изображением.
Настроения и демографический анализ —
Amazon Rekognition интерпретирует эмоциональные выражения, такие как счастье, грусть или удивление,
и демографическая информация, такая как пол, из изображений лиц.Amazon Rekognition
Можно
анализировать изображения и отправлять эмоциональные и демографические атрибуты в Amazon Redshift
для периодической отчетности о тенденциях, например о местонахождении магазинов и подобных сценариях.
Обратите внимание, что предсказание эмоционального выражения основано на внешнем виде.
только лица человека.Это не свидетельствует о внутреннем эмоциональном состоянии человека,
и Rekognition не должны использоваться для принятия такого решения.
Поиск лица — с помощью Amazon Rekognition вы можете выполнять поиск
изображения, сохраненные видео и потоковое видео для лиц, которые соответствуют тем, которые хранятся в
контейнер, известный как
коллекция лиц.Коллекция лиц — это список лиц, которыми вы владеете и которыми управляете.
Для поиска людей по их лицам в Amazon Rekognition необходимо выполнить два основных шага:
1. Проиндексируйте лица.
2. Обыщите лица.
Обнаружение небезопасного содержимого — Amazon Rekognition может
обнаруживать контент для взрослых и сцены насилия на изображениях и в сохраненных видео.Разработчики могут использовать
возвращенные метаданные для фильтрации неприемлемого контента в соответствии с их бизнес-потребностями.
Помимо отметки изображения на основании наличия небезопасного контента, API также
возвращает иерархический список меток с оценками достоверности. Эти метки указывают
определенные категории небезопасного контента, что позволяет выполнять детальную фильтрацию и
управление большими объемами пользовательского контента (UGC).Примеры включают социальные
сайты знакомств, платформы для обмена фотографиями, блоги и форумы, приложения для детей,
сайты электронной коммерции, развлечения и услуги интернет-рекламы.
Признание знаменитостей — Amazon Rekognition может
узнавать знаменитостей в предоставленных изображениях и в видеороликах.Amazon Rekognition может
признать
тысячи знаменитостей из разных категорий, таких как политика, спорт,
бизнес, развлечения и СМИ.
Обнаружение текста — Amazon Rekognition Text in
Изображение позволяет распознавать и извлекать текстовое содержимое из изображений.Текст в
Изображение поддерживает большинство шрифтов, в том числе сильно стилизованные. Он обнаруживает текст и
числа в разной ориентации, например, те, которые обычно встречаются на баннерах и
плакаты. В приложениях для обмена изображениями и социальных сетях вы можете использовать его для включения
визуальный поиск на основе индекса изображений, содержащих одинаковые ключевые слова.В СМИ
и развлекательных приложений, вы можете каталогизировать видео на основе соответствующего текста на
экран, например рекламу, новости, спортивные результаты и субтитры. Наконец, в общественной безопасности
приложений, вы можете идентифицировать автомобили по номерам с изображений
снято уличными камерами.
Пользовательские этикетки — с помощью пользовательских этикеток Amazon Rekognition,
вы можете идентифицировать объекты и сцены на изображениях, которые
в соответствии с потребностями вашего бизнеса.Например, вы можете найти свой логотип в социальных сетях.
сообщения,
идентифицировать вашу продукцию на полках магазинов, классифицировать детали машин на сборочной линии,
отличить здоровый
и зараженные растения, или обнаруживать анимированных персонажей в видеороликах. Чтобы получить больше информации,
посмотреть, что есть
Пользовательские ярлыки Amazon Rekognition? в Руководстве разработчика пользовательских этикеток Amazon Rekognition .

Некоторые из преимуществ использования Amazon Rekognition:

Интеграция мощных средств анализа изображений и видео в
ваши приложения — Вам не нужно компьютерное зрение или глубокое
обучение, чтобы воспользоваться преимуществами надежного анализа изображений и видео в
Amazon Rekognition.С помощью API вы можете легко и быстро создавать изображения и видео.
анализ
в любое веб-приложение, мобильное приложение или приложение на подключенном устройстве.
Анализ изображений и видео на основе глубокого обучения
— Amazon Rekognition использует технологию глубокого обучения для точного анализа изображений, поиска
и сравнивать лица на изображениях, а также обнаруживать объекты и сцены на ваших изображениях и
видео.
Масштабируемый анализ изображений — Amazon Rekognition
позволяет анализировать миллионы изображений, чтобы вы могли создавать и организовывать массивные
объемы визуальных данных.
Интеграция с другими сервисами AWS —
Amazon Rekognition разработан для бесперебойной работы с другими сервисами AWS, такими как Amazon.
S3 и
AWS Lambda.В ответ вы можете вызвать API Amazon Rekognition прямо из Lambda.
в Amazon S3
События. Поскольку Amazon S3 и Lambda масштабируются автоматически в соответствии с требованиями вашего приложения
спроса, вы можете создать масштабируемый, доступный и надежный анализ изображений
Приложения. Например, каждый раз, когда человек приходит к вам домой, ваша дверь
камера может загружать фото посетителя на Amazon S3.Это вызывает лямбда-функцию
который использует операции API Amazon Rekognition для идентификации вашего гостя. Вы можете запустить анализ
непосредственно на изображениях, хранящихся в Amazon S3, без необходимости загружать или перемещать
данные.
Поддержка AWS Identity and Access Management (IAM) упрощает безопасный контроль
доступ к Amazon Rekognition
API-операции.Используя IAM, вы можете создавать пользователей и группы AWS и управлять ими для предоставления
соответствующий доступ к вашим разработчикам и конечным пользователям.
Низкая стоимость — С Amazon Rekognition вы платите за
изображения и видео, которые вы анализируете, и хранимые вами метаданные лиц.Там
нет минимальных сборов или авансовых обязательств. Вы можете начать работу бесплатно и сэкономить
по мере роста с многоуровневой моделью ценообразования Amazon Rekognition.

Amazon Rekognition и соответствие требованиям HIPAA

Это услуга, отвечающая требованиям HIPAA.Дополнительные сведения об AWS, медицинском страховании в США.
Закон о переносимости и подотчетности 1996 г. (HIPAA) и использование сервисов AWS для обработки,
хранить и передавать защищенную медицинскую информацию (PHI), см. Обзор HIPAA.

Вы впервые пользуетесь Amazon Rekognition?

Если вы впервые пользуетесь Amazon Rekognition, мы рекомендуем вам прочитать
следующий
разделы по порядку:

Как работает Amazon Rekognition — этот раздел
представляет различные компоненты Amazon Rekognition, с которыми вы работаете, чтобы создать
непрерывный опыт.
Начало работы с Amazon Rekognition — в этом разделе
вы настраиваете свою учетную запись и тестируете Amazon Rekognition API.
Работа с изображениями — В этом разделе представлена информация о
использование Amazon Rekognition с изображениями, хранящимися в корзинах Amazon S3, и загруженными изображениями
из локальной файловой системы.
Работа с сохраненными видео — В этом разделе представлена информация о
использование Amazon Rekognition с видео, хранящимися в корзине Amazon S3.
Работа с потоковым видео — В этом разделе представлена информация о
использование Amazon Rekognition с потоковым видео.

Amazon Rekognition — Обнаружение и распознавание изображений на основе глубокого обучения

Что вы видите, когда смотрите на это изображение?

Вы могли бы просто увидеть животное. Может быть, вы видите домашнего питомца, собаку или золотистого ретривера. Связь между изображением и этими ярлыками не привязана к вашему мозгу. Вместо этого вы выучили ярлыки, увидев сотни или тысячи примеров. Оперируя на разных уровнях, вы научились отличать животное от растения, собаку от кошки и золотистого ретривера от других пород собак.

Глубокое обучение для обнаружения изображений
Обеспечение компьютерам такого же уровня понимания оказалось очень сложной задачей. На протяжении десятилетий компьютерные ученые использовали множество разных подходов к этой проблеме. Сегодня сложился широкий консенсус в отношении того, что лучший способ решить эту проблему — это глубокое обучение. Глубокое обучение использует комбинацию абстракции функций и нейронных сетей для получения результатов, которые (как однажды сказал Артур Кларк) неотличимы от магии.Однако это требует значительных затрат. Во-первых, вам нужно много работать на этапе обучения. По сути, вы представляете обучающей сети широкий спектр помеченных примеров («это собака», «это домашнее животное» и т. Д.), Чтобы она могла соотносить черты изображения с ярлыками. Этот этап требует больших вычислительных ресурсов из-за размера и многослойности нейронных сетей. После завершения фазы обучения сравнивать новые изображения с обученной сетью становится намного проще.Результаты традиционно выражаются в виде уровней достоверности (от 0 до 100%), а не как холодные и неопровержимые факты. Это позволяет вам решить, какая точность подходит для ваших приложений.

Знакомство с Amazon Rekognition
Сегодня я хотел бы рассказать вам об Amazon Rekognition. Этот полностью управляемый сервис, основанный на глубоком обучении и созданный нашей командой компьютерного зрения на протяжении многих лет, уже ежедневно анализирует миллиарды изображений. Он прошел обучение на тысячах объектов и сцен и теперь доступен для использования в ваших собственных приложениях.Вы можете использовать демонстрационные ролики Rekognition, чтобы протестировать службу, прежде чем погрузиться в нее и начать писать код, использующий Rekognition API.

Rekognition с самого начала разрабатывался для масштабной работы. Он понимает сцены, объекты и лица. Для изображения он вернет список меток. Учитывая изображение с одним или несколькими лицами, оно вернет ограничивающие рамки для каждого лица вместе с атрибутами. Давайте посмотрим, что там говорится о фотографии моей собаки (кстати, ее зовут Луна):

Как видите, Rekognition с высокой степенью достоверности пометил Луну как животное , собаку , питомца и золотистого ретривера .Важно отметить, что эти ярлыки независимы в том смысле, что модель глубокого обучения явно не понимает взаимосвязь, например, между собаками и животными. Так уж вышло, что оба этих ярлыка одновременно присутствовали на собачьих дрессировках, представленных Rekognition.

Давайте посмотрим, как это работает с фотографией моей жены и меня:

Amazon Rekognition нашла наши лица, установила ограничивающие рамки и сообщила мне, что моя жена счастлива (снимок был сделан в день ее рождения, поэтому я очень надеюсь, что она была счастливой).

Вы также можете использовать Rekognition, чтобы сравнивать лица и видеть, содержит ли данное изображение какое-либо одно из ряда лиц, которые вы просили его распознать.

Вся эта мощь доступна из набора функций API (консоль отлично подходит для быстрых демонстраций). Например, вы можете вызвать DetectLabels , чтобы программно воспроизвести мой первый пример, или DetectFaces , чтобы воспроизвести мой второй. Вы можете сделать несколько вызовов IndexFaces , чтобы подготовить Rekognition к распознаванию некоторых лиц.Каждый раз, когда вы это делаете, Rekognition извлекает из изображения некоторые функции (известные как векторы лиц), сохраняет векторы и удаляет изображение. Вы можете создать одну или несколько коллекций Rekognition и хранить в каждой связанные группы векторов лиц.

Rekognition может напрямую обрабатывать изображения, хранящиеся в Amazon Simple Storage Service (S3). Фактически, вы можете использовать функции AWS Lambda для обработки недавно загруженных фотографий в любом желаемом масштабе. Вы можете использовать AWS Identity and Access Management (IAM) для управления доступом к API Rekognition.

Приложения для Rekognition
Итак, для чего это можно использовать? У меня есть множество идей для начала!

Если у вас большая коллекция фотографий, вы можете пометить их и проиндексировать с помощью Amazon Rekognition. Поскольку Rekognition — это служба, вы можете обрабатывать миллионы фотографий в день, не беспокоясь о настройке, запуске или масштабировании какой-либо инфраструктуры. Вы можете реализовать визуальный поиск, просмотр на основе тегов и всевозможные интерактивные модели обнаружения.

Вы можете использовать Rekognition в нескольких различных контекстах аутентификации и безопасности. Вы можете сравнить лицо на веб-камере с фотографией на значке, прежде чем разрешить сотруднику войти в безопасную зону. Вы можете осуществлять визуальное наблюдение, изучать фотографии на предмет предметов или людей, представляющих интерес или беспокойство.

Вы можете создавать «умные» маркетинговые рекламные щиты, которые собирают демографические данные о зрителях.

Уже доступно
Rekognition теперь доступно на востоке США (Сев.Вирджиния), Запад США (Орегон) и Европа (Ирландия), и вы можете начать использовать его сегодня. В рамках уровня бесплатного пользования AWS вы можете анализировать до 5000 изображений в месяц и сохранять до 1000 векторов лиц каждый месяц в течение всего года. После этого (и при большем объеме) вы будете платить многоуровневую цену в зависимости от количества изображений, которые вы анализируете, и количества векторов лиц, которые вы храните.

Готовы узнать больше? У нас будет вебинар 13 декабря. Зарегистрируйтесь здесь.

— Джефф;

Custom Labels Amazon Rekognition

Введение

С помощью настраиваемых меток Amazon Rekognition вы можете идентифицировать объекты и сцены на изображениях, которые соответствуют потребностям вашего бизнеса. Например, вы можете найти свой логотип в сообщениях в социальных сетях, идентифицировать свои продукты на полках магазинов, классифицировать детали машин на конвейере, различать здоровые и зараженные растения или обнаруживать анимированных персонажей в видеороликах.

Разработка пользовательской модели для анализа изображений — серьезное мероприятие, требующее времени и ресурсов, на выполнение которых часто уходят месяцы.Кроме того, часто требуются тысячи или десятки тысяч помеченных вручную изображений, чтобы предоставить модели достаточно данных для точного принятия решений. Сбор этих данных может занять месяцы и потребовать больших групп специалистов по маркировке, чтобы подготовить их для использования в машинном обучении.

С Amazon Rekognition Custom Labels мы берем на себя всю тяжелую работу за вас. Пользовательские метки Rekognition основаны на существующих возможностях Rekognition, которые уже обучены на десятках миллионов изображений во многих категориях.Вместо тысяч изображений вам просто нужно загрузить небольшой набор обучающих изображений (обычно несколько сотен изображений или меньше), которые относятся к вашему варианту использования, в нашу простую в использовании консоль. Если ваши изображения уже помечены, Rekognition может начать обучение всего за несколько кликов. Если нет, вы можете пометить их прямо в интерфейсе маркировки Rekognition или использовать Amazon SageMaker Ground Truth, чтобы пометить их за вас. Как только Rekognition начнет обучение с вашего набора изображений, он сможет создать для вас пользовательскую модель анализа изображений всего за несколько часов.За кулисами Rekognition Custom Labels автоматически загружает и проверяет данные обучения, выбирает правильные алгоритмы машинного обучения, обучает модель и предоставляет метрики производительности модели. Затем вы можете использовать свою пользовательскую модель через API пользовательских меток Rekognition и интегрировать ее в свои приложения.

Примеры использования

Точно измеряйте охват бренда

Маркетинговые агентства должны точно сообщать об освещении бренда их клиентами в различных СМИ.Обычно они вручную отслеживают появление логотипов и продуктов своих клиентов на изображениях в социальных сетях, трансляциях и спортивных видео. С помощью настраиваемых этикеток Amazon Rekognition агентства могут создавать настраиваемые модели, специально обученные обнаруживать логотипы и продукты своих клиентов. Вместо того, чтобы кропотливо пытаться вручную следить за традиционными и социальными сетями, они могут обрабатывать изображения и видеокадры с помощью пользовательской модели, чтобы определить количество показов.

Откройте для себя контент для распространения

Производителям контента обычно приходится искать среди тысяч изображений и видео контент, который они хотят использовать для создания шоу.Например, спортивному вещателю часто требуется собрать для своих партнеров лучшие фильмы об играх, командах и игроках, что может занять несколько часов, чтобы вручную собрать их из архивов. Обучая пользовательские модели для определения команд и игроков по форме и номеру, а также для определения общих игровых событий, таких как забитые голы, пенальти и травмы, они могут быстро составить соответствующий список изображений и клипов, соответствующих тематике фильма.

Повышение операционной эффективности

Сельскохозяйственные компании должны оценить качество своей продукции перед ее упаковкой.Например, производитель томатов может вручную классифицировать томаты по 6 группам спелости от зрелого зеленого до красного и соответственно упаковать их для обеспечения максимального срока хранения. Вместо того, чтобы вручную исследовать каждый помидор, они могут обучить пользовательскую модель для классификации помидоров на основе их критериев спелости. Интегрируя модель со своими производственными системами, они могут автоматически сортировать помидоры и соответственно упаковывать их.

Ключевые особенности

Упростите маркировку данных

Консоль Rekognition Custom Labels предоставляет визуальный интерфейс, позволяющий быстро и просто маркировать изображения.Интерфейс позволяет применять метку ко всему изображению или идентифицировать и маркировать определенные объекты на изображениях с помощью ограничивающих рамок с простым интерфейсом «щелкни и перетащи».

Автоматизированное машинное обучение

Для создания собственной модели не требуется специальных знаний в области машинного обучения. Пользовательские метки Rekognition включают возможности AutoML, которые позаботятся о машинном обучении за вас.После предоставления обучающих изображений пользовательские метки Rekognition могут автоматически загружать и проверять данные, выбирать правильные алгоритмы машинного обучения, обучать модель и предоставлять метрики производительности модели.

Упрощенная оценка модели, вывод и обратная связь

Оцените производительность вашей пользовательской модели на своем тестовом наборе. Для каждого изображения в тестовом наборе вы можете увидеть параллельное сравнение прогноза модели и прогноза.присвоенный ярлык. Вы также можете просмотреть подробные показатели производительности, такие как показатели точности / отзыва, f-балл и оценки достоверности. Вы можете сразу начать использовать свою модель для анализа изображений или повторять и повторно обучать новые версии с большим количеством изображений для повышения производительности. После того, как вы начнете использовать свою модель, вы отслеживаете свои прогнозы, исправляете любые ошибки и используете данные обратной связи для переобучения новых версий модели и повышения производительности.

Успех клиентов

Создание синдицированного контента

«В сегодняшнем медиа-ландшафте объем неструктурированного контента, которым управляют организации, растет в геометрической прогрессии.Используя традиционные инструменты, пользователи могут столкнуться с трудностями при поиске среди тысяч медиаресурсов, чтобы найти определенный элемент, который они ищут. Используя новую функцию Custom Labels в Amazon Rekognition, мы можем автоматически создавать теги метаданных, адаптированные к конкретным сценариям использования для нашего бизнеса, и предоставлять доступные для поиска аспекты для наших групп по созданию контента. Это значительно увеличивает скорость, с которой мы можем искать контент, и, что более важно, позволяет нам автоматически помечать элементы, которые раньше требовали ручных усилий.Эти инструменты позволяют нашим производственным командам напрямую использовать эти данные и предоставлять улучшенные продукты нашим клиентам на всех наших медиа-платформах ».

Брэд Бойм, старший директор, постпродакшн и управление активами, NFL Media

Повышение эффективности маркетинга

С внедрением Amazon Rekognition Custom Labels маркетологи будут оснащены расширенными возможностями в нашей Agile Creative Studio, что позволит им создавать и обучать конкретные продукты (пользовательские метки), которые им важны, в их рекламе, в масштабе, в течение нескольких минут.Используя интеграцию VidMob с Amazon Rekognition, клиенты исторически могли идентифицировать общие объекты, но теперь новая возможность настраиваемых меток сделает нашу платформу еще более целевой для любого бизнеса. Благодаря увеличению творческой производительности на 150% и сокращению времени * аналитика * на 30%, это адаптивно расширит их способность оценивать свою творческую эффективность с помощью Agile Creative Studio от VidMob »

Алекс Коллмер, генеральный директор, VidMob

About Me

Dashy

Amazon recognition: Amazon Rekognition – видео и изображения – AWS