Sdk abbyy: Модуль сравнения документов — ABBYY FineReader Engine

Содержание

публичный API распознавания в облаке Windows Azure / Блог компании ABBYY / Хабр

До недавнего времени в вебе наши технологии распознавания «жили» только на сайте www.abbyyonline.com, этот сервис предназначен для конечных пользователей. И вот теперь мы готовы объявить о запуске бета версии веб-API распознавания для разработчиков. Знакомьтесь – ABBYY Cloud OCR SDK, «облачный брат» уже знакомого нашим читателям ABBYY FineReader Engine.

Нам уже достаточно давно хотелось выпустить продукт, который позволял бы использовать OCR-технологии со всевозможных «тонких» и не очень устройств и всевозможных операционных систем и при этом был удобен и недорог. Надеемся, у нас это получилось. ABBYY Cloud OCR SDK предполагает оплату по мере использования, так что функции качественного распознавания становятся доступны при минимальных начальных вложениях.

Под катом мы подробнее расскажем о том, как мы над ним работали и что у нас получилось. Пока сервис находится в закрытом бета-тестировании, но мы считаем, что он уже достаточно стабилен, и стадия открытой беты всё ближе. Мы хотели бы пригласить читателей Хабра стать одними из первых «внешних» бета-тестеров ABBYY Cloud OCR SDK. О том, как получить доступ, – тоже под катом.

Облачное API распознавания можно использовать во многих сценариях. Например, включить функциональность распознавания в приложение, в котором она не является основной. Или можно сделать «лёгкое» приложение для мобильного телефона, в котором пользователь фотографирует документ, потом этот документ отправляется на сервер для распознавания, а назад приходит результат. По такому сценарию можно сделать программу, распознающую визитки, почти на всех телефонах.

Можно также добавить распознавание к веб-приложению. Установить на сервер FineReader Engine по-прежнему можно, но если хочется обойтись без этого, то облачный сервис здесь должен помочь.

API сервиса

Для первой версии нам очень хотелось, чтобы API распознавания был доступен из-под любой операционной системы и с любого устройства, имеющего выход в интернет, при этом оставаясь насколько можно простым.
Поэтому мы сделали его в виде нескольких RESTful запросов создания задания, получения информации о статусах и ссылок на скачивание результатов. Каждый запрос на обработку должен быть авторизован, при желании можно включить ssl и зашифровать трафик.

Типичный сценарий работы с сервисом выглядит так. Клиентская программа, передавая изображения с помощью одного или нескольких POST-запросов, формирует задание на сервере. После того, как задание сформировано, надо отправить его на обработку, указав настройки обработки. Настройки зависят от типа выполняемой обработки.

Например, если производится простое распознавание целого документа, можно (есть умолчания) указать язык документа и формат, в котором хочется получить результат. Сейчас поддерживаются pdf, docx, txt, xml и несколько других.

Можно распознавать штрихкоды (движок сам находит штрихкод на картинке и определяет его тип), можно распознавать рукопечатный текст, которым обычно заполняют анкеты. Также мы вывели в API распознаватель визитных карточек: вы передаёте на сервер изображение визитки, а в ответ получаете vCard с распознанным текстом и всеми найденными полями: имя, фамилия, адрес и т.п.

Сервер после каждого запроса выдаёт xml, в котором находится вся информация о задании: его идентификатор, стоимость, статус и примерное время до окончания обработки.

Готовые к обработке задания помещаются в очередь сервера, откуда их берёт очередной освободившийся обработчик. Клиентская программа узнаёт об изменениях статусов заданий через специальный запрос.

После того, как задание обработано, в ответе сервера появляется ссылка, по которой можно скачать результат.

Схематично последовательность команд для обработки одной фотографии изображена на рисунке:

Крупнее

В идеальном случае требуется всего лишь 3 запроса – в первом запросе изображение отправляется на сервер и ставится в очередь на обработку. Во втором узнаётся, что задание готово, и получается ссылка на скачивание. По третьему запросу скачивается результат.

Мы планируем дальше расширять API сервиса. Появятся уведомления об изменении статусов заданий через предоставляемые пользователями URL, расширенные настройки заданий и многое другое. При проектировании следующей версии API также надеемся получить от вас информацию о фичах, которых не хватает продукту в ваших сценариях использования.

Как всё устроено внутри

Сервис работает под управлением Windows Azure. Это оказалось довольно удобно, нет необходимости думать о железе и операционной системе, под которыми всё работает, и можно сосредоточиться на логике приложения.

Схематично архитектура решения выглядит так:

Сервис состоит из нескольких частей. Пользовательские данные хранятся в Blob storage, настройки и задания – в базе данных. Веб-роли отвечают за взаимодействие с пользовательскими приложениями и веб-интерфейс, а рабочие роли занимаются собственно распознаванием.

Web-роли реализуют RESTful API сервиса. Они авторизуют пользователя, получают задания, складывают изображения в blob storage, описания заданий помещаются в базу данных, а также генерируют ответы.
Несколько worker-ролей отвечают за обработку заданий. Из базы данных берётся идентификатор очередного задания, из blob’а – файлы, относящиеся к этому заданию. Всё обрабатывается, затем результаты помещаются в blob, а в базе данных делается отметка, что задание успешно обработано.

Затем, после того, как пользовательское приложение в очередной раз поинтересуется статусом своего задания, для него генерируется специальная ссылка на blob, по которой можно получить результат. Ссылка имеет ограниченный срок жизни и специальную контрольную сумму, так что получить доступ к результатам, даже зная идентификатор вашего задания, можно только посредством этой ссылки.

Обработанные задания живут на сервере в течение некоторого времени, после чего они удаляются.

Клиенты и платформы

Для API Cloud OCR SDK достаточно просто написать клиент на любом языке программирования и для любой операционной системы.

Например, для любителей чистого линукса у нас есть скрипт на bash + curl. Полный цикл обработки файла – всего 10 строчек кода. Надеемся, достаточно понятного :-).

Для сторонников более традиционных решений есть примеры клиентов на .net, java и python, а также шаблоны приложений для Android.

Все исходные коды выложены в виде проекта на github. Мы надеемся постепенно их совершенствовать, прислушиваясь к вашим пожеланиям.

Бета-тестирование

Мы приглашаем всех пользователей Хабра принять участие в бета-тестировании сервиса. Если вы хотите присоединиться к тестированию, заходите на адрес http://ocrsdk.com. Для начала нужно зарегистрироваться и заполнить анкету-заявку на использование ABBYY Cloud OCR SDK. Любой пользователь, заполнивший анкету, сразу получает возможность бесплатно распознать 100 страниц или 500 небольших текстовых кусочков. Но если по каким-то причинам вам этого не хватило – пишите нам, добавим еще 🙂

Чтобы вам было легче начать работать с сервисом, мы сделали несколько примеров на популярных языках программирования и подобрали базу изображений, на которых можно бесплатно потестироваться.
Кроме того, и во время бета-тестирования, и после мы применяем принцип не брать дважды деньги за распознавание одного и того же изображения. Если вы уже распознали картинку один раз, после этого её можно повторно распознавать с другими настройками, но уже бесплатно. Это особенно полезно, если вы отлаживаете логику своего приложения, гоняя его по кругу под отладчиком. Мы уверены, что такое использование не должно быть платным для разработчика. Для проверки на совпадение изображений мы сверяем их контрольные суммы но, увы, не можем проверять на совпадение разные фотографии одного и того же документа.

Нам очень интересны ваши отзывы и пожелания! Пишите их в комментариях к этому тексту или по адресу техподдержки в личном кабинете пользователя на http://ocrsdk.com.

Update: В анкете и в письмах нам можно писать по-русски :-).

Василий Панферов,
Департамент продуктов для разработчиков

Единая облачная платформа ABBYY Cloud

Единая облачная платформа всех продуктов и сервисов ABBYY (включая услуги и технологии перевода). Благодаря облачному сервису современные технологии распознавания текста становятся доступны любому независимому разработчику приложений.

Сервис ABBYY Cloud OCR SDK (OCR — optical character recognition; SDK — software development kit) предоставляет доступ к передовым технологиям оптического распознавания текста, меток и штрихкодов посредством Web API.

Любой разработчик получает возможность реализовать в своих приложениях распознавание печатных текстов на 198 языках, а также распознавание текстов, написанных печатными буквами от руки на 113 языках.

Это самый быстрый в плане приобретения и подготовки к работе инструмент разработки. Все процедуры для начала использования сервиса выполняются онлайн, без привлечения сотрудников компании-поставщика и без необходимости обязательного заключения письменного лицензионного соглашения. Для ABBYY Cloud OCR SDK создана оптимальная модель ценообразования, при которой разработчик оплачивает распознавание только того объема документов, который необходим.

Процесс создания приложений ускоряется благодаря наличию примеров кода на .NET, PHP, Ruby, cURL, Python, Java и ASP.NET.

Благодаря размещению в облаке и непрерывному обновлению ABBYY Cloud OCR SDK позволяет разработчикам пользоваться самой актуальной версией технологий распознавания текстов. Нет необходимости приобретать следующую версию продукта, как это происходит в случае использования традиционного SDK.

С ABBYY Cloud OCR SDK все необходимые ресурсы находятся в облаке, тем самым разработчики освобождаются от дополнительных расходов на ИТ-инфраструктуру. Сервис функционирует на платформе Microsoft® Windows® Azure™, что не только освобождает вычислительные мощности разработчика от дополнительной нагрузки, но и обеспечивает дополнительную надежность приложений.

Работу с ABBYY Cloud OCR SDK можно начинать с любого числа документов, и в зависимости от задач увеличивать или уменьшать объем использования, сервис применим как для обработки небольшого количества документов, так и для оцифровки больших архивов.

ABBYY Intelligent Tagger SDK

ABBYY Intelligent Tagger SDK – это инструментарий разработчика, который анализирует неструктурированную текстовую информацию и автоматически извлекает из нее именованные сущности (персоны, организации, даты и другие) и метаданные документов. Полученные данные можно использовать для совершенствования и автоматизации различных бизнес-задач, таких как поиск и анализ знаний, классификация и маршрутизация входящей информации, управление документацией и выявление конфиденциальных данных в ней.

Уникальная лингвистическая технология ABBYY Compreno, лежащая в основе ABBYY Intelligent Tagger SDK, позволяет понимать семантические значения всех слов в тексте, выявлять смысловые связи между ними и определять общий контекст всего документа. Это обеспечивает высокую точность и полноту выявления сущностей в текстах.

Простота использования, подробная документация для разработчика, высокое качество анализа текстовых данных делает ABBYY Intelligent Tagger SDK незаменимым средством для создания интеллектуальных решений, способных эффективно работать с неструктурированной информацией.

ABBYY Intelligent Tagger SDK применяется для решения следующих задач:

  • Управление документооборотом
    — Совершенствование поисковых систем (поиск и фильтрация по сущностям и метаданным).
    — Оптимизация хранения документации (классификация, своевременное удаление).
    — Фильтрация электронной почты.
  • Управление рисками
    — Анализ информации с высоким рисковым потенциалом.
    — Мониторинг и предотвращение утечки данных.
    — Соответствие внутренним нормам и контроль над хранением конфиденциальных данных.
  • Запуск и автоматизация бизнес-процессов
    — Анализ поступающих запросов в компанию и их маршрутизация.
    — Оптимизация процессов согласования документов.

Преимущества ABBYY Intelligent Tagger SDK:

  • Обеспечивает высокую точность и полноту извлечения сущностей из текстов.
  • Выполняет анализ автоматически; не требуется предварительно вручную размечать документы.
  • Извлекает сущности без использования специализированных пользовательских словарей, поэтому разработка и внедрение не требуют дополнительных вложений и времени.

Возможности:

  • Извлечение сущностей. ABBYY Intelligent Tagger SDK использует семантико-синтаксический анализ, благодаря чему может обрабатывать неструктурированную информацию и с высокой точностью извлекать из нее именованные сущности следующих типов: персоны, организации, локации, денежные суммы и время. Дополнительные типы сущностей могут быть добавлены по запросу.
  • Извлечение метаданных. Типы метаданных включают в себя различные свойства документов, такие как: автор, название, даты создания и модификации, формат и другие. Используя эти данные, можно реализовать поиск или фильтрацию документов по различным параметрам.
  • Извлечение данных по расписанию. Процесс анализа данных можно запланировать, исходя из потребностей организации, например, в зависимости от регулярности появления новой информации или её обновления. Это позволяет эффективно управлять процессом обработки – анализировать данные с заданной периодичностью в автоматическом режиме или по мере необходимости.
  • Широкий ряд поддерживаемых форматов. ABBYY Intelligent Tagger SDK поддерживает большинство популярных форматов документов – текстовые файлы, таблицы Excel, web-страницы, электронные письма, презентации, архивы и другие. Благодаря этому можно эффективно обрабатывать различные виды корпоративной информации.
    Инструментарий также включает ABBYY Recognition Server Proxy, который позволяет легко интегрировать решение с ABBYY Recognition Server и обрабатывать файлы в формате PDF и графические форматы ( *.bmp, *.tiff, *.jpeg, *.jpg, *.png, *.gif и многие другие).

Как работает? 


  • Сервер / хранилище данных – центральный компонент ABBYY Intelligent Tagger SDK, который анализирует документы, извлекает из них сущности и метаданные, записывает их в индекс.
  • REST API – компонент, предоставляющий доступ к функциональности ABBYY Intelligent Tagger SDK посредством REST API.
  • Коннектор – компонент, отвечающий за доступ к файлам в файловой системе.
  • ABBYY Recognition Server – серверное решение для распознавания текста и преобразования документов в электронные редактируемые форматы (приобретается отдельно).
  • Консоль администратора – приложение, позволяющее настраивать и контролировать процесс извлечения данных, управлять Станциями обработки, разграничивать права доступа пользователей к документам.

ABBYY Compreno — это система понимания, анализа и перевода текстов на естественных языках. Технология является лингвистической платформой для решения на качественно новом уровне целого спектра прикладных задач, требующих компьютерного анализа текста. А именно: задач в области перевода, интеллектуального поиска на одном или нескольких языках, выявления в текстах ключевых объектов, фактов и связей между ними.

Области применения ABBYY Compreno:

  • Ключевые направления, для которых уже готовы первые решения на основе Compreno:
    — Интеллектуальный поиск (т. н. semantic search) — при выборе наиболее релевантных ответов на запрос учитывает не только все формы слов, но и их значения, смысловые связи между словами и контекст употребления (meanings, relations and context). Такой подход позволяет значительно повысить эффективность поиска в сравнении с традиционными системами.
    — Извлечение объектов (сущностей), а также событий (фактов) и связей между ними в задачах оптимизации бизнес-процессов и мониторинга различных информационных источников (information extraction).
    — eDiscovery – процесс поиска информации в документах компании в рамках юридических разбирательств, аудита и расследований в США, Великобритании и других государств. Процесс eDiscovery требует обработки огромных массивов корпоративной информации для дальнейшего поиска и выявления фактов и доказательств.
  • Перспективные направления разработок:
    — Классификация документов.
    — Выявление полностью и частично дублирующихся документов с указанием различий в их текстах.
    — Анализ тональности высказываний (отношения автора к предмету обсуждения) в текстах, обрабатываемых, в частности, в процессе мониторинга СМИ и социальных сетей.
    — Охрана информационного периметра организации с выявлением фактов передачи несанкционированной информации.
    — Система прогнозирования и оповещения о наступлении событий.
    — Многоязычный поиск, т.е. когда на запрос на одном языке находятся документы на всех языках, поддерживаемых системой.
    — Письменный перевод с одного языка на другой.

Основной принцип работы ABBYY Compreno

Качество решения поисковых и текстово-аналитических задач во многом зависит от того, насколько точно система «может понять» смысл анализируемой информации.

Технология ABBYY Compreno делает большой шаг в этом направлении. В процессе полного семантико-синтаксического разбора ABBYY Compreno определяет семантические значения слов (понятия) в тексте и выделяет все связи между ними, создавая универсальное и не зависящее от языка представление текста. Это представление и есть смысл, и он ясен компьютерам так же, как и людям.

Таким образом, ABBYY Compreno превращает текст, который компьютер чаще всего воспринимает как простую последовательность слов, в «осмысленную» информацию. Это открывает новые возможности для её дальнейшей обработки.


Начинается промышленная эксплуатация облачного инструментария разработчика ABBYY Cloud OCR SDK

Компания ABBYY, ведущий мировой разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, сообщает о начале коммерческой эксплуатации облачного сервиса ABBYY Cloud OCR SDK (OCR – optical character recognition; SDK – software development kit). Данный сервис предоставляет доступ к передовым технологиям оптического распознавания текста, меток и штрихкодов посредством Web API.

Инструментарий разработчика на облачной платформе позволяет избежать высоких начальных расходов на приобретение SDK. Также сервис помогает решать задачи обработки любого объема документов без увеличения расходов на собственную ИТ-инфраструктуру. При этом стоимость пользования ABBYY Cloud OCR SDK зависит от объемов его использования, а входной порог находится на уровне, приемлемом для любого разработчика, в том числе для энтузиастов-любителей.

Впервые сервис ABBYY Cloud OCR SDK был анонсирован в конце 2011 года. За несколько месяцев работы сервиса в тестовом режиме на нем зарегистрировались сотни разработчиков.

«На российском рынке сервисом ABBYY Cloud OCR SDK интересуются, прежде всего, небольшие компании, а также независимые разработчики, для которых покупка традиционного SDK является нецелесообразной с точки зрения решаемых задач. Также данное решение будет интересно разработчикам, которым необходимо обеспечить в своих приложениях возможности распознавания текстов, но при этом сложно спрогнозировать объемы таких задач», – комментирует Григорий Липич, генеральный директор ABBYY Россия.

Ключевые преимущества использования ABBYY Cloud OCR SDK:

Высокая точность распознавания

Технологии ABBYY получили признание во всем мире благодаря высокой точности распознавания. ABBYY Cloud OCR SDK предоставляет любому разработчику возможность реализовать в своих приложениях распознавание печатных текстов (OCR) на 198 языках на базе латиницы, кириллицы, армянского, греческого, еврейского и тайского алфавитов, японских, корейских и китайских иероглифов, а также распознавание текстов, написанных печатными буквами от руки (ICR) на 113 языках.

Быстрое начало использования

ABBYY Cloud OCR SDK – это самый быстрый в плане приобретения и подготовки к работе инструмент разработки. Все процедуры для начала использования сервиса (регистрация, тестирование, оплата) выполняются онлайн, без привлечения сотрудников компании ABBYY и без необходимости обязательного заключения письменного лицензионного соглашения.

Процесс создания приложений ускоряется благодаря наличию примеров кода на .NET, PHP, Ruby, cURL, Python, Java и ASP.NET. Кроме этого, пользователи сервиса могут обратиться за поддержкой на онлайн-форум.

Всегда самая актуальная версия технологий

Благодаря размещению в облаке и непрерывному обновлению ABBYY Cloud OCR SDK позволяет разработчикам пользоваться самой актуальной версией технологий распознавания текстов. Нет необходимости приобретать следующую версию продукта, как это происходит в случае использования традиционного SDK.

Сокращение расходов на ИТ и повышение надежности приложений

Из-за ресурсоемкости процесса OCR встраивание функций распознавания обычно требует заметных инвестиций на приобретение и поддержку дополнительных вычислительных мощностей. С ABBYY Cloud OCR SDK все необходимые ресурсы находятся в облаке, тем самым разработчики освобождаются от дополнительных расходов на ИТ-инфраструктуру.

Сервис функционирует на платформе Microsoft® Windows® Azure™, что не только освобождает вычислительные мощности разработчика от дополнительной нагрузки, но и обеспечивает дополнительную надежность приложений.

Масштабируемость

Работу с ABBYY Cloud OCR SDK можно начинать с любого числа документов, и в зависимости от задач увеличивать или уменьшать объем использования. Это обеспечивает гибкое масштабирование для обработки любого числа документов в максимально короткие сроки. Сервис применим как для обработки небольшого количества документов, так и для оцифровки больших архивов, когда в работе приложения возможны непрогнозируемые пиковые нагрузки.

Оплата только необходимого объема распознанных страниц

Для ABBYY Cloud OCR SDK создана оптимальная модель ценообразования, при которой разработчик оплачивает распознавание только того объема документов, который необходим. Это позволяет компаниям любого размера и независимым разработчикам получать доступ к профессиональным технологиям распознавания ABBYY. Кроме того, предоставляется возможность бесплатного повторного распознавания одних и тех же страниц при отладке и тестировании создаваемых приложений.

 

О компании ABBYY
Российская компания ABBYY – ведущий мировой разработчик программного обеспечения и поставщик услуг в области распознавания и ввода документов, лингвистики и перевода. Более 30 миллионов пользователей и десятки тысяч организаций по всему миру используют решения ABBYY для автоматизации трудоемких процессов, экономя время и превращая информацию в полезные знания. На российском рынке ABBYY является уникальной компанией, лидирующей одновременно в области лингвистических технологий и услуг.

ios4 — Ошибка сборки при попытке создать пример кода ABBYY Mobile OCR SDK

Я связался с техподдержкой abbyy mobile sdk и получил ответ относительно номера сборки:

«Я обнаружил, что нет способа увидеть номер сборки библиотеки dll в Mac OS (ее можно было увидеть только в Windows, извиняюсь за неудобства).»

А затем, в отношении ошибки сборки, я следовал приведенным ниже инструкциям:

Вы используете последнюю версию ABBYY Мobile OCR Engine, поэтому проблема в настройках проекта.

Ниже приведена инструкция по запуску примера для iPhone на Xcode 4.3, iPhoneSDK 5. 1.

Когда вы запускаете Xcode и открываете проект «Sample.private.xcodeproj», Xcode отображает окно «Рабочая область». Панель инструментов обеспечивает быстрый доступ к группе кнопок «Вид» в правом верхнем углу. Нажмите здесь кнопку «Скрыть или показать навигатор» (или то же самое в главном меню xCode: «Вид» → «Навигаторы» → «Показать навигатор проекта»).

«Навигатор проекта» появляется в левой части окна «Рабочая область», содержащего один проект «Sample.private».

Щелкните значок проекта «Sample.private» в навигаторе проекта. Панель «Редактор проектов» появляется справа от навигатора проекта, отображая элемент Project → Sample.private и элемент Target → Sample.

Выберите Project → Sample.private и настройте следующие параметры на вкладке BuildSettings:

• Настройки сборки → раздел Архитектура:

Base SDK = «Последняя версия iOS (iOS 5.1)»

Создать только активную архитектуру = Да

Остальные настройки архитектур должны стать автоматически:

Архитектуры = Стандарт (armv7)

Поддерживаемые платформы = iphoneimulator iphoneos

Действительные архитектуры = armv6 armv7

• Укажите лицензию разработчика для параметра Идентификация подписи кода в разделе Подписывание кода.

• Чтобы указать, какая версия ОС является минимальной, которую будет поддерживать ваше приложение, задайте Цель развертывания iOS в разделе Развертывание.

Выберите Цели → Образец. Здесь также откройте вкладку Build Settings и сделайте почти так же, как для Project → Sample.private:

• Настройки сборки → раздел Архитектура:

Создать только активную архитектуру = Да

Проверьте остальные настройки архитектур:

Architectures = armv6

«Base SDK» = «Последняя версия iOS (iOS 5.1)»

Поддерживаемые платформы = iphoneimulator iphoneos

Допустимые архитектуры = armv6

• Укажите лицензию разработчика для параметра Идентификация подписи кода в разделе Подписывание кода.

• Чтобы указать, какая версия ОС является минимальной для вашего приложения, установите целевой показатель развертывания iOS в разделе Развертывание:

iOS Deployment Target = версия ОС iPhone, на которой планируется запуск образца.

Затем настройте схему. Запустите Sample.app, который открывается по умолчанию из главного меню xCode: Product → Edit Scheme:

• параметр Destination должен быть iOS-устройством (в случае, если мобильное устройство в данный момент отключено от компьютера) или должно быть имя устройства, подключенного к вашему компьютеру в настоящее время, на котором вы собираетесь запустить образец.

• измените параметр Конфигурация сборки на вкладке Информация на iPhone.Debug.

Теперь попробуйте запустить образец на устройстве.

Кроме того, наши инженеры по тестированию заметили, что вы можете получить сообщение типа «Ошибка запуска удаленной программы: не удалось получить задачу для xxx». Когда образец установлен на устройстве и не работает в режиме отладки. Решение этой проблемы подробно описано на разных форумах разработчиков iOS. Вы можете попытаться решить эту проблему, удалив все профили обеспечения, кроме профиля разработчика, с мобильного устройства.

И мне удалось успешно построить образец.

Спасибо, Николай и Зубастик, что помогли мне в этом.

Abbyy представила SDK для мобильного веб-доступа к онлайн-сервисам

Интернет Веб-сервисы

Abbyy разработала Mobile Web Capture – SDK для смартфонов, который помогает удаленно обслуживать клиентов в магазинах, сервисах для аренды автомобилей, гостиницах, телекоммуникационных и других компаниях. Новый продукт работает прямо в браузере смартфона, поэтому компаниям не обязательно создавать и поддерживать собственные мобильные приложения для регистрации пользователей.

Интеллектуальная технология Abbyy обрабатывает любые документы в реальном времени, улучшает качество изображений и делает данные доступными для распознавания, извлечения и анализа. В результате компании получают возможность привлекать больше клиентов с помощью мобильных технологий.

Mobile Web Capture встраивается в любой онлайн-сервис для обработки клиентских документов. Новому пользователю достаточно зайти на сайт компании через мобильный браузер Chrome или Safari.

Клиент наводит камеру на необходимый документ – например, паспорт, водительское удостоверение, кредитную карту, анкету покупателя. Интеллектуальные алгоритмы Abbyy находят документ в видеопотоке, определяют границы и предварительно обрабатывают изображение. Пользователю остается только нажать на кнопку и отправить файл. В сочетании с другими технологиями интеллектуальной обработки информации, Abbyy Mobile Web Capture позволяет полностью автоматизировать удаленную работу с клиентами – от подачи документов до оплаты товара или получения услуги.

«Простота, удобство, интерактивность становятся решающими факторами при выборе сервисов, и особенно это заметно в самообслуживании. Abbyy Mobile Web Capture позволяет компаниям по-новому выстроить взаимодействие с клиентами с помощью смартфона: если раньше для участия в программах лояльности, бронирования ресторана или гостиницы, оплаты билетов и получения других услуг нужно было либо вводить данные вручную, либо устанавливать различные приложения, то теперь обработать необходимые документы можно автоматически прямо на сайте компании», – сказал Дмитрий Шушкин, генеральный директор Abbyy Россия.

Ключевые возможности Abbyy Mobile Web Capture.

Автоматический захват изображения. Чтобы обработать документ, пользователю не нужно делать снимок, достаточно навести на него камеру смартфона. Подготовка изображений для последующего распознавания. Технология определяет контуры документа и позволяет обрезать изображение по его границам.

Mobile Web Capture работает с помощью JavaScript, что значительно упрощает разработку и интеграцию с сайтами компаний. Готовые примеры кода для интеграции с другими решениями и продуктами для интеллектуальной обработки информации – как для мобильных устройств, так и для ПК. Продукт не требует установки на устройство пользователя.

Решения на базе ABBYY Compreno: ABBYY InfoExtractor SDK, ABBYY Smart Classifier SDK и ABBYY Intelligent Search SDK

Все по полочкам
Решения на базе ABBYY Compreno: ABBYY InfoExtractor SDK, ABBYY Smart Classifier SDK и ABBYY Intelligent Search SDK

31.03.2015
12:45

 

Компания ABBYY своим продуктом ABBYY Compreno решила задачу быстрой обработки неструктурированной информации на естественных языках, объемы которой в организациях растут быстрыми темпами.


Технология ABBYY Compreno выполняет полный семантико-синтаксический анализ текста, что отличает представляемую разработку от аналогов на рынке. Это позволяет повысить качество анализа необходимой информации, сделав его более полным и точным. Технология без дополнительной адаптации помогает извлекать из документов ключевые факты и в оптимальные сроки настраивается на предметную область заказчика. ABBYY Compreno обеспечивает качественную работу на русском и английском языках.


Кроме анализа и извлечения нужной информации из массивов неструктурированных данных внутренних и внешних источников решения ABBYY Compreno позволяют распределять поток входящих документов по департаментам и ответственным и усовершенствовать поисковые системы.


Технологии ABBYY могут быть встроены в различные информационные системы — ECM и ERP, расширяя и дополняя их уникальными возможностями извлечения, анализа и поиска необходимой информации.


На базе ABBYY Compreno в данный момент реализовано три решения: ABBYY InfoExtractor SDK, ABBYY Smart Classifier SDK и ABBYY Intelligent Search SDK.


Решение ABBYY Compreno вызвало интерес у различных предприятий и организаций. Пилотные проекты с использованием Compreno стартовали в Государственной Думе, КЭС-Холдинге, крупной нефтяной, энергетической и других компаниях из разных отраслей.
 

SDK OCR на базе искусственного интеллекта для Windows, Linux и Mac OS

— страна —AfghanistanAland IslandsAlbaniaAlgeriaAmerican SamoaAndorraAngolaAnguillaAntarcticaAntigua и BarbudaArgentinaArmeniaArubaAustraliaAustriaAzerbaijanBahamasBahrainBangladeshBarbadosBelarusBelgiumBelizeBeninBermudaBhutanBoliviaBonaire, Синт-Эстатиус и SabaBosnia и HerzegovinaBotswanaBouvet IslandBrazilBritish Индийский океан TerritoryBruneiBulgariaBurkina FasoBurundiCambodiaCameroonCanadaCape VerdeCayman IslandsCentral африканских RepublicChadChileChinaChristmas IslandCocos (Килинг) IslandsColombiaComorosCongo, Демократическая Республика (Киншаса) Конго, Республика (Браззавиль) Кук IslandsCosta RicaCôte d` IvoireCroatiaCubaCuracaoCyprusCzech RepublicDenmarkDjiboutiDominicaDominican RepublicEcuadorEgyptEl SalvadorEquatorial GuineaEritreaEstoniaEthiopiaFalkland IslandsFaroe IslandsFijiFinlandFranceFrench GuianaFrench PolynesiaFrench Южный TerritoriesGabonGambiaGeorgiaGermanyGhanaGibraltarGreeceGreenlandGrenadaGuadeloupeGuamGuatemalaGuernseyGuineaGuinea-BissauGuyanaHaitiHeard I sland и McDonald IslandsHondurasHong KongHungaryIcelandIndiaIndonesiaIranIraqIrelandIsle из ManIsraelItalyJamaicaJapanJerseyJordanKazakhstanKenyaKiribatiKorea, NorthKorea, SouthKuwaitKyrgyzstanLaosLatviaLebanonLesothoLiberiaLibyaLiechtensteinLithuaniaLuxembourgMacaoMacedoniaMadagascarMalawiMalaysiaMaldivesMaliMaltaMarshall IslandsMartiniqueMauritaniaMauritiusMayotteMexicoMicronesiaMoldovaMonacoMongoliaMontenegroMontserratMoroccoMozambiqueMyanmarNamibiaNauruNepalNetherlandsNew CaledoniaNew ZealandNicaraguaNigerNigeriaNiueNorfolkNorthern Mariana IslandsNorwayOmanPakistanPalauPalestinePanamaPapua Нового GuineaParaguayPeruPhilippinesPitcairnPolandPortugalPuerto RicoQatarReunionRomaniaRussian FederationRwandaSaint BarthélemySaint HelenaSaint LuciaSaint Мартин (французская часть) Сент-Винсент и GrenadinesSaint-Киттс и NevisSaint-Пьер и MiquelonSamoaSan MarinoSao Том и PrincipeSaudi ArabiaSenegalSerbiaSeychellesSierra LeoneSingaporeSint MaartenSlovakiaSloveniaSolomon IslandsSomaliaSou й AfricaSouth Грузия и Южные Сандвичевы IslandsSouth SudanSpainSpitsbergen (Норвегия) Шри LankaSudanSurinameSwazilandSwedenSwitzerlandSyriaTaiwanTajikistanTanzaniaThailandThe VaticanTimor-LesteTogoTokelauTongaTrinidad и TobagoTunisiaTurkeyTurkmenistanTurks и Кайкос IslandsTuvaluUgandaUkraineUnited арабских EmiratesUnited KingdomUnited Внешние малые острова IslandsUruguayUSAUzbekistanVanuatuVenezuelaVietnamVirgin, BritishVirgin острова, U. С.Уоллис и Футуна, Западная Сахара, Йемен, Замбия, Зимбабве.

Город

Детали проекта

Я согласен получать по электронной почте обновления от ABBYY, такие как новости, связанные с продуктами и технологиями ABBYY, приглашения на мероприятия и веб-семинары, а также информацию о технических документах и ​​материалах, связанных с продуктами и услугами ABBYY.

Мне известно, что я могу отозвать свое согласие полностью или частично в любое время с вступлением в силу в будущем.

Чтобы отозвать свое согласие, перейдите на веб-страницу отказа от подписки или отправьте электронное письмо по адресу [email protected]

Я согласен получать по электронной почте обновления от ABBYY, такие как новости, связанные с продуктами и технологиями ABBYY, приглашения на мероприятия и веб-семинары, а также информацию о технических документах и ​​материалах, связанных с продуктами и услугами ABBYY.

Мне известно, что я могу отозвать свое согласие полностью или частично в любое время с вступлением в силу в будущем.

Чтобы отозвать свое согласие, перейдите на веб-страницу отказа от подписки или отправьте электронное письмо по адресу [email protected]

Пожалуйста, информируйте меня о новых продуктах и ​​обновлениях. Я понимаю, что могу в любой момент отказаться от подписки на электронные письма, которые будут приходить мне от ABBYY USA Software House Inc.(«Глобальный офис ABBYY в Северной Америке»)

Присылайте мне информацию о выпусках новых продуктов, изменении цен и специальных предложениях от ABBYY.

Отправляя эту форму, я даю согласие на использование моей личной информации для целей, описанных в Уведомлении о конфиденциальности.

функций распознавания текста с исключительной точностью

— страна —AfghanistanAland IslandsAlbaniaAlgeriaAmerican SamoaAndorraAngolaAnguillaAntarcticaAntigua и BarbudaArgentinaArmeniaArubaAustraliaAustriaAzerbaijanBahamasBahrainBangladeshBarbadosBelarusBelgiumBelizeBeninBermudaBhutanBoliviaBonaire, Синт-Эстатиус и SabaBosnia и HerzegovinaBotswanaBouvet IslandBrazilBritish Индийский океан TerritoryBruneiBulgariaBurkina FasoBurundiCambodiaCameroonCanadaCape VerdeCayman IslandsCentral африканских RepublicChadChileChinaChristmas IslandCocos (Килинг) IslandsColombiaComorosCongo, Демократическая Республика (Киншаса) Конго, Республика (Браззавиль) Кук IslandsCosta RicaCôte d` IvoireCroatiaCubaCuracaoCyprusCzech RepublicDenmarkDjiboutiDominicaDominican RepublicEcuadorEgyptEl SalvadorEquatorial GuineaEritreaEstoniaEthiopiaFalkland IslandsFaroe IslandsFijiFinlandFranceFrench GuianaFrench PolynesiaFrench Южный TerritoriesGabonGambiaGeorgiaGermanyGhanaGibraltarGreeceGreenlandGrenadaGuadeloupeGuamGuatemalaGuernseyGuineaGuinea-BissauGuyanaHaitiHeard I sland и McDonald IslandsHondurasHong KongHungaryIcelandIndiaIndonesiaIranIraqIrelandIsle из ManIsraelItalyJamaicaJapanJerseyJordanKazakhstanKenyaKiribatiKorea, NorthKorea, SouthKuwaitKyrgyzstanLaosLatviaLebanonLesothoLiberiaLibyaLiechtensteinLithuaniaLuxembourgMacaoMacedoniaMadagascarMalawiMalaysiaMaldivesMaliMaltaMarshall IslandsMartiniqueMauritaniaMauritiusMayotteMexicoMicronesiaMoldovaMonacoMongoliaMontenegroMontserratMoroccoMozambiqueMyanmarNamibiaNauruNepalNetherlandsNew CaledoniaNew ZealandNicaraguaNigerNigeriaNiueNorfolkNorthern Mariana IslandsNorwayOmanPakistanPalauPalestinePanamaPapua Нового GuineaParaguayPeruPhilippinesPitcairnPolandPortugalPuerto RicoQatarReunionRomaniaRussian FederationRwandaSaint BarthélemySaint HelenaSaint LuciaSaint Мартин (французская часть) Сент-Винсент и GrenadinesSaint-Киттс и NevisSaint-Пьер и MiquelonSamoaSan MarinoSao Том и PrincipeSaudi ArabiaSenegalSerbiaSeychellesSierra LeoneSingaporeSint MaartenSlovakiaSloveniaSolomon IslandsSomaliaSou й AfricaSouth Грузия и Южные Сандвичевы IslandsSouth SudanSpainSpitsbergen (Норвегия) Шри LankaSudanSurinameSwazilandSwedenSwitzerlandSyriaTaiwanTajikistanTanzaniaThailandThe VaticanTimor-LesteTogoTokelauTongaTrinidad и TobagoTunisiaTurkeyTurkmenistanTurks и Кайкос IslandsTuvaluUgandaUkraineUnited арабских EmiratesUnited KingdomUnited Внешние малые острова IslandsUruguayUSAUzbekistanVanuatuVenezuelaVietnamVirgin, BritishVirgin острова, U. С.Уоллис и Футуна, Западная Сахара, Йемен, Замбия, Зимбабве.

Город

Детали проекта

Я согласен получать по электронной почте обновления от ABBYY, такие как новости, связанные с продуктами и технологиями ABBYY, приглашения на мероприятия и веб-семинары, а также информацию о технических документах и ​​материалах, связанных с продуктами и услугами ABBYY.

Мне известно, что я могу отозвать свое согласие полностью или частично в любое время с вступлением в силу в будущем.

Чтобы отозвать свое согласие, перейдите на веб-страницу отказа от подписки или отправьте электронное письмо по адресу [email protected]

Я согласен получать по электронной почте обновления от ABBYY, такие как новости, связанные с продуктами и технологиями ABBYY, приглашения на мероприятия и веб-семинары, а также информацию о технических документах и ​​материалах, связанных с продуктами и услугами ABBYY.

Мне известно, что я могу отозвать свое согласие полностью или частично в любое время с вступлением в силу в будущем.

Чтобы отозвать свое согласие, перейдите на веб-страницу отказа от подписки или отправьте электронное письмо по адресу [email protected]

Пожалуйста, информируйте меня о новых продуктах и ​​обновлениях. Я понимаю, что могу в любой момент отказаться от подписки на электронные письма, которые будут приходить мне от ABBYY USA Software House Inc.(«Глобальный офис ABBYY в Северной Америке»)

Присылайте мне информацию о выпусках новых продуктов, изменении цен и специальных предложениях от ABBYY.

Отправляя эту форму, я даю согласие на использование моей личной информации для целей, описанных в Уведомлении о конфиденциальности.

ABBYY представляет FineReader Engine 12, комплексный SDK OCR, подходящий для виртуальных и облачных сред

Новая версия комплекта для разработки программного обеспечения позволяет интегрировать распознавание текста, преобразование PDF и сбор данных в приложения, работающие в виртуальных и облачных средах, а также в локальные.


ABBYY ® , глобальный поставщик решений и услуг для анализа контента, сегодня объявила о запуске ABBYY FineReader Engine 12, пакета разработки программного обеспечения (SDK) нового поколения, который позволяет компаниям интегрировать распознавание текста, преобразование PDF и данные. фиксировать функциональные возможности в программных приложениях, работающих в облаке, локально или на виртуальных машинах.

FineReader Engine 12 — это мощный инструмент для компаний-разработчиков программного обеспечения, системных интеграторов и предприятий для достижения новых бизнес-целей. Это позволяет компаниям расширять спектр программных приложений и услуг, которые они предлагают, используя современные облачные платформы, такие как Amazon AWS и Microsoft Azure. Виртуальные среды, например Также поддерживаются VMware Workstation и ESXi, контейнеры Docker и Oracle VM VirtualBox.

Эта версия SDK также предлагает улучшенное распознавание текста на японском языке и вводит фарси в качестве нового языка распознавания.Его расширенная реконструкция макета особенно важна при работе с финансовыми документами. Новый модуль классификации использует машинное обучение и обработку естественного языка (NLP), чтобы классифицировать документы с точностью до мельчайших деталей. Эти функции, а также новые форматы вывода, такие как PDF 2. 0, PDF / UA и HTML 5, позволят клиентам повысить качество своих решений или даже предложить новые услуги и выйти на новые рынки.

«ABBYY FineReader Engine 12 отвечает растущему спросу на приложения, использующие оптическое распознавание текста и сбор данных на виртуальных машинах или в облаке.Эта версия SDK дает компаниям и организациям свободу создавать программное обеспечение, которое лучше всего подходит для их бизнес-целей, и выходить на новые рынки, используя преимущества расширенных функций и более 200 языков распознавания », — комментирует д-р Райнер Пауш, старший директор по глобальным продуктам. Маркетинг SDK в ABBYY.

SDK предоставляет приложения с функциями распознавания текста, преобразования PDF и сбора данных для преобразования отсканированных изображений в доступные для поиска документы PDF, PDF / A, Word или Excel, а также для доступа к данным на фотографиях, снимках экрана, промышленных дисплеях, приборных панелях автомобилей и информационно-развлекательной системе. системы.Используя этот инструментарий, приложения могут конвертировать библиотеки TIFF в PDF, PDF / A, Word или другие форматы и точно извлекать значения полей.

Ведущая в мире технология распознавания текста ABBYY устанавливает стандарты качества и надежности. FineReader Engine 12, созданный на основе искусственного интеллекта, поддерживает 208 языков, обеспечивает исключительную точность распознавания даже для многоязычных документов и предоставляет доступные для поиска и редактирования цифровые копии, сохраняющие исходный макет.

SDK также значительно ускоряет вывод продукта на рынок, поскольку предлагает простую интеграцию, предварительно настроенные инструменты, образцы кода и другие компоненты.Это помогает компаниям-разработчикам программного обеспечения опережать конкурентов даже в сегодняшней быстро меняющейся деловой среде.


Доступность и поддерживаемые платформы


ABBYY FineReader Engine 12 для Windows уже доступен по всему миру. Версии для Linux и Mac будут выпущены в июне и июле 2018 года соответственно. SDK можно интегрировать в приложения, работающие на облачных платформах, таких как Amazon AWS и Microsoft Azure. Виртуальные среды, например Также поддерживаются VMware Workstation и ESXi, контейнеры Docker и Oracle VM VirtualBox.

Для получения дополнительной информации посетите наш веб-сайт: https://www.abbyy.com/ocr-sdk/


О компании ABBYY


ABBYY — глобальный поставщик решений и услуг для анализа контента, лидер в области интеллектуального ввода данных, стимулирующий инновации в областях значимого анализа, данных и взаимоотношений для улучшения результатов бизнеса. ABBYY предлагает полный спектр технологий и решений на основе искусственного интеллекта, которые превращают бизнес-документы и контент в ценность для бизнеса.Предоставляя решения цифровой трансформации для финансовых услуг, страхования, транспорта, здравоохранения и других отраслей, компания помогает организациям достичь следующей волны роста, понимая клиентов и предоставляя гибкие интеллектуальные системы в реальном времени. Гибкость решений ABBYY AI позволяет клиентам использовать широкий спектр передовых технологий, платформ и решений для классификации, текстовой аналитики, извлечения данных и объектов, а также проверки данных через любой канал связи и в любом формате.Технологии ABBYY используются и лицензируются некоторыми крупнейшими международными предприятиями и государственными организациями, а также малыми и средними предприятиями и частными лицами. Компания имеет офисы в Австралии, Канаде, Кипре, Франции, Германии, Японии, России, Испании, Тайване, ОАЭ, Великобритании, Украине и США. Для получения дополнительной информации посетите www.abbyy.com/company.

ABBYY и логотип ABBYY являются зарегистрированными товарными знаками или товарными знаками ABBYY Software Ltd. Другие названия продуктов, упомянутые здесь, могут быть товарными знаками и / или зарегистрированными товарными знаками соответствующих владельцев и признаются настоящим.

Галерея NuGet | Abbyy.CloudSdk.V2.Client 1.0.6

ABBYY Cloud OCR SDK позволяет распознавать напечатанный текст (OCR) и текст, напечатанный вручную (ICR) на изображениях, конвертировать документы только с изображениями в доступные для поиска PDF или редактируемые форматы Microsoft Office, извлекать данные из квитанций, визитных карточек и идентификаторов с помощью простого HTTP API.

Эта библиотека .NET предоставляет классы и методы для доступа к конечным точкам API ABBYY Cloud OCR SDK.

 Установочный пакет Abbyy.CloudSdk.V2.Client -Версия 1.0.6 
 dotnet add package Abbyy.CloudSdk.V2.Client --version 1.0.6