Ошибка :: Компьютерный форум toozza.ru
Софт. Программы для компьютера. Для пк

Только полноправные пользователи могут оставлять комментарии. TM Feed Хабрахабр Geektimes Тостер Мой круг Фрилансим. Хабрахабр Публикации Пользователи Хабы Компании Песочница. На прошлой неделе мы выпустили очередную версию OCR SDK — продукта для встраивания технологий распознавания текста в различные приложения. Под катом я расскажу об улучшениях нового FRE по сравнению с предыдущими версиями.

Разрабатывая новую версию, мы ставим перед собой почти олимпийские цели — точнее, быстрее, функциональнее. Над точностью и функциональностью мы активно работали в девятой версии FineReader Engine и в этом отношении достигли заметных улучшений. В десятой версии на первый план вышла скорость. К выпуску нам удалось ускорить Fast Mode специальный скоростной режим распознавания в 1,5—2 раза для большинства европейских языков.

При этом рост скорости произошел не в ущерб качеству, точность распознавания в Fast Mode осталась в среднем на прежнем уровне. Эти цифры получены в результате внутреннего тестирования на пакетах, содержащих основные типы офисных документов. Относительный рост скорости для каждого языка по сравнению с результатами FRE 9.

Для основных азиатских языков — китайского, японского и корейского — главной целью по-прежнему была точность. Кроме этого на графике видно существенное повышение скорости. Было сделано и много менее очевидных улучшений. Новая бинаризация — преобразование цветных и полутоновых изображений в черно-белые.

Abbyy finereader engine 10 торрент

Это необходимый этап подготовки документов к распознаванию, от него зависит, удастся ли на скане мятого листа со следами от пальцев распознать бледный текст. Бинаризация стала значительно лучше, это одна из причин, почему при увеличении скорости не пострадало качество. Camera OCR TM — набор специальных преобразований для улучшения качества распознавания текста на сфотографированных документах. Появились новые возможности ADRT TM — восстановление структуры документа document map и оглавления table of contents — TOC по заголовкам, автоматическое создание стилей, распознавание подписей к картинкам, задание специального стиля для подписи и объединение картинки и подписи в единый объект.

Очень важное улучшение — повышение понятности, доступности продукта и облегчение работы с ним.

ABBYY FineReader Engine

OCR SDK — это многофункциональный инструмент с огромным API, позволяющим настраивать большое число параметров. Пользователи решают самые разные задачи. Кто-то разрабатывает системы для сканирования книг из библиотеки в PDF с возможностью контекстного поиска, кто-то реализует автоматическую регистрацию документов в СЭД на основе распознавания штрих-кодов, а кто-то развивает на нем собственные технологии для извлечения данных, используя функцию распознавания и верификации текста.

Очевидно, что для разных задач — разные требования к функционалу SDK и качеству технологий. В одном случае на первом месте качество и размер получаемых PDF файлов, в другом — точность распознавания текста или штрих-кодов. Следовательно, требуются разные настройки для решения разных задач. Чтобы упростить настройку продукта, мы создали ряд профилей , содержащих оптимальные значения параметров для решения конкретных задач.

Достаточно просто выбрать подходящий профиль — и можно работать. Кроме этого была существенно доработана справка по продукту, она стала более структурированной и полной. Мы надеемся, что все это поможет быстрее и легче интегрировать FineReader Engine в приложения и получать еще более качественные результаты распознавания. Версию FRE10 для Linux мы планируем выпустить примерно через год. Семён Сергунин Департамент технологических продуктов. ABBYY , finereader , engine , OCR , распознавание , SDK.

Комментарии 19 НЛО прилетело и опубликовало эту надпись здесь. Очевидно, проделана серьезная работа. Как пользователь выражаю благодарность. Наконец-то стала доступна возможность распознавания структуры документа… Надо потестить Теперь бы понять, как это экспортировать бы в удобном виде. Пока что только через экспорт в Word или пробегая руками через API.

В xml, надеюсь, появится довольно скоро. Описываете проект и вам называют примерную цену: Я общался с российским представительством, мне сказали если наша компания будет зарегана в США, то надо в США обращаться. Мы ищем именно серверное решение, которые будет обрабатывать очень много данных.

Отсюда и цена такая была назвала. Цена очень сильно зависит от требуемой конфигурации, опций и других аспектов и рассчитывается каждый раз индивидуально. Если у Вас предментый интерес, свяжитесь, пожалуйста, с отделом корпоративных проектов ABBYY Россия Бери кредитку и покупай, правда у буржуев.

ABBYY FineReader Engine 10

По ссылке — не SDK, а готовое решение под Linux — FineReader Engine 8. Его функции ограничены по сравнению с SDK — FineReader Engine.

Новый Abbyy FineReader Engine 11 научился классифицировать документы

А главное, у этого продукта нет API для встраивания в другие приложения. Продажами и поддержкой FineReader Engine 8. Скажите пожалуйста, а когда появится версия, которую можно было бы использовать в Windows Azure из. А то ваше представительство сказало что на данный момент это невозможно. В данный момент мы умеем работать в Azure, но только без защиты. Так что для больших проектов проблем нет. Над полноценной поддержкой думаем, но пока это только планы. Следующая, 11я версия, точно будет работать под клаудом, про 10ю пока сказать трудно. Все счётчики хранятся на жёстком диске и как-то защищены.

Если же процесс запускается на виртуальной машине, то мы не можем контролировать, сколько экземпляров виртуалок запущено. Для выделенных серверов эта проблема решается так, что должен быть физический сервер с установленным процессом лицензирования, который занимается хранением и обработкой счётчиков.

С облаком такое решение не работает — там все машины виртуальные, и для хранения счётчиков нужно писать особое решение.

Abbyy finereader engine 10 торрент

Если сумма заказа крупная, то мы рассматриваем варианты без счётчиков — в этом случае объём обрабатываемых документов определяется в договорах, а клиент в облаке может запускать столько копий процесса, сколько ему надо. Допустим тысяч одностраничных в основном документов в месяц — это крупный заказ? Дата основания 30 ноября Локация Москва Россия Сайт abbyy. Metrika ; yaCounter Решение, которое с высокой точностью извлекает важную для бизнеса информацию из неструктурированных текстовых ресурсов, позволяя оптимизировать бизнес-процессы организации и повышать ее конкурентоспос.

Универсальная программа для работы с PDF и бумажными документами, которая позволяет менеджерам освободиться от ежедневных рутинных задач, повышая эффективность бизнеса. Решение для потокового ввода данных и документов, которое автоматизирует извлечение информации из бумажных документов и сохраняет данные в информационной системе предприятия. Сутки Неделя Месяц Увольнение — это маленькая смерть. Как сохранить ценного специалиста решившего уволиться? Увольнение — это маленькая смерть. Интересные публикации Хабрахабр Geektimes. Lockheed Martin строит прототип обитаемого модуля для глубокого космоса GT.

Приглашаем на Tarantool Meetup 10 августа. JSDash промежуточные результаты 2. Обзор интраоральных стоматологических 3D-сканеров GT. Новые механические клавиатуры HyperX Alloy Elite и Alloy FPS Pro: Национальная инновационная система США GT. Разделы Публикации Хабы Компании Пользователи Песочница. Информация О сайте Правила Помощь Соглашение Конфиденциальность. Услуги Реклама Тарифы Контент Семинары.

Опубликовано в рубрике Виндовс с драйверами торрент
Twitter Delicious Facebook Digg Stumbleupon Favorites More
  • Прикрепленное видео

Все права защищены. © 2001 toozza.ru