• Добро пожаловать на форум умных покупателей! Присоединяйтесь к нашей уютной компании и участвуйте в обсуждениях – Регистрация

Софт для распознавания текста

Z

zamar27

Начинающий
Регистрация
15 Окт 2012
Сообщения
1 826
Баллы
21
Местоположение
The Moon
Подскажите хорошую прогу для распознавания китайского текста в файлах - картинках типа jpg, gif, tiff..., лучше без распечатки и сканирования самой картинки, а прямо из файла. Надо оцифровать текст, чтобы затем его можно было перевести.
 
universallina

universallina

Новичок
Регистрация
2 Окт 2011
Сообщения
307
Баллы
0
Местоположение
Киев
для русского и украинского пользовалась Fine Reader, там и другие есть языки, но все равно идеально не получится, ошибки будут
 
zhamzherika

zhamzherika

Новичок
Регистрация
10 Ноя 2011
Сообщения
324
Баллы
0
Местоположение
киев
в Fine Reader нет китайского
 
universallina

universallina

Новичок
Регистрация
2 Окт 2011
Сообщения
307
Баллы
0
Местоположение
Киев
zhamzherika

zhamzherika

Новичок
Регистрация
10 Ноя 2011
Сообщения
324
Баллы
0
Местоположение
киев
буду знать спасибо, а в 10 версии не было
 
Z

zamar27

Начинающий
Регистрация
15 Окт 2012
Сообщения
1 826
Баллы
21
Местоположение
The Moon
Вот нашёл пока что для WinXP (запускать из AppLocale для поддержки китайского интерфейса, установленной с сайта MS):

ShangShu OCR 7.0

Эта штука является упрощённым вариантом Hanwang OCR. На их сайте также выложен бесплатный PDF OCR Reader, но думаю можно и саму полную прогу сыскать, это класса Fine Reader. Открывать китайские сайты лучше в Хроме, там можно автоматом выставить перевод в Установках, и очень быстро делает. Без OCR на Таобао и в общении с китайскими фирмами не обойтись.

А на каком сайте можно проверить статус и данные регистрации китайской фирмы по номеру её регистрации - не подскажете?

Добавлено спустя 2 ч. 55 мин. 38 сек.
Попробовал ShangShu OCR, установив системную поддержку китайского в Вин ХП. Если для поддержки языков в прогах, не поддерживающих Unicode, выбрать Китайский, то запускать можно и не через AppLocate, а напрямую, но это не всегда удобно. Интерфейс её в любом случае только на китайском, поэтому работать с прогой надо методом тыка поначалу.

Она распознаёт знаки быстро и неплохо, разбив картинку на ряд зон, и группируя распознанный текст в таких же зонах. Т.е результат очень похож на начальную картинку, только распознанную. Фон картинки желателен белый чистый, что в рекламе не часто встретишь. Нераспознанные знаки заменяет мусором, текст внутри круглой печати не распознал. Затем оцифрованный текст надо перевести, можно в Dicter.

Всё же для аутентикации подлинности лицензии фирмы это не совсем то, нужен специалист-китаец. Но для перевода рекламных картинок на Таобао и сайтах производителей пойдёт. В общем не идеал, но много лучше чем ничего. :) На форумах пишут, что Fine Reader слабее. А PDF OCR вообще не установился, только для китайской локализации Винды. Попробовал в Win7, работает хорошо при запуске из-под AppLocale. Надо иx обе установить, затем сделать шоткат для запуска из AppLocale. Сохраняю OCR файл в HTML, открываю в Google Chrome сразу с переводом. Лепота...
 
Z

zamar27

Начинающий
Регистрация
15 Окт 2012
Сообщения
1 826
Баллы
21
Местоположение
The Moon
Ссылка на Hanwang OCR никому не попадалась?
 
Live

Similar threads




Вверх
Live