Иногда, на практике, приходится иметь дело с документами в виде картинок. Часто для восстановления справедливости и текста в виде текста необходимо специализированное программное обеспечение. Было бы гораздо проще и быстрее получать текст из картинок в программе которую используешь для работы с документами. Конечно же, имеется в виду что-то простое и непритязательное. Например,
гугл документы.
Даже гугл диск позволяет на ходу конвертировать изображения в текст -
ссылка. Основной недостаток кроется в том что для каждого изображения необходим новый документ.
Вполне можно установить какое-нибудь дополнение для этих целей (если покопаться в google store).
А можно воспользоваться преимуществами js библиотек и запустить в маленьком html окне процесс распознавания документов с помощью
Tesseract.jsКак пользоваться - выделяем картинку, вызываем скрипт из меню. После загрузки сайдбара можно выбрать изображение с локального диска компьютера. Поддерживаются основные форматы изображений. Окунуться в документацию для тонкой настройки tesseract js можно по
ссылке.
Создаём себе копию
документа, смотрим исходный код, радуемся (по необходимости), делимся интересными библиотеками js, которые хотелось бы подключить для себя.