Как настроить смартфоны и ПК. Информационный портал
  • Главная
  • Программы
  • Сканирование документов и перевод в word. Как отсканированный документ перевести в формат Word

Сканирование документов и перевод в word. Как отсканированный документ перевести в формат Word

Как конвертировать отсканированный документ в формат Microsoft Word?

Вы когда-нибудь сталкивались с ситуацией, когда хотели изменить содержимое отсканированного файла и не могли сделать это? Теперь вы можете сделать это мгновенно, просто поменяв формат файла. В статье приведены шаги, как конвертировать отсканированный документ в Microsoft Word.

При сканировании документа или сканер предлагает вам список форматов, в которых вы можете сохранить файл. Однако, как правило, дальнейшее редактирование файла невозможно. Если же вам нужно изменить содержимое файла, то придется пройти через утомительный процесс перезаписывания или повторного сканирования документа. Сберечь время и усилия можно, просто изменив несколько настроек в компьютере. Так вы получите отсканированный документ в формате.doc, который затем сможете отредактировать.

Примечание: Для редактирования сначала нужно установить программу Microsoft Office Document Imaging .

Как это сделать?

Для пользователей ОС Windows 7 или Vista:

Пуск-Панель управления-Программы-Программы и компоненты

Для пользователей ОС Windows XP:

Пуск-Панель управления-Установка и удаление программ-Изменение или удаление программ
В появившемся списке программ найдите Microsoft Office и кликните по нему правой кнопкой мыши. Из открывшегося выпадающего меню выберите пункт Изменить

Вы будете перенаправлены на окно "Измените установку". Выберите пункт "Добавить или удалить компоненты " и нажмите кнопку Продолжить .

Выберите там опцию Средства Office и найдите в открывшемся списке Microsoft Office Document Imaging. Кликните правой кнопкой мыши, и в открывшемся списке выберите Запускать все с моего компьютера , и нажмите Продолжить (Обновить)

Теперь Microsoft Office Document Imaging установлена и готова к использованию.

Создание документа Word

Если у вас уже есть отсканированный документ, просто откройте его в Paint. Если же нет - в той же программе выберите в меню Файл-Со сканера или камеры и запустите процесс сканирования. Так как вы сканируете документ для текстового файла, в окне настроек сканера выберите опцию Черно-белый рисунок или текст . После того, как документ отсканирован, откройте его в Paint.

Выберите Пуск - Все программы - Microsoft Office - Средства Microsoft Office - Microsoft Office Document Imaging

В окне программы выберите в меню пункт Файл-Открыть , найдите в открывшемся диалоговом окне созданный нами ранее tiff-файл, и откройте его

Теперь нужно выделить текст, содержащийся в нем. Для этого нажмите комбинацию клавиш CTRL+A, а затем CTRL+C, чтобы скопировать текст в буфер обмена.

Создайте новый документ в Microsoft Word, и нажмите CTRL+V, чтобы вставить скопированный ранее текст. Затем через пункт Файл-Сохранить как сохраните файл с расширением.doc.

Таким образом, документ Word создан. Теперь только осталось внести в него изменения, если это необходимо.

1. Выберите один PDF файл или файл изображения для распознавания.
2. Нажмите кнопку Распознать .




7. Пользуйтесь на здоровье

1. Выберите один ZIP файл содержащий изображения для распознавания. Только 20 файлов могут быть распознаны одновременно.
2. Нажмите кнопку Распознать .
3. Файл отсылается на наш сервер и распознавание начинается немедленно.
4. Скорость распознавания зависит от размера файла, скорости Вашего интернет соединения и доступных ресурсов на наших серверах.
5. Когда распознавание закончено, файл возвращается в то же самое окно браузера (не закрывайте Ваш браузер).
6. В случае невозможности распознавания, причина будет указана красным цветом.
7. Пользуйтесь на здоровье

Выберите PDF или файл изображение для распознавания Поддерживаются только PDF/JPG/JPEG/PNG/BMP/GIF/TIF/TIFF файлы

Русский English German French Spanish Italian Belgium Arabic Chinese Simplified Chinese Traditional Hindi Indonesian Tamil Telugu Portuguese Malaysian Ukranian

Идет распознавание


Это может занять несколько минут

На данной странице возможно распознавание только PDF JPG JPEG PNG BMP GIF TIF .

  • Для конвертирования MS Word (DOC DOCX) в PDF воспользуйтесь ссылкой Word в PDF .
  • Для конвертирования RTF ODT MHT HTM HTML TXT FB2 DOT DOTX XLS XLSX XLSB ODS XLT XLTX PPT PPTX PPS PPSX ODP POT POTX в PDF воспользуйтесь ссылкой Другие документы в PDF .
  • Для конвертирования JPG JPEG PNG BMP GIF TIF TIFF в PDF воспользуйтесь ссылкой Изображение в PDF .
  • Для извлечения текста из PDF документа воспользуйтесь ссылкой PDF в TXT .
  • Для конвертирования DOC DOCX RTF ODT MHT HTM HTML TXT FB2 DOT DOTX в DOC DOCX DOT ODT RTF TXT или XLS XLSX XLSB XLT XLTX ODS в XLS XLSX или PPT PPTX PPS PPSX ODP POT POTX в PPT PPTX PPS PPSX JPG TIF PNG GIF BMP воспользуйтесь ссылкой Другие форматы .
  • Для конвертирования DOC DOCX DOT DOTX RTF ODT MHT HTM HTML TXT в FB2 воспользуйтесь ссылкой Документы в FB2 .
  • Для конвертирования JPG JPEG JFIF PNG BMP GIF TIF ICO в другие форматы, воспользуйтесь ссылкой Конвертировать изображение .
  • Для конвертирования PDF в MS Word (DOC, DOCX), воспользуйтесь ссылкой Конвертировать PDF в Word .
  • Для конвертирования PDF в JPG, воспользуйтесь ссылкой Конвертировать PDF в JPG .
  • Для конвертирования DJVU в PDF, воспользуйтесь ссылкой Конвертировать DJVU в PDF .

Выберите ZIP архив для распознавания Поддерживаются только ZIP файлы

Русский English German French Spanish Italian Belgium Arabic Chinese Simplified Chinese Traditional Hindi Indonesian Portuguese Malaysian Ukranian

Если Вы выбрали быстрый путь написания теоретической главы, о котором мы говорили в параграфе 2.1., вероятней всего Вам не обойтись без сканирования документов. В ином случае, этот пункт можете пропустить и начинать конспектировать материалы найденные в библиотеке .

Перед началом сканирования нужно определиться, что именно Вы хотите использовать при написании работы. А для этого нужно сначала просмотреть имеющуюся литературу и выделить карандашом нужные моменты.

Когда я впервые сканировал статью из журнала для своей первой курсовой, для меня это занятие было невообразимо сложным. В результате нескольких часов работы со сканером и FineReader’ом у меня на выходе вышла бредятина, не поддающаяся редактированию. В итоге пришлось все набирать руками. Чтобы у Вас не случилось подобного, рассмотрим подробнее все технические моменты сканирования.

Для сканирования нам, конечно же, потребуется сканер. Его не обязательно покупать. Можно, например, на время взять на время у товарища. Я пользуюсь сканером CanoScan Lide 60. Это хоть и не самая новая модель, но мне очень нравится этот компактный, быстрый и удобный в работе “девайс”. Если Вы взяли на время сканер, для того чтобы он работал нужно сначала установить программу-драйвер. Драйвера и руководство по установке всегда можно найти на установочном диске, который прилагается к устройству или скачать на сайте у производителя. После установки драйвера, подключите сканнер к компьютеру с помощью соединительного шнура. Теперь можно уже непосредственно приступить к сканированию.

Но сначала немного теории. Вы должны знать, что процесс сканирования состоит из двух этапов:

1. Непосредственно сканирование документа. На этом этапе сканнер как бы фотографирует поверхность сканируемого документа и сохраняет полученное изображение на компьютер в виде обычного файла.jpg .gif или в другом формате;

2. Распознавание документа. Это процесс преобразования текста из изображения сделанного сканером в обычный тест, который потом можно сохранить в Word и редактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная Adobe FineReader). Таким образом, Вы можете сначала отсканировать несколько листов текста и сохранить их в виде изображения и только потом преобразовывать в текст.

Итак, начнем этап первый – сканирование :

– запускаем драйвер сканера: Пуск – Все программы – Canon – ScanGear (название драйвера я указываю для своего сканера). Появится окно драйвера:

– открываем крышку сканера и кладем книгу, журнал или их копию текстом вниз, как можно ровнее по отношению к краям рабочей поверхности сканера:

Здесь очень важно сделать так, чтобы крышка сканера как можно плотнее прижимала сканируемый документ, не допуская попадания внешнего освещения не рабочую поверхность сканера, которая соприкасается с документом;

– выполним необходимые установки в драйвере сканнера. Первым делом нужно установить разрешение, в котором будет отсканирован документ. Разрешение – это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi, или т/д). Чем больше разрешение, тем качественнее получается изображение. Но, при сканировании текстовых документов нет смысла устанавливать максимальное разрешение, поскольку толку от этого будет ноль. Кроме того, сканирование с большим разрешением занимает больше времени. Я рекомендую устанавливать разрешение в пределах 400-500 т/д (dpi). При такой настройке изображения получаются достаточно качественными для хорошего их распознания, а сам процесс сканирования не занимает много времени. Предлагаю посмотреть на скриншот установок моего принтера:


Для начала нужно перейти в “Расширенный режим”. Источником всегда будет “Планшет” (планшетный сканер). Цветной режим лучше установить “Черно-белый” , ведь для сканирования текста нам цвета не нужны, а это уменьшит размер изображений на выходе. Разрешение, как я уже сказал, следует установить 400 т/д . Выходной размер изображения – обязательно “А4” . Теперь можно смело жать на кнопку “Сканировать” . Мой сканер устроен таким образом, что сначала запоминает отсканированные изображения во внутренней памяти, и только при закрытии окна драйвера предлагает сохранить их на компьютер. Мне остается только указать место, куда будут сохранены результаты работы.

У вас должны получаться файлы такого типа:

При увеличении такого изображения должен быть отчетливо виден текст.

Второй этап распознание полученных изображений и их преобразование в текст. Как я уже говорил, для этого понадобится специальная программаFineReader . Скачайте программу по этой ссылке (32Мб) . Пароль к архиву – сайт . Предложенная мной версия не требует установки (portable). В папке с программой будет множество разных файлов, но Вам нужен только один – FineReader.exe . Двойной клик на этом файле запустит программу на Вашем компьютере.

Эта версия программы достаточно старая. Все скриншоты ниже я делал используя именно её. Если эта версия FineReader у вас не запускается - выберите более новую .

Окно FineReader имеет следующий вид:

После установки языка, на котором напечатаны отсканированные Вами ранее документы, можно начинать распознание. Если в тексте присутствует сразу два языка (например, русский и английский) установку сделайте соответственно.

Чтобы начать распознание нажмите на стрелку справа от первой кнопки Сканировать – а затем – Открыть изображение:

Откроется окно выбора изображений. Откройте папку в которую Вы сохранили отсканированные изображения, нажмите CTRL + A (английское) на клавиатуре и нажмите на кнопку Открыть .

После этого слева в окне FineReader’а появятся эскизы добавленных файлов, по центру – на данный момент выделенный эскиз в увеличенном виде, снизу – еще большее увеличение, а справа результат распознания:

Для примера я взял всего два изображения. На скриншоте выше выделено первое из них, его сейчас и распознаем. Как видите, изображение отсканировано вертикально, чтобы распознать текст снимок нужно сначала развернуть на 90 градусов. Для этого воспользуемся кнопками и . Следующим шагом нужно указать программе, какую именно часть изображения нужно распознать, а также задать тип данных, которые должны получиться на выходе текст, таблица или изображение. Для этого существуют кнопки, соответственно: . Например, если нужно отметить текстовый блок, нажимаем левой кнопкой на , после этого нажимаем левой кнопкой мышки в левом верхнем углу текстового блока и, удерживая левую кнопку, перетягиваем в правый нижний угол. Для примера я полностью подготовил к распознанию одно изображение:

Как видите, все текстовые блоки в примере выше выделены зеленым, а рисунки – красным. Таблицы подготавливаются к распознанию аналогично. Для этого предназначена кнопка . Для того, чтобы перейти к следующему снимку, кликните левой кнопкой мыши на его эскизе слева. Таким образом подготавливаются к распознанию все полученные в результате сканирования изображения. После того, как подготовка изображений завершена, следует выделить их все. Для этого кликните левой кнопкой в пустом месте на панели эскизов (она называется Пакет ) и нажмите Ctrl+A (английское) на клавиатуре. Далее кликните на кнопку и подождите пока FineReader преобразует изображения в текст. После этого можно сохранять полученный текст в Word с помощью кнопки , после нажатия на которую откроется окно . В нем необходимо выбрать формат для сохранения – Microsoft Word, а также поставить отметку чтобы сохранились все страницы:

После нажатия кнопки ОК программа создаст документ Word и вставит в него текст из распознанных страниц в том порядке, в котором они находятся на панели эскизов (Пакет). Полученный документ сразу же сохраните в папку в файловой структуре дипломной работы и можете приступать к редактированию. Как это делается, описано в моем бесплатном курсе .

И последний момент. Эсли Вы сканировали газету или журнал, текст там часто дается в виде колонок (как в рассматриваемом примере выше). Эти колонки в Ворде нужно преобразовать в одну. Выделите текст в виде колонок и выполните команду: Формат – Колонки – Одна – ОК . Только после этого можно ставить Книжную ориентацию в Параметрах страницы, отступы полей, шрифт и т.д.

Как отсканировать документ и распознать его в MS Word

После завершения поиска документа, можно открыть документ в Word для его изменения. Как это сделать зависит от версии Office, в которой установлены.

Сканирование документа в формате PDF и изменить в Word

Совет: Преобразование лучше всего работает с документами, содержащими преимущественно текст.

    Сканирование документа в соответствии с инструкциями для сканера и сохраните его на своем компьютере как PDF-файл.

    В Word, выберите файл > Открыть .

    Перейдите к нужному PDF-файл на своем компьютере и нажмите кнопку Открыть .

    Появится сообщение о том, что Word будет преобразовать PDF-файла в редактируемый документ Word. Нажмите кнопку ОК .

См. также

Параметр со сканера или камеры для сканирование изображений и документов недоступен в Word 2010. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

Программа Microsoft Office Document Imaging была удалена из Office 2010, однако вы можете установить ее на своем компьютере, используя один из вариантов, описанных в статье Установка приложения MODI для использования совместно с Microsoft Office 2010 .

Прежде чем продолжать

    Найти и открыть изображений документов Microsoft Office для Обработки изображений документа Microsoft Office в меню Пуск Windows.

    В меню Файл выберите команду Открыть .

    Найдите отсканированный документ и нажмите кнопку Открыть .

    После запуска Microsoft Office Document Imaging нажмите клавиши CTRL+A, чтобы выделить весь документ, а затем нажмите клавиши CTRL+C.

    Запустите Microsoft Word.

    На вкладке Файл нажмите кнопку Создать .

    Дважды щелкните элемент Новый документ .

    Нажмите клавиши CTRL+V, чтобы вставить содержимое отсканированного документа в новый файл.

Параметр со сканера или камеры для сканирование изображений и документов недоступен в Microsoft Office Word 2007. Вместо этого можно использовать сканер для сканирования документа, и сохраните файл на своем компьютере.

Шаг 1: Установка Microsoft Office документа обработки изображений

    Завершите работу всех программ.

    Совет: Перед завершением работы всех программ советуем распечатать этот раздел.

    Откройте панель управления: Щелкните правой кнопкой мыши кнопку Пуск и затем выберите пункт Панель управления или введите Панель управления в поле поиска в Windows.

    На панели управления щелкните Программы , а затем - Программы и компоненты .

    Щелкните правой кнопкой мыши название выпуска Microsoft Office установлен, или щелкните правой кнопкой мыши Microsoft Office Word 2007 (в зависимости от того как часть Office или отдельной программы установлен Word) и нажмите кнопку Изменить .

    Выберите Добавить или удалить компоненты , а затем нажмите кнопку Продолжить .

    В разделе Параметры установки щелкните знак "плюс" (+) рядом с компонентом Средства Office .

    Щелкните стрелку рядом с компонентом Microsoft Office Document Imaging , выберите параметр Запускать все с моего компьютера , а затем нажмите кнопку Продолжить .

Шаг 2: Создание документа, который можно редактировать

Отсканируйте документ, следуя инструкциям для сканера.

Прежде чем продолжать , преобразуйте полученный файл в формат TIFF. Для этого можно использовать Paint или другую подобную программу.

Теперь у вас есть документ, который можно редактировать. Не забудьте сохранить новый файл, чтобы не потерять изменения.

Лучшие статьи по теме