Домик брачных аферистов
SOS! PDF

Статьи ФорумФотоальбум Библиотека Жильцы

➜ главная Домика

Вы не залогинились! Ваш статус в этом ДоМиКе - гость.

В домике онлайн: 1, замечено за сутки: 18

вернуться на 410 стр. списка тем

1 Апр 2019, 17:21Выход Здесь offline

SOS! PDF

Люди скажите как можно конвертировать файл pdf в docx (doc)? Там таблица, текст которой надо редактировать и вносить еще другие данные. В принципе он конвертируется, но только как картинка - редактирование не получается.
Поможите кто чем может!)))

1 Апр 2019, 17:31Самурай offline

Выход

Попробуй ресурс ilovepdf

1 Апр 2019, 17:53Выход Здесь offline

Самурай,

"Извините, но iLovePDF не может извлечь текст из отсканированных PDF-файлов, а только выбранный текст. Чтобы преобразовать отсканированные PDF-файлы в редактируемый документ Office вам нужно выполнить OCR, функция, которую мы предлагаем в плане Premium" (С)

;(

1 Апр 2019, 17:55Выход Здесь offline

Распознавание пробовала. Получается только текст)

1 Апр 2019, 19:15Люка в БАНе offline

я с таблицами не дружу

но, вот что нашла:

бесплатный PDF-конвертер прозволяет преобразовать PDF-документы в DOCX-формат, для дальнейшего редактирования в программах Microsoft Word или OpenOffice Writer. (с)

1 Апр 2019, 19:23Ненастенька offline

Программа

Abode Fine Reader. Можно выделять отельные участки документа и задавать распознавание.

1 Апр 2019, 19:30Выход Здесь offline

))

Распознает в текст. А надо текст-таблица+редактирование.

1 Апр 2019, 19:31Выход Здесь offline

Люка,

спасибо)) Но я ж грю - уже это делала))

1 Апр 2019, 19:35MR offline

А нельзя ли просто скопировать текст из pdf

и вставить в в word? Технически это возможно, но насколько хорошо будет скопирована таблица - вопрос. С простым текстом так можно сделать.

1 Апр 2019, 19:43Немка offline

Это засада )

У меня таблицы всегда "плыли" при распознавании. Когда нужно было перенести таблицу, то просто строила новую в Word и копировала текст...

Может быть Org знает какую-нибудь фишку, он, кажется, программист?

1 Апр 2019, 19:50Выход Здесь offline

Огонёк,

можно. 100 страниц!)))

Немка, во-во!)))

1 Апр 2019, 19:53Выход Здесь offline

Мне

тут уже добрые профессиональные люди попытались помочь (денех им побольше и невесту хорошую), но не получилось((

1 Апр 2019, 20:06Orgasmatron offline

12345

Если текст в виде растрового (пиксельного) изображения, то только OCR - при достаточном разрешении картинки.

Засада с pdf такова, что этот формат - подмассив языка печати PostScript (PS), который был создан не для выражения таблиц, но для выражения того, как должны выглядеть объекты на бумаге. Вообще, выражение таблицы в pdf документах возможно, но данные в pdf не всегда выражают (форматируют) именно как таблицы, и потому их невозможно извлечь в виде таблицы. Всё зависит от создателей программы, кторая пишет pdf.

1 Апр 2019, 20:16Выход Здесь offline

Орг,

спасибо.
Но OCR тоже не помог.

1 Апр 2019, 20:24Orgasmatron offline

12345

А просто данные в правильной последовательности есть? Если да, то их можно в "Linux shell" скрипте закатать в html, изобразить в браузере и скопировать как таблицу :).

1 Апр 2019, 20:24Аноним [1]
взять флешку

скопировать всё на фешку, сходить в ближайшее фотоателье
там всё сделают как надо

1 Апр 2019, 20:25Orgasmatron offline

12345

Скопируй сюда часть того, что у тебя есть и напиши, какие столбцы и записи хочешь.

1 Апр 2019, 20:28Deleted offline

ОСR не помог потому,

что сканирование, это картинка (а не из текстового редактора), переведённая потом в PDF. Увы и ах. OCR может читать текст с картинками, обычно допуская много ошибок, но с картинками, на буквы не похожими, он работать не может.
Поэтому только ручное форматирование до тех пор, пока искусственный интеллект не научится решать подобные проблемы.

1 Апр 2019, 20:43Выход Здесь offline

))

"... можно в "Linux shell" скрипте закатать в html, изобразить в браузере и скопировать как таблицу :)." (с)

В обмороке)))

1 Апр 2019, 20:51Val offline

Выход здесь

На сегодняшний момент с этой задачей нормально не может справится ни одна программа.
Более менее корректно может это делать Abode Fine Reader(последняя версия 14), но она платная. Но даже не в этом дело. Чтобы корректно распознавать, нужна хорошего качества картинка и желательно, чтобы таблица располагалась без всяких перекосов на листе, что не всегда бывает возможно достичь в документе.

В общем с одним документом может получится более менее, а с другим косяк на косяке. Да и программа старается применить всякие табуляции и поправки, что делает тяжёлым процесс последующего редактирования. Всё скачет вкривь и вкось.
Как говорится, быстрее создать таблицу с нуля, чем редактировать полученное распознавание. В общем фигня полная.. :(

1 Апр 2019, 21:05Val offline

Хотя...

Был не совсем прав. Сейчас конвертировал таблицу в pdf и на сайте (ссылку кину в личку) перевёл обратно в doc. Всё корректно получилось. Как и говорил, нужна чёткая картинка.

1 Апр 2019, 21:12Orgasmatron offline

12345

"В обмороке)))" -

из простых данных вроде

а б в г д
е ё ж з и

можно автоматически составить таблицу, но когда много слов и границы ячеек определены достаточно сложно - проще переписать вручную.

2 Апр 2019, 02:46 mobsite

Nika...

ничо не поняла

Но у меня просто стоят две сканерные программы
любая переводит в куда надо
контролировать приходится, но количество ошибок действительно зависит от качества картинки

Поделиться с друзьями

вернуться на 410 стр. списка тем

Тук-тук-тук! Кто в домике живет? Наверное, мышка-норушка, как всегда... Ну там еще зайчик-побегайчик, лисичка-сестричка... А вас тама, похоже, нет!

Почему? Да потому что на Мейби нужно сначала зарегистрироваться, а потом подать заявку на прописку в ДоМиКе.

Попасть в "15 мин. Славы" ⇩

📻 RSS-лента этого домика

	Friends
	FIREmania
	Под уютным плюшевым пледом
	ЮжныйСеверный поток3+4+5+
	Гнездо Феникса

Домик брачных аферистовSOS! PDF

Домик брачных аферистов
SOS! PDF