Как преобразовать файл PDF в HTML на PHP? Есть ли библиотека или веб-сервис? Я имею в виду бесплатно, спасибо!

1
Joaquín L. Robles 8 Мар 2010 в 19:57
 – 
tvanfosson
8 Мар 2010 в 20:00
Ну и дела. Никто раньше не задавал этот вопрос.
 – 
Mark Storer
19 Май 2011 в 21:14

3 ответа

Лучший ответ

Google pdf2html, pdftohtml выглядит единственно жизнеспособным. и он основан на программе командной строки, а не на PHP. так что это может быть вам бесполезно. Google может конвертировать, поэтому может быть способ сделать это и с GDocs. хотя я в этом не уверен. В любом случае, я надеюсь, что это, по крайней мере, направит вас на правильный путь.

3
Richard June 8 Мар 2010 в 20:07
Я не знаю php, но, по-видимому, вы можете выполнить / вызвать сценарий оболочки из php (и захватить вывод), так что это, вероятно, сработает
 – 
Richard H
8 Мар 2010 в 20:12
Абсолютно вы можете это сделать, поэтому я поднял этот вопрос, я не уверен, что Google позволит ему легко делать то, что он хочет.
 – 
Richard June
8 Мар 2010 в 23:41

Я пробовал команду Poppler pdftohtml для преобразования файлов PDF в файлы HTML. Проверьте это на HTML-файл, выводимый Poppler легче при использовании, но вывод не очень точен.

Если вам нужен точный вывод, вам следует использовать pdf2htmlEX. Я преобразовал сложные файлы PDF и получил лучший вывод HTML.

2
NoNaMe 19 Ноя 2012 в 13:52

Вы не можете.

PDF-файлы - это сложные документы, содержащие встроенные шрифты, векторную графику и информацию о макете, которые невозможно представить в HTML автоматически. Возможно, вы сможете извлечь ТЕКСТ документа, но это все.

-1
Diodeus - James MacFarlane 8 Мар 2010 в 20:00
Pdf2htmlex позволяет точно конвертировать PDF в HTML.
 – 
Abhishek B
21 Фев 2019 в 10:01