У нас есть страница в формате PDF, содержащая один или несколько рисунков, которые представляют собой двухмерные графики результатов экспериментов. Рисунки могут быть встроены в текст, а могут и не быть. На каждом графике есть оси x и y с их метками и единицами измерения, отмеченными на графике. Внутри каждого рисунка есть один или несколько графиков, каждый разного цвета.

Как мы можем преобразовать график в таблицу соответствующих значений x и y (скажем, для 100 точек)?

Я уже пробовал WebPlotDigitizer, но он работает только в том случае, если ввод представляет собой отдельное изображение сюжета.

Думаю, мне нужно извлечь графики из PDF и обработать их дальше. Сейчас я не могу найти для этого инструмента. Я прикрепил образец PDF, из которого участки должны быть добыты.

Обратите внимание, что 2 графика на последней странице PDF-файла являются изображениями и могут быть легко извлечены (я нашел для них пару программ). Другие графики не являются изображениями, и программа не может их извлечь.

Есть ли какое-нибудь программное обеспечение с открытым исходным кодом, которое может этого достичь?

-1
humblenoob 27 Фев 2016 в 15:47

2 ответа

Лучший ответ

Графики в этом PDF-файле, который вы предоставили, сделаны с помощью векторных рисунков, поэтому единственный способ их извлечь - преобразовать PDF в изображение (т. Е. Визуализировать страницы). Попробуйте командную строку преобразования ImageMagick, см. Это answer

1
Community 23 Май 2017 в 11:59

Поскольку Photoshop очень хорошо поддерживает сценарии, на самом деле можно программно извлекать изображения из PDF (в отличие от страниц; см. Документацию по Photoshop JavaScript).

Затем у вас есть весь набор инструментов для настройки изображений, чтобы облегчить дальнейшую обработку (интерпретацию).

0
Max Wyss 27 Фев 2016 в 22:14