Форум 1С
Программистам, бухгалтерам, администраторам, пользователям
Задай вопрос - получи решение проблемы
22 ноя 2024, 06:17

Чтение символов файлов PDF

Автор бухг123, 20 окт 2015, 08:38

0 Пользователей и 1 гость просматривают эту тему.

бухг123

Добрый день.
Пробую сделать обработку на 1С по подсчету символов файлов PDF, для Word сделать получилось а с PDF никак пока. (обработка нужна для массовой обработки файлов, т.к. количество символов и страниц у каждого файла)
Есть программа PractiCount которая с данной задачей справляется (даже без конвертации файлов из PDF в Word). Пробовал интегрировать её с 1С (тоже пока безрезультатно).
Нашел код который сможет подсчитывать символы у файлов PDF


my $_ = `c:\\pdftk.exe $ARGV[0] output - uncompress`;
my $S = 0;
while ( /
   ((?:\+|-)?(?:\d+(?:\.\d*)?))\s
   (?:(?:\+|-)?(?:\d+(?:\.\d*)?)\s){2}
   ((?:\+|-)?(?:\d+(?:\.\d*)?))\s
   (?:(?:\+|-)?(?:\d+(?:\.\d*)?)\s){2}
   cm\n\/\w+\sDo
   /gx)
{
    $S += $1 * $2
};
printf "%s %.0f %s", "\n\nLooks like total pictures area is", $S/72/72*2.54*2.54, "sq cm\n";


Прошу помочь интегрировать его с кодом 1С

Luzer1C

Сделать возможно не получится.:dfbsdfbsdf:
Халамбалам.

дфтын

Получится
есть такая приблуда. когда я её даже юзал:

IFilter
Извлекает текст из файла. Тип файла определяется по расширению файла (т.е. текст из файла с расширением .tmp извлечен не будет). Для извлечения текста из файлов используется интерфейс IFilter. Он является расширяемым. Можно установить дополнительные модули, чтобы появилась возможность извлекать текст из еще одного типа файлов. По умолчанию текст извлекается из файлов следующих типов (имеющих расширение): ASCX, ASP, ASPX, CSS, HHC, HTA, HTM, HTML, HHT, HTW, HTX, ODC, STM, DOC, DOT, POT, PPS, PPT, XLB, XLC, XLS, XLT, TXT, EML. Подразумевается, что файлы с расширением TXT - это текстовые файлы в кодировке ANSI или UNICODE (UTF-16).

Доступность:

Тонкий клиент, сервер, толстый клиент, внешнее соединение.
Примечание:

Следует использовать только в среде Windows NT 4.0, 2000, XP.
Чтобы узнать, какие расширения для IFilter уже установлены на вашем компьютере, можно скачать и установить программу IFilter Explorer (http://www.citeknet.com).

Теги:

Похожие темы (5)

Рейтинг@Mail.ru

Поиск