Страница 1 из 1

Мини-парсер на базе ПФ

Добавлено: 28.03.2021 01:08
Иван Бельтюков
Добрый день!

Есть ли такая возможность и кто как реализовывал: парсинг страницы по ссылке.

Например, есть поле для ссылки, вставляем ссылку, и пф заполняет поля задачи беря данные со страницы.

Есть такая возможность или это уже фантастика?

Re: Мини-парсер на базе ПФ

Добавлено: 29.03.2021 10:53
Dmitry Goncharenko
Здравствуйте, Иван!
Сам я в парсинге не силен, может кто-то из участников форума конкретнее подскажет, но рассуждаю так:
- по заполнению поля ссылкой можно запускать сценарий, который отправит POST-запрос сервису, занимающемуся парсингом. Беглый гуглинг показывает, что такие есть.
- если сервис возвращает данные парсинга ответом на POST-запрос (а по идее должен), то уже очень скоро можно будет обрабатывать этот ответ и раскладывать его по нужным полям задачи и связанных с ней объектов. Сейчас эта возможность (обработка ответа на POST-запрос) находится на стадии тестирования.

Так что имеет смысл пока подобрать сервис, который может принимать ссылку POST-запросом и отдавать в ответ запарсенные данные, а там и вторая часть подоспеет)

Re: Мини-парсер на базе ПФ

Добавлено: 29.03.2021 23:56
Иван Бельтюков
Спасибо большое за ответ.

Можете ли посоветовать что-то почитать про POST-запросы не сложным языком.

Не сложным в том плане, что я не программист, но логику этих вещей понимаю.

Re: Мини-парсер на базе ПФ

Добавлено: 30.03.2021 11:55
Dmitry Goncharenko
Можно начать с нашей справки - там есть отсылка на вики для более общей информации + примеры реальных POST-запросов, которые можно отправлять из ПланФикса.

Re: Мини-парсер на базе ПФ

Добавлено: 31.03.2021 10:21
Илья Федоров
В одном проекте мы использовали сервис https://www.emailparser.com
У него много возможностей он умеет парсить не только письма, но и содержимое приложенных файлов определенных форматов.
Теперь когда в PlanFix появились вебхуки, то можно не задействовать канал почта для передачи информации в PlanFix, а передавать информацию напрямую в систему.

Способы применения для парсинга pdf файла были приведены в моей статье в блоге ПФ: https://blog.planfix.ru/получение-в-пла ... е-с-hh-ru/