Страница 1 из 1
Мини-парсер на базе ПФ
Добавлено: 28.03.2021 01:08
Иван Бельтюков
Добрый день!
Есть ли такая возможность и кто как реализовывал: парсинг страницы по ссылке.
Например, есть поле для ссылки, вставляем ссылку, и пф заполняет поля задачи беря данные со страницы.
Есть такая возможность или это уже фантастика?
Re: Мини-парсер на базе ПФ
Добавлено: 29.03.2021 10:53
Dmitry Goncharenko
Здравствуйте, Иван!
Сам я в парсинге не силен, может кто-то из участников форума конкретнее подскажет, но рассуждаю так:
- по заполнению поля ссылкой можно запускать сценарий, который отправит POST-запрос сервису, занимающемуся парсингом.
Беглый гуглинг показывает, что такие есть.
- если сервис возвращает данные парсинга ответом на POST-запрос (а по идее должен), то уже очень скоро можно будет обрабатывать этот ответ и раскладывать его по нужным полям задачи и связанных с ней объектов. Сейчас эта возможность (обработка ответа на POST-запрос) находится на стадии тестирования.
Так что имеет смысл пока подобрать сервис, который может принимать ссылку POST-запросом и отдавать в ответ запарсенные данные, а там и вторая часть подоспеет)
Re: Мини-парсер на базе ПФ
Добавлено: 29.03.2021 23:56
Иван Бельтюков
Спасибо большое за ответ.
Можете ли посоветовать что-то почитать про POST-запросы не сложным языком.
Не сложным в том плане, что я не программист, но логику этих вещей понимаю.
Re: Мини-парсер на базе ПФ
Добавлено: 30.03.2021 11:55
Dmitry Goncharenko
Можно начать с
нашей справки - там есть отсылка на вики для более общей информации + примеры реальных POST-запросов, которые можно отправлять из ПланФикса.
Re: Мини-парсер на базе ПФ
Добавлено: 31.03.2021 10:21
Илья Федоров
В одном проекте мы использовали сервис
https://www.emailparser.com
У него много возможностей он умеет парсить не только письма, но и содержимое приложенных файлов определенных форматов.
Теперь когда в PlanFix появились вебхуки, то можно не задействовать канал почта для передачи информации в PlanFix, а передавать информацию напрямую в систему.
Способы применения для парсинга pdf файла были приведены в моей статье в блоге ПФ:
https://blog.planfix.ru/получение-в-пла ... е-с-hh-ru/