Run Python Scrapy script via HTTP request

Question

I'm looking for an example to run scrapy script via HTTP request. I'm planing to send url as a parameter that i need to crawl, via GET or POST method. How can i do that.

scrapyRT does exactly that: github.com/scrapinghub/scrapyrt

Valdir Stumm Junior
– Valdir Stumm Junior

2018-12-12 13:23:53 +00:00
Commented Dec 12, 2018 at 13:23 — Valdir Stumm Junior
– Valdir Stumm Junior, Commented Dec 12, 2018 at 13:23
Biswanath is correct, scrapyd would be very useful for you

Yash Pokar
– Yash Pokar

2018-12-14 06:51:30 +00:00
Commented Dec 14, 2018 at 6:51 — Yash Pokar
– Yash Pokar, Commented Dec 14, 2018 at 6:51

Biswanath · Accepted Answer · 2018-12-12 12:53:48Z

3

You should use scrapyd.

Link to the GitHub project page.

Once you are using scrapyd you can use this api to scedule a crawl.

answered Dec 12, 2018 at 12:53

Biswanath

9,19512 gold badges48 silver badges58 bronze badges

Sign up to request clarification or add additional context in comments.

Comments

user10600066 · Accepted Answer · 2018-12-13 07:08:53Z

0

Try something like that.

from twisted.internet import reactor
from scrapy.crawler import Crawler
from scrapy import log, signals
from testspiders.spiders.followall import FollowAllSpider
from scrapy.utils.project import get_project_settings

spider = FollowAllSpider(domain='url.com')
settings = get_project_settings()
crawler = Crawler(settings)
crawler.signals.connect(reactor.stop, signal=signals.spider_closed)
crawler.configure()
crawler.crawl(spider)
crawler.start()
log.start()
reactor.run()

answered Dec 13, 2018 at 7:08

user10600066

531 gold badge2 silver badges10 bronze badges

Collectives™ on Stack Overflow

Run Python Scrapy script via HTTP request

2 Answers 2

Comments

Comments

Your Answer

Hot Network Questions

Collectives™ on Stack Overflow

2 Answers 2

Comments

Comments

Your Answer

Sign up or log in

Post as a guest

Related