任务描述:
1、负责网络爬虫系统的设计与开发;
2、负责和业务沟通抓取需求,满足业务的发展需要;
3、负责大数据产品所需网站的信息抓取、解析、清洗等研发与优化工作;
职位要求:
1、 精通网页抓取原理及技术、正则表达式、动态数据抓取、防屏蔽等关键技术;
2、Python语言 、掌握爬虫框架scrapy , 熟悉分布式爬虫管理框架Gerapy, 爬虫管理scrapyd ,分布式爬虫scrapy-redis
3、 具备NLP相关知识,如结巴分词等,了解或接触过TensorFlow、Pytorch、Keras等至少一种深度学习框架优先;
更新于 2024-05-07