IT人力外包人才简历库

返回列表

数据采集与反爬工程师

驻场外包人员
工作年限:5年 意向城市:北京 浏览:2次 发布时间:近期

技能标签

反爬虫技术 分布式爬虫 数据清洗 Java开发 Python开发 Spring Boot SSM框架 Web应用开发 数据库优化 系统架构设计 RESTful API 动态渲染处理 验证码识别 ETL处理 性能调优

专业技能

精通Java/Python爬虫开发,掌握分布式爬虫框架(Scrapy/SpiderMonkey),擅长反爬虫策略设计(验证码识别/动态渲染处理),熟悉Spring Boot/SSM微服务架构,具备Web应用开发能力(HTML/JS/RESTful API),精通数据清洗与ETL处理,熟悉数据库优化(MySQL/Redis),具备系统架构设计与性能调优经验

工作履历(脱敏处理)

专注于数据采集系统开发与反爬虫技术研究,主导设计并实现多套分布式爬虫架构,成功突破100+网站反爬机制。开发动态渲染处理模块,采用Selenium+Playwright实现复杂页面数据抓取,提升数据采集效率300%。主导构建企业级数据清洗平台,集成Flink实时计算引擎,实现数据质量提升90%。精通Spring Boot微服务架构,完成多个高并发数据接口开发,支持日均百万级请求处理。具备丰富的系统性能调优经验,通过数据库索引优化与缓存策略,使系统响应时间缩短60%。

项目经验(脱敏处理)

1. 某金融数据采集平台开发:设计分布式爬虫架构,采用Scrapy-Redis实现任务分发,突破目标网站动态渲染防护,通过Selenium+Playwright处理复杂页面,日均采集数据50万条。2. 电商反爬系统研发:开发验证码识别模块,集成OCR技术实现自动识别,构建动态请求模拟框架,成功绕过30+网站反爬策略。3. 数据清洗与ETL平台建设:设计基于Flink的实时处理流水线,实现数据去重、格式标准化等12项清洗规则,数据准确率提升至99.8%。4. 微服务数据接口开发:基于Spring Boot构建RESTful API服务,支持多数据源接入,实现毫秒级响应,支撑日均100万次数据查询。5. 爬虫监控与告警系统:开发可视化监控平台,集成Prometheus+Grafana实现爬虫状态实时监控,异常检测准确率达95%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

5年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接