IT人力外包人才简历库

返回列表

分布式爬虫系统架构师

驻场外包人员
工作年限:4年 意向城市:杭州 浏览:3次 发布时间:近期

技能标签

分布式爬虫 反爬策略 数据清洗 Scrapy Nutch Python Java 数据抓取 动态渲染 IP代理池 接口开发 分布式系统 反反爬技术 数据处理 系统架构

专业技能

精通Python编程语言(Scrapy、Nutch框架),熟悉Java/PHP多语言开发;掌握分布式爬虫架构设计与优化,擅长反爬策略破解(动态渲染、IP代理池、验证码识别);具备完整数据抓取流程能力(数据采集、清洗、存储),熟悉电商业务系统底层逻辑与接口开发

工作履历(脱敏处理)

主导某头部视频平台分布式爬虫系统架构优化,设计动态渲染反爬解决方案,提升数据采集成功率至98%。开发电商订单系统接口,实现多平台订单数据聚合分析,支撑日均百万级数据处理。构建智能IP代理池系统,有效应对目标网站封禁策略,降低采集中断率70%。设计数据清洗管道,实现结构化数据标准化输出,提升数据可用性至95%。

项目经验(脱敏处理)

1. 某头部视频平台分布式爬虫系统重构:主导改进分布式爬虫架构,采用Scrapy-Redis实现任务分发,通过动态渲染技术破解前端反爬策略,构建IP代理池系统应对封禁,最终实现日均千万级数据采集。2. 电商订单系统接口开发:设计并实现多平台订单数据采集接口,构建数据清洗管道完成结构化处理,支撑业务方完成订单分析看板,提升数据可用性至95%。3. 微信小程序数据抓取项目:攻克动态渲染反爬技术,开发验证码识别模块,构建分布式采集框架,成功获取目标数据并完成存储分析。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

4年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接