IT人力外包人才简历库

返回列表

数据采集与爬虫开发工程师

驻场外包人员
工作年限:9年 意向城市:北京 浏览:3次 发布时间:近期

技能标签

Python开发 Scrapy框架 网络爬虫 数据清洗 分布式爬虫 逆向工程 MongoDB MySQL 异步请求 动态分析 爬虫架构设计 数据去重 正则表达式 容器化部署 数据解析 API接口调试

专业技能

精通Python编程语言及Scrapy框架开发,掌握网络爬虫原理及技术细节,擅长XPath/CSS选择器与正则表达式数据提取。熟悉分布式爬虫架构设计,具备Docker容器化部署经验。精通JavaScript逆向工程,能够解析动态网页内容。熟练使用MongoDB与MySQL进行非结构化/结构化数据存储与管理,具备数据清洗、去重算法及匹配策略设计能力。

工作履历(脱敏处理)

长期从事网络数据采集系统开发,主导构建多层级分布式爬虫架构,支持日均百万级数据采集。精通JavaScript逆向技术,成功破解多个动态网页加密参数,实现企业信用系统自动登录及美团H5指纹逆向。擅长设计数据清洗流程,优化数据匹配算法,提升数据质量。具备完整的爬虫系统部署能力,采用Docker容器化方案实现快速扩展。熟悉数据库性能优化,设计高效的数据存储方案,支持高并发数据写入。

项目经验(脱敏处理)

京东商品数据采集项目:基于Scrapy-Redis实现伪分布式爬虫架构,攻克分页请求动态参数生成难题,通过异步请求机制实现每类商品下多页数据的高效采集。智联招聘招聘数据采集项目:构建代理池与Cookie池系统,采用多线程调度策略实现高并发数据采集,日均采集岗位信息超5万条。企业信用系统登录逆向项目:通过动态分析定位关键加密参数,采用逆向工程破解指纹生成算法,实现系统自动登录功能。美团H5指纹逆向项目:解析动态加密参数生成逻辑,设计指纹校验绕过方案,构建稳定登录凭证池支持持续采集。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

9年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接