技能标签
专业技能
精通Python编程语言及Scrapy框架开发,掌握网络爬虫原理及技术细节,擅长XPath/CSS选择器与正则表达式数据提取。熟悉分布式爬虫架构设计,具备Docker容器化部署经验。精通JavaScript逆向工程,能够解析动态网页内容。熟练使用MongoDB与MySQL进行非结构化/结构化数据存储与管理,具备数据清洗、去重算法及匹配策略设计能力。
工作履历(脱敏处理)
长期从事网络数据采集系统开发,主导构建多层级分布式爬虫架构,支持日均百万级数据采集。精通JavaScript逆向技术,成功破解多个动态网页加密参数,实现企业信用系统自动登录及美团H5指纹逆向。擅长设计数据清洗流程,优化数据匹配算法,提升数据质量。具备完整的爬虫系统部署能力,采用Docker容器化方案实现快速扩展。熟悉数据库性能优化,设计高效的数据存储方案,支持高并发数据写入。
项目经验(脱敏处理)
京东商品数据采集项目:基于Scrapy-Redis实现伪分布式爬虫架构,攻克分页请求动态参数生成难题,通过异步请求机制实现每类商品下多页数据的高效采集。智联招聘招聘数据采集项目:构建代理池与Cookie池系统,采用多线程调度策略实现高并发数据采集,日均采集岗位信息超5万条。企业信用系统登录逆向项目:通过动态分析定位关键加密参数,采用逆向工程破解指纹生成算法,实现系统自动登录功能。美团H5指纹逆向项目:解析动态加密参数生成逻辑,设计指纹校验绕过方案,构建稳定登录凭证池支持持续采集。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
9年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接