IT人力外包人才简历库

返回列表

Python数据采集工程师

驻场外包人员
工作年限:3年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python开发 数据采集 数据可视化 数据库管理 Linux系统 分布式存储 Web框架 数据建模 数据处理 数据质量管控 爬虫开发 ETL流程 数据清洗 系统运维 数据建模 数据分析

专业技能

精通Python开发及数据采集技术,具备完整的数据采集-清洗-分析-可视化全流程能力。熟练掌握Scrapy框架进行分布式爬虫开发,熟悉Django框架构建数据处理后端服务。精通MySQL/Redis/MongoDB等多类型数据库设计与优化,擅长Linux系统环境搭建与运维。具备Python数据建模能力,熟练使用Pandas进行数据处理,Matplotlib/Seaborn实现数据可视化。熟悉ETL流程及数据质量管控体系。

工作履历(脱敏处理)

专注于数据采集与分析领域,主导开发多套分布式爬虫系统,实现日均千万级数据采集。设计并实施数据清洗管道,提升数据质量30%。搭建基于Django的数据分析平台,支持多维度数据可视化展示。优化MySQL索引结构,将查询效率提升40%。开发Redis缓存系统,降低数据库压力。构建MongoDB分片集群,支撑日均百万级数据存储。主导设计数据建模方案,提升数据利用率25%。持续优化Linux服务器性能,实现系统稳定性99.9%。

项目经验(脱敏处理)

1. 构建分布式爬虫系统:基于Scrapy框架开发多线程爬虫,采用Redis队列实现任务分发,日均采集数据量达1200万条。通过设置反爬策略和请求头伪装,成功突破目标网站的流量限制。2. 数据分析平台开发:使用Django框架搭建数据可视化平台,集成Pandas进行数据清洗和统计分析,采用Matplotlib/Seaborn生成多维数据图表。3. 数据库优化项目:对MySQL数据库进行索引优化和查询重构,将复杂查询响应时间从5秒降至1.2秒。4. 实时数据采集系统:设计Redis缓存架构,结合消息队列实现数据实时采集,系统日均处理数据量达500万条。5. 数据质量管控体系:建立数据校验规则和异常检测机制,通过数据血缘分析定位数据质量问题,提升数据可用性至95%以上。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

3年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接