IT人力外包人才简历库

返回列表

数据采集工程师

驻场外包人员
工作年限:1年 意向城市:杭州 浏览:2次 发布时间:近期

技能标签

Python开发 网络爬虫 数据清洗 Excel处理 PDF生成 数据挖掘 反爬策略 分布式爬虫 ETL处理 日志分析 自动化脚本 HTTP协议 Linux运维 数据可视化 数据库基础

专业技能

精通Python爬虫开发,熟练使用Scrapy框架实现网页数据抓取与反爬策略应对。掌握数据清洗、ETL处理及结构化存储技术,可运用Pandas进行数据挖掘分析。熟悉网络请求协议(HTTP/HTTPS)与分布式爬虫架构,具备数据可视化(Excel/PDF)及自动化脚本开发能力。熟悉Linux环境部署与日志分析,了解数据库基础操作。

工作履历(脱敏处理)

作为数据采集工程师,主要负责网络数据抓取与分析工作。主导开发小说全册采集系统,通过定制化爬虫策略实现斗破苍穹等多部作品的分页采集与格式化存储。设计动漫排行榜采集方案,成功抓取微博热榜及影视评论数据并完成数据清洗。优化爬虫架构提升数据采集效率30%,开发自动化脚本实现数据到Excel/PDF的批量转换。持续改进反爬策略,保障数据采集的稳定性与合规性。

项目经验(脱敏处理)

项目一:网络小说全册采集系统开发。采用Scrapy框架构建分布式爬虫,通过模拟浏览器行为应对反爬机制,成功采集斗破苍穹等多部小说的完整章节内容。设计数据清洗流程,将原始HTML内容转换为结构化文本,并开发PDF生成模块实现分卷导出。项目二:动漫排行榜数据采集平台。开发多线程爬虫采集动漫排名及影视评论数据,运用Pandas进行数据聚合分析,输出可视化报表。解决动态加载内容的采集难题,实现微博热榜等实时数据的定时抓取与存储。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

1年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接