技能标签
专业技能
精通Hadoop生态体系(HDFS/MapReduce/Hive/HBase),熟悉Spark/Flink实时计算框架,掌握数据仓库设计与ETL开发,具备分布式系统调优经验,熟悉Kafka消息队列与Flink CDC数据同步技术,熟练使用Python进行数据清洗与建模,具备大数据平台架构设计能力,熟悉数据安全与隐私保护规范
工作履历(脱敏处理)
担任大数据技术负责人期间,主导企业级数据仓库建设,完成从数据采集到分析的全链路架构设计,实现数据处理效率提升300%。主导实时推荐系统开发,采用Flink+Kafka架构实现毫秒级数据同步,支撑千万级用户画像计算。负责大数据平台架构升级,通过分布式计算框架优化使任务执行时间缩短40%。主导数据安全体系建设,制定数据脱敏与访问控制策略,通过等保三级认证。持续进行技术选型与架构调优,推动团队技术能力迭代升级。
项目经验(脱敏处理)
1. 企业级数据仓库建设项目:基于Hadoop生态构建统一数据仓库,采用Hive+HBase混合存储方案,设计ETL流水线实现多源数据整合,通过数据分区与索引优化使查询效率提升200%。解决数据一致性问题,采用Flink CDC实现增量数据实时同步。
2. 用户画像与推荐系统开发:构建基于Spark的用户行为分析模型,采用协同过滤算法实现个性化推荐,通过特征工程优化使点击率提升15%。设计分布式计算框架处理PB级数据,采用动态资源调度技术降低计算成本。
3. 大数据平台架构升级:主导从传统Hadoop向云原生架构迁移,采用Kubernetes+Spark Operator实现资源弹性调度,通过服务网格技术提升系统可观测性。设计数据安全防护体系,实现敏感数据脱敏与访问权限控制。
4. 实时数据处理系统建设:基于Flink构建实时数据处理流水线,实现日均PB级数据的分钟级处理,通过状态管理技术保障数据一致性。设计消息队列与计算框架的集成方案,提升系统容错能力与吞吐量。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
5年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接