技能标签
专业技能
精通数据清洗与预处理技术,熟练掌握Pandas/NumPy数据处理工具。精通网络爬虫技术,具备大规模数据采集能力,熟悉Scrapy框架及分布式爬虫架构。精通机器学习算法体系,包括监督/非监督学习算法,熟悉深度学习框架TensorFlow/PyTorch。精通图神经网络(GNN)与卷积神经网络(CNN)模型架构设计。掌握隐私计算技术,熟悉联邦学习、同态加密与安全多方计算原理。熟悉Python服务开发,具备Django/Flask框架实战经验。
工作履历(脱敏处理)
专注于数据算法研发与系统构建,主导数据要素化平台架构设计,实现10+种隐私保护算法的工程化部署。设计分布式爬虫架构,完成DrugBank等多源数据采集,日均处理数据量超50万条。优化数据预处理流程,提升模型训练效率30%。开发隐私计算中间件,实现数据可用不可见的业务场景。主导机器学习模型调优,使预测准确率提升至92%。持续跟进深度学习前沿技术,完成GNN在社交网络分析中的应用落地。
项目经验(脱敏处理)
基于PySyft框架构建数据要素化平台,实现联邦学习场景下的数据预处理模块,解决多源异构数据融合难题。开发隐私保护机器学习系统,采用同态加密技术实现模型训练过程中的数据安全,通过差分隐私机制保障用户隐私。设计分布式爬虫架构,结合Selenium与BeautifulSoup实现DrugBank动态网页数据采集,采用反爬虫策略应对目标网站的防护机制。优化数据清洗流程,构建标准化数据管道,提升数据质量评分至98%。开发基于CNN的药物分子结构分类模型,通过迁移学习提升小样本场景下的模型泛化能力。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
4年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接