技能标签
专业技能
精通自然语言处理技术,具备三年NLP算法研发经验;熟练掌握机器学习与深度学习算法,熟悉BERT/ALBERT等预训练模型;精通PyTorch框架,具备大规模数据处理能力;掌握文本分类、实体识别、文本相似度计算等NLP任务;熟悉爬虫技术,能构建分布式爬虫系统;熟练使用NLTK/spaCy等NLP工具包;具备数据清洗、特征工程及模型调优能力;熟悉Linux环境部署与性能优化
工作履历(脱敏处理)
专注于自然语言处理算法研发,主导构建分布式爬虫系统实现多源舆情数据采集,日均处理数据量超百万级。开发基于BERT/ALBERT的深度学习模型,完成文本分类、实体识别及多维度情感分析,准确率提升25%。优化实体关联算法,采用改进的权重编辑距离实现精准实体匹配,提升信息抽取效率。设计文本摘要系统,基于TextRank算法实现关键信息抽取,缩短信息处理周期30%。持续优化模型性能,通过特征工程和超参数调优使模型推理速度提升40%。
项目经验(脱敏处理)
构建多源舆情监测系统:1) 开发分布式爬虫框架,实现第三方新闻网站及企业官网的实时数据采集,日均抓取数据量达500万条;2) 构建基于ALBERT+TextCNN的多分类模型,实现新闻情感分析,准确率提升至89%;3) 设计ALBERT+Bilstm+CRF实体识别模型,精准识别人名/机构名/产品名等实体,召回率提升至92%;4) 开发实体级情感分析系统,采用ALBERT+mask机制实现多实体情感极性判断,支持复杂语境下的情感识别;5) 优化实体关联算法,基于改进的权重编辑距离实现实体匹配,结合TextRank算法完成摘要抽取,信息提取效率提升35%。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
3年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接