NLP算法工程师(P7P8)2职位描述与岗位职责任职要求 - 制度大全
制度大全 导航

NLP算法工程师(P7P8)2职位描述与岗位职责任职要求

编辑:制度大全2020-11-27

职位描述

职位描述

1、采集互联网上的信息,使用大数据工具,对业务中的各类文本数据(图书内容、评论、搜索词等)进行挖掘、建模;

2、负责NLP基础算法研究工作,包括并不限于文本分类、主题/关键词/标签抽取、纠错、语义标注、自动摘要生成、知识图谱、基础知识库整理等;

3、参与NLP算法模型的构建、维护、部署和评估,通过自然语言处理、深度学习等技术提升文学产品内外部用户阅读和写作的体验。

任职要求

1、熟悉常用机器学习算法。自然语言处理、文本挖掘、机器学习、深度学习等相关专业的硕士/博士硕士,在该方向有3年以上经验。

2、扎实的编程基础,精通java或Python等,熟悉大规模数据处理平台Hadoop/Spark/ODPS等,熟悉主流深度学习工具TensorFlow/Caffe/MXNet/等;

3、具备很强的自我驱动与结果导向意识,具备创新能力,具备很强的团队协作意识和能力。

4、在顶级机器学习和AI领域会议和期刊有论文发表的优先

篇2:语音算法工程师专家(P6P8)3职位描述与岗位职责任职要求

职位描述

职责描述

"利用平台上大数据的优势,对平台海量语音的各语种的语音进行识别(尤其是国内的小语种),提高系统在海量语音下对数据的分析性能,增强对各平台信息捕获的辅助支持,为关键词检索性能的进一步提升做服务;主要包括(包括但不限于):

搭建汉语,蒙语,维语和藏语的G2P和大规模语言模型训练(>1T文本量级),搭建基于RNN,LSTM的LM,小语种词典模型的建立和优化工作,小语种声学模型的迁移学习,多任务学习等;

小语种TTS(维语,藏语,蒙语),包括TTS前端各项NLP技术和vocoder;

负责针对腾讯全量业务场景的语音识别解码器的优化工作(多语种混合识别,在线识别,并行化,帧速率加速等等);

负责跟踪最前沿的声学模型训练技术,配合声学模型训练人员优化模型,搜索空间,改变解码单元;

提高复杂场景,多语种下语音识别的建模能力和识别速度,性能;

研究low-resource,zero-speech下建模能力"

任职要求

"硕士或以上学历,信号处理、计算机、电子信息、自动化、模式识别等相关专业;

3年以上语音识别相关工作经验,扎实的语音信号处理,机器学习,模式识别,深度学习理论功底,对语音识别的训练和解码技术有深入的了解;

会民族语言或小语种G2P,切分,语言模型搭建者优先;

精通KALDI和至少一个深度学习工具包(Tensorflow,Torch,CNTK);

精通C/C++,编程能力强;熟悉Linux环境开发;熟悉一门脚本语言(Perl,Python,Ruby)

熟练掌握Shell编程,CUDA编程,多GPU并行计算;

开发过商用大规模大词汇量连续语音识别系统,或者搭建过语音识别或合成中相应模块者(譬如海量语言模型,解码器,复杂神经网络声学模型)优先;

参加过zero-speech竞赛,low-resource竞赛,对于NISTDARPA-BABEL项目熟悉者优先;

在ICASSP,INTERSPEECH,ASRU,CSL,SpeechCommunication等知名会议和期刊发表过论文者优先;

良好的沟通能力与团队协作精神"

篇3:AML(appliedmachinelearning)算法工程师职位描述与岗位职责任职要求

职位描述

工作职责

1、参与大规模推荐系统、机器学习平台开发;

2、参与推荐核心算法开发和迭代;

任职要求

1、熟练掌握C/C++编程技能,有扎实的编程基础、良好的编程风格和工作习惯;

2、熟悉至少一种主流深度学习编程框架(TensorFlow/Caffe/MXNet),熟悉其底层架构和实现机制;

3、熟悉深度学习算法(CNN/RNN/LSTM等);

4、具有独立解决问题的能力,良好的团队合作意识和沟通能力;

5、有过深度学习编程框架开源社区经验;

加分项:

6、熟悉SparseLR、FFM、deepmodels在大规模系数数据上的并行化;

7、有大型分布式软件(如Spark和TensorFlow等)的资源管理与任务调度实现经验;

制度专栏

返回顶部
触屏版电脑版

© 制度大全 qiquha.com版权所有