NLP算法工程师（P7P8）2职位描述与岗位职责任职要求

编辑:制度大全2020-11-27

职位描述：

1、采集互联网上的信息，使用大数据工具，对业务中的各类文本数据（图书内容、评论、搜索词等）进行挖掘、建模；

2、负责NLP基础算法研究工作，包括并不限于文本分类、主题／关键词／标签抽取、纠错、语义标注、自动摘要生成、知识图谱、基础知识库整理等；

3、参与NLP算法模型的构建、维护、部署和评估，通过自然语言处理、深度学习等技术提升文学产品内外部用户阅读和写作的体验。

任职要求：

1、熟悉常用机器学习算法。自然语言处理、文本挖掘、机器学习、深度学习等相关专业的硕士/博士硕士，在该方向有3年以上经验。

2、扎实的编程基础，精通java或Python等，熟悉大规模数据处理平台Hadoop/Spark/ODPS等，熟悉主流深度学习工具TensorFlow/Caffe/MXNet/等；

3、具备很强的自我驱动与结果导向意识，具备创新能力，具备很强的团队协作意识和能力。

4、在顶级机器学习和AI领域会议和期刊有论文发表的优先

篇2：语音算法工程师专家（P6P8）3职位描述与岗位职责任职要求

职位描述：

职责描述：

"利用平台上大数据的优势，对平台海量语音的各语种的语音进行识别（尤其是国内的小语种），提高系统在海量语音下对数据的分析性能，增强对各平台信息捕获的辅助支持，为关键词检索性能的进一步提升做服务；主要包括（包括但不限于）：

搭建汉语，蒙语，维语和藏语的G2P和大规模语言模型训练（＞1T文本量级），搭建基于RNN，LSTM的LM，小语种词典模型的建立和优化工作，小语种声学模型的迁移学习，多任务学习等；

小语种TTS（维语，藏语，蒙语），包括TTS前端各项NLP技术和vocoder；

负责针对腾讯全量业务场景的语音识别解码器的优化工作（多语种混合识别，在线识别，并行化，帧速率加速等等）；

负责跟踪最前沿的声学模型训练技术，配合声学模型训练人员优化模型，搜索空间，改变解码单元；

提高复杂场景，多语种下语音识别的建模能力和识别速度，性能；

研究low-resource，zero-speech下建模能力"

任职要求：

"硕士或以上学历，信号处理、计算机、电子信息、自动化、模式识别等相关专业;

3年以上语音识别相关工作经验，扎实的语音信号处理，机器学习，模式识别，深度学习理论功底，对语音识别的训练和解码技术有深入的了解；

会民族语言或小语种G2P，切分，语言模型搭建者优先；

精通KALDI和至少一个深度学习工具包（Tensorflow,Torch,CNTK）；

精通C/C++,编程能力强；熟悉Linux环境开发；熟悉一门脚本语言（Perl,Python,Ruby）

熟练掌握Shell编程,CUDA编程，多GPU并行计算；

开发过商用大规模大词汇量连续语音识别系统，或者搭建过语音识别或合成中相应模块者（譬如海量语言模型，解码器，复杂神经网络声学模型）优先；

参加过zero-speech竞赛，low-resource竞赛，对于NISTDARPA-BABEL项目熟悉者优先；

在ICASSP,INTERSPEECH,ASRU，CSL,SpeechCommunication等知名会议和期刊发表过论文者优先；

良好的沟通能力与团队协作精神"

篇3：AML(appliedmachinelearning)算法工程师职位描述与岗位职责任职要求

职位描述：

工作职责：

1、参与大规模推荐系统、机器学习平台开发；

2、参与推荐核心算法开发和迭代；

任职要求：

1、熟练掌握C/C++编程技能，有扎实的编程基础、良好的编程风格和工作习惯；

2、熟悉至少一种主流深度学习编程框架（TensorFlow/Caffe/MXNet），熟悉其底层架构和实现机制；

3、熟悉深度学习算法（CNN/RNN/LSTM等）；

4、具有独立解决问题的能力，良好的团队合作意识和沟通能力；

5、有过深度学习编程框架开源社区经验；

加分项：

6、熟悉SparseLR、FFM、deepmodels在大规模系数数据上的并行化；

7、有大型分布式软件（如Spark和TensorFlow等）的资源管理与任务调度实现经验；

制度专栏

更多专栏分类

热点制度职责

触屏版电脑版