语音算法工程师专家(P6P8)3职位描述与岗位职责任职要求 - 制度大全
制度大全 导航

语音算法工程师专家(P6P8)3职位描述与岗位职责任职要求

编辑:制度大全2020-11-27

职位描述

职责描述

"利用平台上大数据的优势,对平台海量语音的各语种的语音进行识别(尤其是国内的小语种),提高系统在海量语音下对数据的分析性能,增强对各平台信息捕获的辅助支持,为关键词检索性能的进一步提升做服务;主要包括(包括但不限于):

搭建汉语,蒙语,维语和藏语的G2P和大规模语言模型训练(>1T文本量级),搭建基于RNN,LSTM的LM,小语种词典模型的建立和优化工作,小语种声学模型的迁移学习,多任务学习等;

小语种TTS(维语,藏语,蒙语),包括TTS前端各项NLP技术和vocoder;

负责针对腾讯全量业务场景的语音识别解码器的优化工作(多语种混合识别,在线识别,并行化,帧速率加速等等);

负责跟踪最前沿的声学模型训练技术,配合声学模型训练人员优化模型,搜索空间,改变解码单元;

提高复杂场景,多语种下语音识别的建模能力和识别速度,性能;

研究low-resource,zero-speech下建模能力"

任职要求

"硕士或以上学历,信号处理、计算机、电子信息、自动化、模式识别等相关专业;

3年以上语音识别相关工作经验,扎实的语音信号处理,机器学习,模式识别,深度学习理论功底,对语音识别的训练和解码技术有深入的了解;

会民族语言或小语种G2P,切分,语言模型搭建者优先;

精通KALDI和至少一个深度学习工具包(Tensorflow,Torch,CNTK);

精通C/C++,编程能力强;熟悉Linux环境开发;熟悉一门脚本语言(Perl,Python,Ruby)

熟练掌握Shell编程,CUDA编程,多GPU并行计算;

开发过商用大规模大词汇量连续语音识别系统,或者搭建过语音识别或合成中相应模块者(譬如海量语言模型,解码器,复杂神经网络声学模型)优先;

参加过zero-speech竞赛,low-resource竞赛,对于NISTDARPA-BABEL项目熟悉者优先;

在ICASSP,INTERSPEECH,ASRU,CSL,SpeechCommunication等知名会议和期刊发表过论文者优先;

良好的沟通能力与团队协作精神"

篇2:语音唤醒算法工程师(P6P8) 3职位描述与岗位职责任职要求

职位描述

职责描述

基于轻量级的语音唤醒技术,对腾讯平台上海量的语音数据进行内容的检测与过滤,支撑业务端的内容策略服务;

开发及维护搭建轻量级语音唤醒模块,并从算法与数据层面持续优化模块的性能;

建立及维护轻量级语音唤醒模块训练以及优化工具;

负责语音唤醒模块在不同场景下的应用与优化;

支持业务端内容策略服务对语音唤醒模块的应用流程,开发相关的支持工具。

任职要求

硕士或以上学历,信号处理、计算机、电子信息、自动化、模式识别等相关专业;

语音识别,语音信号处理,模式识别,深度学习相关的知识背景;

3年以上机器学习/模式识别相关学习与工作经验(其中1年以上语音识别相关的实际项目经验),并在项目中有应用深度神经网络模型处理相关问题的经验;

Linux环境下开发与调试经验,熟练的编程能力(C/C++),熟悉一门脚本语言(perl/python),会使用Shell编程;

熟练使用kaldi语音工具包,了解声学模型的主要训练流程及原理,了解主要类型神经网络前向计算及解码器的代码实现,并能基于kaldi代码做一定程度的封装与再开发;

加分项:follow并实现过相关论文描述的语音唤醒系统(原型系统即可);基于小数据量的模型适配的经验;深度神经网络计算性能优化经验(CUDA/SSE指令加速,网络量化);

良好的沟通能力与团队协作精神。

篇3:语音算法工程师音频内容理解与AI创作方向职位描述与岗位职责任职要求

职位描述

工作职责

1、在音频(包括语音,音乐,声音场景等)、机器学习、多模态融合等方向搭建核心技术并开展前沿研究。我们希望通过前沿人工智能技术来提升甚至重新定义音频内容的理解、分发以及自动创作工作;

2、构建大规模机器学习基础架构以支撑高效率研发工作;

3、推动核心技术在字节跳动丰富内容场景中的落地;

4、调研并孵化以人工智能为核心的新产品。

任职要求

1、对以下方向(不仅限于此)有兴趣或者经验:

-语音识别与语音合成

-音乐信息检索、音乐或歌唱合成

-音视频多模态融合

-自然语言处理、对话系统、推荐系统

-通用机器学习技术(例如序列模型和生成模型)

-系统工程师;

2、对深度学习技术有深度了解和丰富的实战经验,熟悉Tensorflow、PyTorch等深度学习平台;

3、具备强悍的编码能力,熟悉Linux开发环境,熟悉C++和Python语言优先;ACM/ICPC,NOI/IOI,Topcoder,Kaggle比赛获奖者优先;

4、有独立工作能力并同时能与团队融洽合作相处。

篇4:AILab语音算法工程师音频内容理解与AI创作方向职位描述与岗位职责任职要求

职位描述

工作职责

1、在音频(包括语音,音乐,声音场景等)、机器学习、多模态融合等方向搭建核心技术并开展前沿研究。我们希望通过前沿人工智能技术来提升甚至重新定义音频内容的理解、分发以及自动创作工作;

2、构建大规模机器学习基础架构以支撑高效率研发工作;

3、推动核心技术在字节跳动丰富内容场景中的落地;

4、调研并孵化以人工智能为核心的新产品。

任职要求

1、对以下方向(不仅限于此)有兴趣或者经验:

-语音识别与语音合成

-音乐信息检索、音乐或歌唱合成

-音视频多模态融合

-自然语言处理、对话系统、推荐系统

-通用机器学习技术(例如序列模型和生成模型)

-系统工程师

2、对深度学习技术有深度了解和丰富的实战经验,熟悉Tensorflow、PyTorch等深度学习平台;

3、具备强悍的编码能力,熟悉Linux开发环境,熟悉C++和Python语言优先;ACM/ICPC,NOI/IOI,Topcoder,Kaggle比赛获奖者优先;

4、有独立工作能力并同时能与团队融洽合作相处。

篇5:语音算法工程师职位描述与岗位职责任职要求

职位描述

岗位职责

1、负责语音信号处理相关技术的研发和优化工作

2、负责语音识别相关技术的开发

3、负责语音识别中声学模型的优化和训练工作,并为语音其他模块提供机器学习算法的支持

4、负责离线语音识别系统的实现和性能优化

任职要求

1、对语音识别有一定理解,能够独立完成相关算法的设计和实现,对语言模型、声学模型、解码器、等方面有工作经验者优先;

2、对语音识别中声学模型建模和深度学习有深刻理解,能够独立完成相关算法的设计和实现,有相关经验者优先;

3、熟悉kaldi、tensorflow等开源工具,有相关开发经验者优先;

4、精通C++开发。

制度专栏

返回顶部
触屏版电脑版

© 制度大全 qiquha.com版权所有