上一期给大家讲了人工智能自然语言方向,这一期呢来讲跟自然语言比较接近的语音。
语音也好理解,所有的声音都可以理解成语音,也都可以作为语音方向的处理对象。不过和自然语言稍微有些不同的是,1)自然语言是文字形式,语音是声音形式;2)自然语言其实是人自己建立的一套文字体系,自然界中不存在,所以我们现在研究的自然语言都是各个国家真正使用的语言,而语音就不一定是只有人才有的了,自然界的声音比如雨声、风声,动物的叫声也都是语音。

语音的研究方向呢也比较集中,一种是语音识别,就是将声音识别成文字,比如我剪辑用的软件就可以根据我的配音自动生成字幕,减少了我一个个敲字幕的工作量,还有呢就是语音合成,也就是给一段文字转成语音,并且语音的风格还可以配置,就像这样、这样、还有这样,另外就是和文字类似语音其实做情感分析更准确,毕竟文字是死的,声音里传达的情绪更明显。在我们生活中也有很多语音AI技术的应用,比如刚才说的剪辑软件的字幕、配音,很多语音助手像苹果的siri、小米的小爱同学等相信大家也都用过,又比如一些同声传译软件其实就综合用到了语音识别和机器翻译的技术。
目前语音识别这块呢,科大讯飞应该是国内做的比较早也比较好的,他是作为语音方案的解决方案提供商来运营这块技术的,要做语音方向找工作的时候这是一个不错的选择,听说工作节奏也不错。再呢,就是上面介绍的这些有自研语音助手的一些公司,薪资也给的还可以。总的来说,讲道理语音方向的招聘需求在自然语言、语音、视觉这三个主要方向里是最少的,你看我对它的子方向介绍也比较简短,因为他可做的方向确实不多,并且都是比较集中的几个问题,这些问题研究了这么多年,要不就解决的差不多了,要不就没什么好的办法解决,这也就导致了他的招聘需求不太多,但他确实是一个很有用并且有意思的方向,大家可以根据自己的兴趣和职业规划来选择。
Ok,关于AI和语音的结合就讲到这里,大家有啥问题可以评论区留言,下一期我们讲我现在主要从事的计算机视觉,欢迎大家持续关注。
评论留言