【资料图】
IT之家 1 月 17 日消息,多年来,微软持续探索 AI 语音合成与识别技术,Azure Neural TTS(text-to-speech,语音合成)与 STT(speech-to-text,语音识别)支持的语言区域达到 140 余个,并支持超过 400 多个音色。
近两年,微软在汉语方言智能语音上加大了研究力度。微软宣布,在语音合成上实现了对吴方言和粤方言两种汉语方言,以及西南官话、东北官话、冀鲁官话、中原官话(包括河南、陕西地区)等多种官话次方言的支持;在语音识别上支持吴方言、粤方言和西南官话。
微软表示,汉语是世界上最古老的语言之一,受历史与地理条件的影响,出现了众多代表地域文化特色的方言。自 2017 年起,微软一直致力于 AI for Good 计划的推进,其中包括:通过提供前沿的技术、资源和专业知识,保护人文遗产以及创造更具可持续性和便利性的世界。微软也将持续投入于方言智能语音的研究,助力中国传统文化的保护与传承。
在方言之外,古典诗歌也是文化传承的重要载体。IT之家了解到,微软通过学习大量诗歌朗诵者的语音数据,可以让 AI 更好地表达诗歌的韵律、停顿、情感。微软智能语音现已支持传统诗歌、现代诗歌、五言、七言律等智能语音的朗诵。
方言朗读示例:点此收听