close

以下為 B 站演示:

微軟人工智能語音已經在年齡、性別、性格各異的中文角色(曉曉、雲希、雲野、曉涵、曉萱、曉墨、曉睿)上實現瞭如下情感類別:開心、悲傷、憤怒、 恐懼、 不滿、 嚴厲、撒嬌、溫柔、沮喪、尷尬、平靜。

不過,人類的情感很大程度上體現於語音語調的微妙變化,比如一句“再見”,有時是平靜而含蓄的,有時是開心而輕松的,有時卻是決絕而憤怒的。

微軟人工智能語音以自適應神經網絡為基礎,能夠把上述人類情感以1%作為一個量化單元,以平靜語氣為0點,通過無代碼的有聲內容創作平臺或者使用SSML標簽(語音合成標記語言),輕松控制情感程度。

此外,通過與自動文本情感分析技術相結合,也可自動預測情感類別,智能演繹飽含情緒變化的作品。這一技術讓音頻創作就像導演選角一樣,用最適合的聲音、最恰當的情感,演繹更出色的作品,適用於聊天機器人、有聲書朗讀、影視自動配音、遊戲等多情景。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 Ken641228 的頭像
    Ken641228

    Ken641228的部落格

    Ken641228 發表在 痞客邦 留言(0) 人氣()