亞馬遜推出全新Nova Sonic語(yǔ)音到語(yǔ)音模型可深入理解人類對(duì)話,捕捉語(yǔ)氣、語(yǔ)調(diào)和節(jié)奏 | 速途網(wǎng)
速途網(wǎng)4月9日訊(報(bào)道:?jiǎn)讨颈螅┙袢眨?a class='sowmlink' id='yamaxun' onmouseout='Fhidden()' onmouseover='Fpop(this)' target=_blank href='http://www.aykon.com.cn/channel/yamaxun.html'>亞馬遜宣布推出全新語(yǔ)音到語(yǔ)音模型——Amazon Nova Sonic。這款基礎(chǔ)模型將語(yǔ)音理解和生成功能統(tǒng)一于單一的模型中,使AI應(yīng)用程序中的語(yǔ)音對(duì)話更貼近人類的真實(shí)交流。通過(guò)簡(jiǎn)化語(yǔ)音應(yīng)用開(kāi)發(fā)流程,并提供深入理解人類對(duì)話微妙性的能力,Nova Sonic在客戶服務(wù)通話自動(dòng)化、旅游、教育、醫(yī)療和娛樂(lè)等領(lǐng)域展現(xiàn)出卓越的應(yīng)用潛力。
在過(guò)去十余年間,亞馬遜始終引領(lǐng)著語(yǔ)音技術(shù)的發(fā)展,從打造全球領(lǐng)先的個(gè)人AI助手Alexa到開(kāi)發(fā)各類云服務(wù)如Lex、Polly和Connect等。然而,要讓語(yǔ)音AI為客戶創(chuàng)造更多實(shí)際價(jià)值,它必須能夠理解人類對(duì)話的微妙與復(fù)雜性。傳統(tǒng)語(yǔ)音應(yīng)用開(kāi)發(fā)需協(xié)調(diào)多個(gè)模型,包括語(yǔ)音轉(zhuǎn)文字識(shí)別、語(yǔ)言理解和生成回復(fù)以及文本轉(zhuǎn)語(yǔ)音,這種分散的方法難以保留自然對(duì)話中的聲學(xué)情境和細(xì)微差別。
Amazon Nova Sonic采用全新方法應(yīng)對(duì)這些挑戰(zhàn)。該模型摒棄了使用多個(gè)不同模型的方式,而是將理解與生成功能統(tǒng)一于單一模型中。這使得Nova Sonic能夠根據(jù)語(yǔ)氣、風(fēng)格等聲學(xué)情境調(diào)整生成的語(yǔ)音響應(yīng),并理解人類對(duì)話中的自然停頓與猶豫。此外,它還能實(shí)時(shí)調(diào)取相關(guān)信息,提供更自然且實(shí)用的交互體驗(yàn)。
基于Amazon Nova Sonic構(gòu)建的應(yīng)用示例展示了其強(qiáng)大的功能,如在旅游AI代理中通過(guò)客戶語(yǔ)氣的變化來(lái)調(diào)整語(yǔ)調(diào)并實(shí)時(shí)查詢價(jià)格信息,以及企業(yè)客戶從基于公司數(shù)據(jù)生成響應(yīng)的能力中受益。這些功能加上其超快的推理能力,使Nova Sonic支持的語(yǔ)音應(yīng)用更加自然和實(shí)用。
亞馬遜表示,推出Amazon Nova Sonic彰顯了公司在先進(jìn)基礎(chǔ)模型領(lǐng)域的持續(xù)創(chuàng)新,并致力于為每一位客戶提供實(shí)際價(jià)值。