
當(dāng)前位置:
門(mén)鎖網(wǎng)>
門(mén)鎖新聞>
門(mén)鎖周邊>
詳情
手機(jī)版最新留言:
使用手機(jī)微信“掃一掃”功能,掃描以下二維碼,即可將本文分享到“朋友圈”中。
2024-06-23 編輯:中國(guó)門(mén)鎖網(wǎng) 來(lái)源:網(wǎng)絡(luò) 瀏覽數(shù):6086
是不是感覺(jué)和以往聽(tīng)到的機(jī)器合成音有些不一樣,似乎是真人?不要懷疑,這仍然是AI生成,是由思必馳最新推出的超自然語(yǔ)音合成技術(shù)生成。作為國(guó)內(nèi)專(zhuān)業(yè)的對(duì)話式人工智能平臺(tái)...
是不是感覺(jué)和以往聽(tīng)到的機(jī)器合成音有些不一樣,似乎是真人?
不要懷疑,這仍然是AI生成,是由思必馳最新推出的超自然語(yǔ)音合成技術(shù)生成。
作為國(guó)內(nèi)專(zhuān)業(yè)的對(duì)話式人工智能平臺(tái)型企業(yè),思必馳自主研發(fā)了全鏈路智能對(duì)話系統(tǒng),涵蓋聲學(xué)信號(hào)處理、語(yǔ)音識(shí)別與合成、性別/年齡/聲紋識(shí)別、自然語(yǔ)言理解、知識(shí)圖譜、對(duì)話管理、智能交互決策等技術(shù)鏈條。
思必馳在專(zhuān)注挖掘場(chǎng)景需求、不斷提升整體系統(tǒng)智能的同時(shí),也關(guān)注單點(diǎn)技術(shù)的持續(xù)創(chuàng)新與突破。比如在語(yǔ)音合成領(lǐng)域,思必馳近年來(lái)率先推出多項(xiàng)技術(shù),持續(xù)給客戶(hù)和終端用戶(hù)帶來(lái)更人性化、智能化的體驗(yàn)。
2022年,發(fā)布單人千音,實(shí)現(xiàn)單個(gè)音色就能生成同時(shí)覆蓋多種語(yǔ)言、多種風(fēng)格的語(yǔ)音合成聲音,極大豐富了合成語(yǔ)音的表現(xiàn)力;
2022年,推出發(fā)音人音色定制平臺(tái),支持客戶(hù)自主完成語(yǔ)音合成音色模型定制,降低語(yǔ)音合成定制門(mén)檻;
2022年,針對(duì)智能客服推出高情感、高擬人度的“多情感TTS”;
2022年,發(fā)布“千語(yǔ)千訓(xùn)”系統(tǒng),零人工介入、自動(dòng)更新模型,語(yǔ)音識(shí)別系統(tǒng)更新頻率實(shí)現(xiàn)了從周級(jí)到天級(jí)的跨越;
2023年,發(fā)布“聲音復(fù)刻”技術(shù),僅需錄制一句話即可復(fù)刻出自己的音色,支持任意文本的朗讀;
2023年,發(fā)布自然場(chǎng)景數(shù)字人生成技術(shù),個(gè)性化對(duì)話生成與語(yǔ)音合成模型無(wú)縫結(jié)合,構(gòu)建可自由交互的個(gè)性化IP;
2023年,發(fā)布支持基于生成擴(kuò)散模型的零樣本高質(zhì)量語(yǔ)音編輯,支持中文及英文,能夠像文本一樣去修改音頻......
而今天,思必馳又推出了一項(xiàng)全新的技術(shù):超自然語(yǔ)音合成,即基于語(yǔ)音特征離散化技術(shù)和大語(yǔ)言模型等,降低預(yù)測(cè)連續(xù)語(yǔ)音特征的難度,還原真人說(shuō)話細(xì)微的韻律特點(diǎn)、發(fā)音口癖,讓合成效果更加自然、真實(shí)且富有表現(xiàn)力。該項(xiàng)技術(shù)適用于AI數(shù)字人、新聞播報(bào)、智能客服、智能助理等眾多應(yīng)用場(chǎng)景。
(在線體驗(yàn))
拿捏真人說(shuō)話的“藝術(shù)”,高度還原細(xì)節(jié)
與傳統(tǒng)TTS生成聲音的刻板、不接地氣、缺乏真人聲音的抑揚(yáng)頓挫等相比,超自然語(yǔ)音合成的最大特點(diǎn)就是能夠高度還原真人說(shuō)話時(shí)的細(xì)節(jié),特別是語(yǔ)氣詞、吸氣聲、停頓等。
當(dāng)我們和朋友聊天時(shí),語(yǔ)氣詞、吸氣聲、停頓以及字音拖長(zhǎng)等語(yǔ)言現(xiàn)象經(jīng)常出現(xiàn),這些語(yǔ)言現(xiàn)象并不是隨意的,而是自然而然產(chǎn)生的:
“啊”、“哦”、“嗯”等語(yǔ)氣詞能夠傳達(dá)說(shuō)話人的情緒,吸氣聲表現(xiàn)了說(shuō)話人在思考或準(zhǔn)備說(shuō)話時(shí)的心理狀態(tài),猶豫時(shí)的停頓反映了說(shuō)話人的不確定性,字音拖長(zhǎng)則強(qiáng)調(diào)了某個(gè)詞語(yǔ)的重要性......
當(dāng)細(xì)微的韻律特點(diǎn)和發(fā)音口癖被還原時(shí),你能感受到語(yǔ)音的生動(dòng)性和自然性,仿佛是在與真實(shí)的人進(jìn)行交流。
以銀行智能客服場(chǎng)景為例,用戶(hù)感受到的是與“真人”溝通的親切感和舒適度。
然而,要實(shí)現(xiàn)這樣完美的語(yǔ)音合成效果并不容易,需要先進(jìn)的語(yǔ)音處理技術(shù)和大量的真實(shí)語(yǔ)音數(shù)據(jù)來(lái)訓(xùn)練合成模型。與此同時(shí),還需要對(duì)語(yǔ)音學(xué)和語(yǔ)言學(xué)有深入的理解,以便能夠準(zhǔn)確地捕捉和復(fù)現(xiàn)語(yǔ)音中的細(xì)微差別。
關(guān)鍵技術(shù)創(chuàng)新突破,捕捉真人語(yǔ)音特點(diǎn)
為了還原真人說(shuō)話效果,思必馳對(duì)韻律的多樣性進(jìn)行了深入研究,并將語(yǔ)音特征離散化應(yīng)用到語(yǔ)音合成領(lǐng)域。
語(yǔ)音特征離散化是指將連續(xù)的語(yǔ)音信號(hào)轉(zhuǎn)換為一系列離散值的過(guò)程。這種離散值通過(guò)使用自監(jiān)督(Self-Supervised Learning,SSL)模型提取得到,而自監(jiān)督模型則使用海量語(yǔ)音數(shù)據(jù)訓(xùn)練得到。在語(yǔ)音生成的過(guò)程中,用聲音模型將文本轉(zhuǎn)換成語(yǔ)音特征,離散化處理可以降低模型預(yù)測(cè)連續(xù)語(yǔ)音特征的難度,使其更容易捕捉到自然和多樣化語(yǔ)音的特點(diǎn)。
2022 年 4 月份,思必馳首席科學(xué)家、上海交通大學(xué)計(jì)算機(jī)系教授俞凱博士帶領(lǐng)的研究團(tuán)隊(duì)發(fā)表了將語(yǔ)音特征離散化技術(shù)應(yīng)用于文本到語(yǔ)音生成的關(guān)鍵成果,即《 VQTTS: High-Fidelity Text-to-Speech Synthesis with SelfSupervised VQ Acoustic Feature 》,這是業(yè)界首次將語(yǔ)音特征離散化應(yīng)用于從文本到語(yǔ)音生成的建模,使語(yǔ)音生成效果取得了突破性進(jìn)展。
在思必馳和上海交通大學(xué)計(jì)算機(jī)系跨媒體語(yǔ)言智能實(shí)驗(yàn)室的共同努力下,基于VQTTS 技術(shù)的思必馳情感音色悅悅?cè)〉昧烁哌_(dá) 4.7 的 MOS 分?jǐn)?shù),達(dá)到業(yè)內(nèi)一流水平。
思必馳也將VQTTS 技術(shù)應(yīng)用于超自然語(yǔ)音合成,結(jié)合大語(yǔ)言模型技術(shù)的成果,以及海量自然風(fēng)格的數(shù)據(jù),思必馳超自然語(yǔ)音合成技術(shù)可以更好地捕捉語(yǔ)言的韻律和語(yǔ)調(diào),從而生成更貼近人類(lèi)發(fā)音的語(yǔ)音。
全新的語(yǔ)音交互體驗(yàn),賦能千行百業(yè)多場(chǎng)景
羅伊·澤扎納在《未來(lái)生活簡(jiǎn)史》一書(shū)中提到,三場(chǎng)科技革命將在未來(lái)改變?nèi)祟?lèi)的工作、生活和思維方式。這三場(chǎng)革命分別是:個(gè)性化制造革命、智能革命和生物革命。在智能革命中,計(jì)算機(jī)開(kāi)始模仿人類(lèi)的部分語(yǔ)言和思維能力,人類(lèi)也在此過(guò)程中得到提升。
思必馳DFM-2大模型已經(jīng)在智能家居、電商客服、在線教育、智能汽車(chē)等眾多場(chǎng)景落地應(yīng)用,基于語(yǔ)音大模型技術(shù)的超自然語(yǔ)音合成,將讓更多產(chǎn)品具有更好的人機(jī)交互體驗(yàn),讓更多用戶(hù)體驗(yàn)到了科技創(chuàng)新的成果:
在線上教學(xué)場(chǎng)景中,學(xué)生可以聽(tīng)到自然、流暢且富有感情的授課內(nèi)容,激發(fā)學(xué)習(xí)熱情;在居家生活場(chǎng)景中,不僅能分享自己的喜怒哀樂(lè),還能得到“真人”情感上的安慰和支持。
每一次科技進(jìn)步,都讓人類(lèi)的生活更美好。基于超自然語(yǔ)音合成技術(shù),思必馳成將為千行百業(yè)的不同場(chǎng)景提供“真人”個(gè)性化聲音,助力開(kāi)啟全新的語(yǔ)音交互之旅。
掃描下方二維碼,輸入文本即可獲得一段自然流暢、聲情并茂的“真人”音頻,快去動(dòng)手試試吧。
*意向地區(qū):
*您的姓名:
*聯(lián)系電話:
需求說(shuō)明:
想了解這個(gè)項(xiàng)目,請(qǐng)聯(lián)系我!
我想加盟,請(qǐng)將項(xiàng)目的資料發(fā)給我。
請(qǐng)問(wèn)我所在地區(qū)有加盟商了嗎?
想了解此項(xiàng)目的加盟流程,請(qǐng)聯(lián)系我!
請(qǐng)問(wèn)加盟此項(xiàng)目需投資多少錢(qián)?
版權(quán)與免責(zé)聲明:
凡未注明稿件來(lái)源的內(nèi)容均為轉(zhuǎn)稿或由企業(yè)用戶(hù)注冊(cè)發(fā)布,本網(wǎng)轉(zhuǎn)載出于傳遞更多信息的目的,如轉(zhuǎn)稿涉及版權(quán)問(wèn)題,請(qǐng)作者聯(lián)系我們處理。我們對(duì)頁(yè)面中展示內(nèi)容的真實(shí)性、準(zhǔn)確性和合法性均不承擔(dān)任何法律責(zé)任。
如內(nèi)容信息對(duì)您產(chǎn)生影響,請(qǐng)及時(shí)聯(lián)系我們修改或刪除。
13520832007
2024門(mén)鎖網(wǎng)專(zhuān)訪凱理五金王總
2024門(mén)鎖網(wǎng)專(zhuān)訪三彪名派智能鎖黃總
2024門(mén)鎖網(wǎng)專(zhuān)訪洛克曼智能鎖何總
隨著人工智能技術(shù)和物聯(lián)網(wǎng)技術(shù)的完善和普及,智能家居已經(jīng)進(jìn)入到千家萬(wàn)戶(hù),在消費(fèi)升級(jí)背景下,智能門(mén)鎖已然成為智能家居市場(chǎng)的一大風(fēng)口。
為了探尋飛利浦智能鎖的起步歷程和未來(lái)規(guī)劃,我們特地專(zhuān)訪了飛利浦銷(xiāo)售總監(jiān)劉志丹先生,希望能夠找到飛利浦成功的奧義所在,為行業(yè)的良性發(fā)展帶來(lái)一些啟示和靈感。
中居聯(lián)杯·2024年度門(mén)鎖及智能鎖十大品牌獲獎(jiǎng)名單
2024門(mén)業(yè)及定制家居品牌峰會(huì)暨中居聯(lián)杯·2023年度木門(mén)及門(mén)墻柜整裝十大品牌表彰盛典圓滿落幕
飛利浦智能鎖采用半導(dǎo)體指紋傳感器,識(shí)別靈敏度高,不僅能透過(guò)皮膚表皮層去采集更精細(xì)的指紋細(xì)節(jié),還具備指紋認(rèn)證修復(fù)功能。
隨著人們安全意識(shí)的不斷提高,家庭安防正在成為智能家居產(chǎn)品中日益崛起的一部分,其中涉及到的產(chǎn)品包括家用攝像機(jī)、智能門(mén)鎖、智能貓眼、智能門(mén)鈴、門(mén)磁傳感器、紅外報(bào)警器等等。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),家庭安防類(lèi)設(shè)備在2...
CEEASIA亞洲三大專(zhuān)業(yè)消費(fèi)電子展之一、一年一度的消費(fèi)電子全產(chǎn)業(yè)鏈大會(huì) —— CEEASIA亞洲消費(fèi)電子展(北京)將于2022年6月25日-27日在中國(guó)北京亦創(chuàng)國(guó)際會(huì)展中心舉行。10月25日,中新展...
讓加盟更誠(chéng)信 讓選擇更放心
立即咨詢(xún)做有權(quán)威的品牌