第108頁(第1页)
请退出浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。🎁黑料不打烊看片
聽起來,還是有希望的。
除了匹配的問題之外,另一個最大的問題是語音輸入。
漢字那麼多個,上哪兒找這麼多人讀。
安夏的想法是去有播音主持相關專業的學校,把常用字讓學生們各自讀了,到時候湊在一起,數據就夠了。
技術總監張喬生一擺手:「不用這麼麻煩,可以用psoLa算法,進行波形編碼合成。」
「早就有了,不過最近有了的進展,出了一種的動態規劃法,對濁音段進行整體處理,時域基音可以同步疊加……」
張喬生興沖沖地企圖教會安夏。
沒等他說完,安夏點點頭:「總之,就是不用人錄,就能出聲音對吧?」
「對。」
「好,你去做吧。」
請程式設計師不要難為產品經理,我只想知道這個功能能不能實現,不是很在意怎麼實現的。
張喬生說到做到,在沒有跳槽進紫金的時候,他就是做音頻相關的,研究的比別人也深一些。
很快就拿出了程序,做第一次測試,安夏輸入「紫金電腦」。
沒聲音。
安夏調整音量,沒動靜。
「音效卡壞了?」安夏問道。
又過了3o秒,音箱裡慢悠悠地吐出一個字「紫」。
又過了十幾秒,又緩緩吐出一個「金」。
且不說那個比sIRI還要詭異的語氣。
最要緊的問題是,讀完四個字,用了一分多鐘。
安夏:「能不能在調取數據的時候,讓它稍微快一點?一份合同上千個字,等念完,一天都過去了。兩千字不要過三十分鐘。」
sIRI風格的念書差不多兩千字十二分鐘,安夏放寬到三十分鐘,已經很放寬了。
程式設計師再對匹配邏輯進行調整,跳過先匹配字符,再匹配聲音的過程,直接匹配聲音。
兩千字,從九點上班開始念,念到下午兩點。
用時比第一版省了一半,然而,離安夏的要求還是很遠。
「現在最大的問題是硬體,算完,再調取音頻,播放,差不多就是這個度。」
安夏想了想,問道:「如果是固定的詞組或是句子呢?」
「提前錄製好,會快很多。」
大多數商業合同是制式合同,會變動的往往是數字。
最多加一兩條特殊約定。
安夏拿公司的制式勞動合同先存進系統,試了一下,只修改了人名、入職時間、收入等等。
從硬碟調取的度果然快了許多。
就是念到後輸入的那些字和詞時,有一種迷幻的時間被拉長感。
🎁黑料不打烊看片请退出浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。