公眾號(hào):mywangxiao
及時(shí)發(fā)布考試資訊
分享考試技巧、復(fù)習(xí)經(jīng)驗(yàn)
新浪微博 @wangxiaocn關(guān)注微博
聯(lián)系方式 400-18-8000
速錄技術(shù)與語(yǔ)音識(shí)別系統(tǒng)的區(qū)別
電腦速記技術(shù)是傳統(tǒng)手寫速記和計(jì)算機(jī)相結(jié)合的產(chǎn)物,它可以使語(yǔ)音信息即時(shí)轉(zhuǎn)化為電子文本,可以做到“會(huì)議畢,文稿出”。語(yǔ)音識(shí)別技術(shù)是讓機(jī)器通過識(shí)別和理解語(yǔ)音信號(hào)而轉(zhuǎn)化為相應(yīng)文本或命令的高技術(shù)。由于語(yǔ)音信息具有連續(xù)性、多變性、動(dòng)態(tài)性、瞬時(shí)性的特點(diǎn),造成了語(yǔ)音識(shí)別的難度遠(yuǎn)遠(yuǎn)不像人們想像的那樣簡(jiǎn)單--對(duì)著電腦的麥克風(fēng)一說,字馬上就會(huì)出來了。它的識(shí)別難度它在于和不同的說話人、不同的說話速度、不同的說話內(nèi)容以及不同的環(huán)境條件有關(guān)。
作為中文信息處理的工具,語(yǔ)音識(shí)別技術(shù)和電腦速記技術(shù)都是把稍縱即逝的語(yǔ)音信息轉(zhuǎn)化成文字,但二者的關(guān)系除了速記與錄音機(jī)的不同點(diǎn)相似外,還有以下幾點(diǎn):
1、同音字、詞處理的問題
現(xiàn)代漢語(yǔ)中的大量同音字、詞一直是中文信息處理電腦化的瓶頸。電腦速記、語(yǔ)音識(shí)別在記錄語(yǔ)音信息時(shí)都會(huì)遇到這個(gè)難題,關(guān)鍵是記錄的準(zhǔn)確率。如``以同等 xueli考研``是這個(gè)``學(xué)歷``還是這個(gè)``學(xué)力``;``秘書人員要正確領(lǐng)會(huì)領(lǐng)導(dǎo)shouyi``是這個(gè)``授意``還是這個(gè)``受意``等,即使是語(yǔ)音識(shí)別能夠完全記錄下語(yǔ)音信息,而且能夠達(dá)到百分之百的準(zhǔn)確率,其功能仍然和錄音機(jī)一樣(二者的關(guān)系見上文),同樣需要人們的后期加工整理,這樣花費(fèi)的時(shí)間要比人在當(dāng)時(shí)記錄的時(shí)候要多得多。因?yàn)槿嗽谥v話時(shí),往往是口語(yǔ),從口語(yǔ)到書面語(yǔ)的轉(zhuǎn)化,并不單純是落成了文字。
2、人們?cè)诶斫庹Z(yǔ)言時(shí),可以根據(jù)語(yǔ)音之間的停頓、語(yǔ)調(diào)、語(yǔ)氣等,把聲音信息變成轉(zhuǎn)化文字,并實(shí)時(shí)添加相應(yīng)的標(biāo)點(diǎn)符號(hào)。語(yǔ)音識(shí)別在理解語(yǔ)言時(shí),需要說出標(biāo)點(diǎn)符號(hào)的具體名稱,因?yàn)闄C(jī)器在理解語(yǔ)言時(shí),需要*斷句來理解的:``王處長(zhǎng)冒號(hào)您從哪兒來問號(hào)另起一自然段空兩格今天的政治學(xué)習(xí)內(nèi)容是前書名號(hào)鄧小平理論后書名號(hào)``,事實(shí)上人說話時(shí)是不說出標(biāo)點(diǎn)符號(hào)的具體名稱的,這樣會(huì)很別扭。
語(yǔ)音識(shí)別在理解語(yǔ)言時(shí)會(huì)遇到字符正確串切分和對(duì)句子結(jié)構(gòu)的理解問題。如``美國(guó)會(huì)考慮戰(zhàn)略導(dǎo)彈防御系統(tǒng)``是``美國(guó)/會(huì)/考慮/戰(zhàn)略導(dǎo)彈防御系統(tǒng)``還是``美/國(guó)會(huì)/考慮/戰(zhàn)略導(dǎo)彈防御系統(tǒng)``呢?``他yihuier/jiulai``本來是``他一會(huì)兒就來``往往會(huì)理解成``他一揮而就來``;``要及時(shí)把握……``語(yǔ)音識(shí)別就很可能會(huì)切分成``藥劑師把握……``。電腦速記是由人腦對(duì)語(yǔ)言信息進(jìn)行切分,加入標(biāo)點(diǎn)符號(hào)、分段的。
3、語(yǔ)音識(shí)別軟件對(duì)語(yǔ)料內(nèi)容要求嚴(yán)格,需要人們說標(biāo)準(zhǔn)的漢語(yǔ)普通話,如果有方言、口音、土語(yǔ)等識(shí)別起來相當(dāng)難,而且要事先進(jìn)行發(fā)言人口音適應(yīng)。盡管如此,文秘速記人員如果能夠聽得懂,一般都能夠記錄下來,也要求文秘速記人員必須具有廣闊的知識(shí)面,聽得多了,記錄的信息也就準(zhǔn)確得多了,這也是文秘速記人員往往會(huì)比一般人辨別、采集語(yǔ)音信息能力強(qiáng)的原因。如果方言特別重的人講話,人都聽不懂,機(jī)器也就更難聽懂了。
4、語(yǔ)音識(shí)別只能識(shí)別單一的漢語(yǔ)語(yǔ)音信息,對(duì)于其他有聲信息都會(huì)被其認(rèn)為是噪音而影響其識(shí)別的準(zhǔn)確率。例如,在正在播放有背景音樂的朗誦詞里提取男女對(duì)話的漢語(yǔ)信息,轉(zhuǎn)化成文字,麥克風(fēng)根本無法識(shí)別。
語(yǔ)音識(shí)別無法理解和識(shí)別交互式有聲信息,比如座談、討論、會(huì)談等多人發(fā)言時(shí),麥克風(fēng)無法辨識(shí)是哪位發(fā)言的信息,也不能只記錄這位發(fā)言人的信息,而把別的發(fā)言人的聲音信息阻隔在外。電腦速記技術(shù)由于是由人來把握,不但可以記錄下每個(gè)人的發(fā)言內(nèi)容,還可以記錄下當(dāng)時(shí)的場(chǎng)景,這樣的信息就會(huì)很豐富、生動(dòng)。
5、新生事物的出現(xiàn)而產(chǎn)生的新詞語(yǔ)以及人名、地名等專業(yè)詞語(yǔ),人們可以根據(jù)對(duì)語(yǔ)音信息的理解,選定具體是哪個(gè)字或詞。速記技術(shù)在記錄語(yǔ)言時(shí),可以對(duì)同音字(詞)進(jìn)行實(shí)時(shí)處理,以保證一次性在準(zhǔn)確率95%以上,這也是為什么電腦速記的出現(xiàn),能夠得到社會(huì)認(rèn)可的原因,也是速記技術(shù)高效率的具體體現(xiàn)。由于漢語(yǔ)詞匯的豐富無限性和可擴(kuò)展性特點(diǎn),為了提高語(yǔ)音識(shí)別的準(zhǔn)確率,必須對(duì)人名、地名、新詞語(yǔ)等專業(yè)詞語(yǔ)事先限定,把詞匯做入電腦語(yǔ)料庫(kù)里,但是實(shí)際操作起來不現(xiàn)實(shí)。例如用語(yǔ)音識(shí)別記錄即將召開的黨的十六大代表發(fā)言、討論內(nèi)容,往往不可能讓所有的代表都來事先對(duì)麥克風(fēng)把發(fā)言內(nèi)容說一遍,適應(yīng)一下口音,把相關(guān)詞語(yǔ)事先錄入進(jìn)去,這樣的話,就變成了現(xiàn)在是開會(huì)了。
6、信息化現(xiàn)代化、信息國(guó)際化的社會(huì)發(fā)展進(jìn)程出現(xiàn)了一種新的語(yǔ)言表達(dá)方式--中英文語(yǔ)音信息混合表達(dá)的現(xiàn)象,而且正在成為一種發(fā)展趨勢(shì)。比如``上海 APEC會(huì)議``、``WINDOWS98/XP系統(tǒng)````請(qǐng)王秘書把客戶的合同草案fai ke si(FAX)或E(E-mail)過來``,文秘速記人員在記錄時(shí),只要能夠聽得懂英文單詞,就可以把它即時(shí)翻譯記錄成``請(qǐng)王秘書把客戶的合同草案?jìng)髡婊螂娻]過來``;另外,當(dāng)些外來詞語(yǔ)傳入我國(guó)時(shí),因?yàn)槭乔把卦掝},一時(shí)半時(shí)人們還找不到一個(gè)合適的中文詞語(yǔ)和造出一個(gè)新詞詞來代替,同樣會(huì)出現(xiàn)中文信息和外文信息混雜的情況,讓語(yǔ)音識(shí)別軟件去識(shí)別成全中文信息呢還是中外文混合信息呢?準(zhǔn)確率能夠達(dá)到多少?這也有速記文秘人員提出了新的挑戰(zhàn),成長(zhǎng)為一名優(yōu)秀的文秘速記人員僅僅具備很高的記錄速度是遠(yuǎn)遠(yuǎn)不夠的。
7、電腦速記技術(shù)是語(yǔ)文現(xiàn)代化和中文信息處理的一個(gè)組成部分,漢語(yǔ)語(yǔ)音信息國(guó)際互聯(lián)網(wǎng)上同步字幕直播的高效率成為現(xiàn)實(shí)。無論是手寫速記還是電腦速記,都是以漢語(yǔ)拼音方案為基礎(chǔ)的,是深深植根于漢民族語(yǔ)言的技術(shù),隨著漢語(yǔ)的發(fā)展而發(fā)展,只要說漢語(yǔ)就有用速記存在的地方,而說別的語(yǔ)言又會(huì)變成別的語(yǔ)種的速記了。信息社會(huì)越發(fā)展,越需要處理信息的高效率,中文電腦速記技術(shù)正是這樣一個(gè)記錄、處理語(yǔ)言信息的高效率手段,它的出現(xiàn)與被應(yīng)用,正是信息社會(huì)發(fā)展的必然產(chǎn)物和人們處理信息高效率的必然趨勢(shì)。
總之,語(yǔ)音識(shí)別技術(shù)和電腦速記技術(shù)工作方式方法具有本質(zhì)的不同,一個(gè)是機(jī)芯在工作,一個(gè)是人腦在工作,是人腦對(duì)語(yǔ)音信息的再創(chuàng)造。語(yǔ)音識(shí)別無論怎樣智能,也無法取代人腦的智力
編輯推薦:
2014年秘書資格考試五級(jí)速記基礎(chǔ)指導(dǎo)
2014年秘書資格考試三級(jí)實(shí)務(wù)考點(diǎn)
更多關(guān)注:秘書資格考試報(bào)名時(shí)間 秘書資格報(bào)考條件 秘書資格考試科目
(責(zé)任編輯:中大編輯)