公眾號:mywangxiao
及時(shí)發(fā)布考試資訊
分享考試技巧、復(fù)習(xí)經(jīng)驗(yàn)
新浪微博 @wangxiaocn關(guān)注微博
聯(lián)系方式 400-18-8000
速錄技術(shù)與語音識別系統(tǒng)的區(qū)別
電腦速記技術(shù)是傳統(tǒng)手寫速記和計(jì)算機(jī)相結(jié)合的產(chǎn)物,它可以使語音信息即時(shí)轉(zhuǎn)化為電子文本,可以做到“會議畢,文稿出”。語音識別技術(shù)是讓機(jī)器通過識別和理解語音信號而轉(zhuǎn)化為相應(yīng)文本或命令的高技術(shù)。由于語音信息具有連續(xù)性、多變性、動態(tài)性、瞬時(shí)性的特點(diǎn),造成了語音識別的難度遠(yuǎn)遠(yuǎn)不像人們想像的那樣簡單--對著電腦的麥克風(fēng)一說,字馬上就會出來了。它的識別難度它在于和不同的說話人、不同的說話速度、不同的說話內(nèi)容以及不同的環(huán)境條件有關(guān)。
作為中文信息處理的工具,語音識別技術(shù)和電腦速記技術(shù)都是把稍縱即逝的語音信息轉(zhuǎn)化成文字,但二者的關(guān)系除了速記與錄音機(jī)的不同點(diǎn)相似外,還有以下幾點(diǎn):
1、同音字、詞處理的問題
現(xiàn)代漢語中的大量同音字、詞一直是中文信息處理電腦化的瓶頸。電腦速記、語音識別在記錄語音信息時(shí)都會遇到這個(gè)難題,關(guān)鍵是記錄的準(zhǔn)確率。如``以同等 xueli考研``是這個(gè)``學(xué)歷``還是這個(gè)``學(xué)力``;``秘書人員要正確領(lǐng)會領(lǐng)導(dǎo)shouyi``是這個(gè)``授意``還是這個(gè)``受意``等,即使是語音識別能夠完全記錄下語音信息,而且能夠達(dá)到百分之百的準(zhǔn)確率,其功能仍然和錄音機(jī)一樣(二者的關(guān)系見上文),同樣需要人們的后期加工整理,這樣花費(fèi)的時(shí)間要比人在當(dāng)時(shí)記錄的時(shí)候要多得多。因?yàn)槿嗽谥v話時(shí),往往是口語,從口語到書面語的轉(zhuǎn)化,并不單純是落成了文字。
2、人們在理解語言時(shí),可以根據(jù)語音之間的停頓、語調(diào)、語氣等,把聲音信息變成轉(zhuǎn)化文字,并實(shí)時(shí)添加相應(yīng)的標(biāo)點(diǎn)符號。語音識別在理解語言時(shí),需要說出標(biāo)點(diǎn)符號的具體名稱,因?yàn)闄C(jī)器在理解語言時(shí),需要*斷句來理解的:``王處長冒號您從哪兒來問號另起一自然段空兩格今天的政治學(xué)習(xí)內(nèi)容是前書名號鄧小平理論后書名號``,事實(shí)上人說話時(shí)是不說出標(biāo)點(diǎn)符號的具體名稱的,這樣會很別扭。
語音識別在理解語言時(shí)會遇到字符正確串切分和對句子結(jié)構(gòu)的理解問題。如``美國會考慮戰(zhàn)略導(dǎo)彈防御系統(tǒng)``是``美國/會/考慮/戰(zhàn)略導(dǎo)彈防御系統(tǒng)``還是``美/國會/考慮/戰(zhàn)略導(dǎo)彈防御系統(tǒng)``呢?``他yihuier/jiulai``本來是``他一會兒就來``往往會理解成``他一揮而就來``;``要及時(shí)把握……``語音識別就很可能會切分成``藥劑師把握……``。電腦速記是由人腦對語言信息進(jìn)行切分,加入標(biāo)點(diǎn)符號、分段的。
3、語音識別軟件對語料內(nèi)容要求嚴(yán)格,需要人們說標(biāo)準(zhǔn)的漢語普通話,如果有方言、口音、土語等識別起來相當(dāng)難,而且要事先進(jìn)行發(fā)言人口音適應(yīng)。盡管如此,文秘速記人員如果能夠聽得懂,一般都能夠記錄下來,也要求文秘速記人員必須具有廣闊的知識面,聽得多了,記錄的信息也就準(zhǔn)確得多了,這也是文秘速記人員往往會比一般人辨別、采集語音信息能力強(qiáng)的原因。如果方言特別重的人講話,人都聽不懂,機(jī)器也就更難聽懂了。
4、語音識別只能識別單一的漢語語音信息,對于其他有聲信息都會被其認(rèn)為是噪音而影響其識別的準(zhǔn)確率。例如,在正在播放有背景音樂的朗誦詞里提取男女對話的漢語信息,轉(zhuǎn)化成文字,麥克風(fēng)根本無法識別。
語音識別無法理解和識別交互式有聲信息,比如座談、討論、會談等多人發(fā)言時(shí),麥克風(fēng)無法辨識是哪位發(fā)言的信息,也不能只記錄這位發(fā)言人的信息,而把別的發(fā)言人的聲音信息阻隔在外。電腦速記技術(shù)由于是由人來把握,不但可以記錄下每個(gè)人的發(fā)言內(nèi)容,還可以記錄下當(dāng)時(shí)的場景,這樣的信息就會很豐富、生動。
5、新生事物的出現(xiàn)而產(chǎn)生的新詞語以及人名、地名等專業(yè)詞語,人們可以根據(jù)對語音信息的理解,選定具體是哪個(gè)字或詞。速記技術(shù)在記錄語言時(shí),可以對同音字(詞)進(jìn)行實(shí)時(shí)處理,以保證一次性在準(zhǔn)確率95%以上,這也是為什么電腦速記的出現(xiàn),能夠得到社會認(rèn)可的原因,也是速記技術(shù)高效率的具體體現(xiàn)。由于漢語詞匯的豐富無限性和可擴(kuò)展性特點(diǎn),為了提高語音識別的準(zhǔn)確率,必須對人名、地名、新詞語等專業(yè)詞語事先限定,把詞匯做入電腦語料庫里,但是實(shí)際操作起來不現(xiàn)實(shí)。例如用語音識別記錄即將召開的黨的十六大代表發(fā)言、討論內(nèi)容,往往不可能讓所有的代表都來事先對麥克風(fēng)把發(fā)言內(nèi)容說一遍,適應(yīng)一下口音,把相關(guān)詞語事先錄入進(jìn)去,這樣的話,就變成了現(xiàn)在是開會了。
6、信息化現(xiàn)代化、信息國際化的社會發(fā)展進(jìn)程出現(xiàn)了一種新的語言表達(dá)方式--中英文語音信息混合表達(dá)的現(xiàn)象,而且正在成為一種發(fā)展趨勢。比如``上海 APEC會議``、``WINDOWS98/XP系統(tǒng)````請王秘書把客戶的合同草案fai ke si(FAX)或E(E-mail)過來``,文秘速記人員在記錄時(shí),只要能夠聽得懂英文單詞,就可以把它即時(shí)翻譯記錄成``請王秘書把客戶的合同草案傳真或電郵過來``;另外,當(dāng)些外來詞語傳入我國時(shí),因?yàn)槭乔把卦掝},一時(shí)半時(shí)人們還找不到一個(gè)合適的中文詞語和造出一個(gè)新詞詞來代替,同樣會出現(xiàn)中文信息和外文信息混雜的情況,讓語音識別軟件去識別成全中文信息呢還是中外文混合信息呢?準(zhǔn)確率能夠達(dá)到多少?這也有速記文秘人員提出了新的挑戰(zhàn),成長為一名優(yōu)秀的文秘速記人員僅僅具備很高的記錄速度是遠(yuǎn)遠(yuǎn)不夠的。
7、電腦速記技術(shù)是語文現(xiàn)代化和中文信息處理的一個(gè)組成部分,漢語語音信息國際互聯(lián)網(wǎng)上同步字幕直播的高效率成為現(xiàn)實(shí)。無論是手寫速記還是電腦速記,都是以漢語拼音方案為基礎(chǔ)的,是深深植根于漢民族語言的技術(shù),隨著漢語的發(fā)展而發(fā)展,只要說漢語就有用速記存在的地方,而說別的語言又會變成別的語種的速記了。信息社會越發(fā)展,越需要處理信息的高效率,中文電腦速記技術(shù)正是這樣一個(gè)記錄、處理語言信息的高效率手段,它的出現(xiàn)與被應(yīng)用,正是信息社會發(fā)展的必然產(chǎn)物和人們處理信息高效率的必然趨勢。
總之,語音識別技術(shù)和電腦速記技術(shù)工作方式方法具有本質(zhì)的不同,一個(gè)是機(jī)芯在工作,一個(gè)是人腦在工作,是人腦對語音信息的再創(chuàng)造。語音識別無論怎樣智能,也無法取代人腦的智力
編輯推薦:
2014年秘書資格考試三級實(shí)務(wù)考點(diǎn)
更多關(guān)注:秘書資格考試報(bào)名時(shí)間 秘書資格報(bào)考條件 秘書資格考試科目
(責(zé)任編輯:中大編輯)