24小時客服電話:010-82311666
APP下載
掃一掃,立即下載
醫(yī)學教育網(wǎng)APP下載

開發(fā)者:北京正保醫(yī)教科技有限公司

蘋果版本:8.6.4

安卓版本:8.6.4

應用涉及權限:查看權限 >

APP:隱私政策:查看政策 >

正保醫(yī)學教育網(wǎng)醫(yī)師資格_微信公眾號
微信公眾號
熱門資訊,實時推送
Yishimed66
正保醫(yī)學教育網(wǎng)醫(yī)師資格_微信視頻號
官方視頻號
免費直播,訂閱提醒
微信掃碼即可關注
正保醫(yī)學教育網(wǎng)醫(yī)師資格考試指導老師
考試指導老師
備考規(guī)劃,專屬指導
微信掃碼添加老師
正保醫(yī)學教育網(wǎng)_官方抖音號
官方抖音號
分享更多醫(yī)考日常
抖音掃一掃關注
當前位置:醫(yī)學教育網(wǎng) > 口腔執(zhí)業(yè)醫(yī)師 > 其他信息
技能全能包

不同語音輸入法的比較研究

2008-08-28 16:05 來源:
打印
字體:

  摘 要:目的 比較不同語音輸入法的異同,為進一步認識漢語病理性語言的音聲特征提供參考。方法 11例腭咽閉合功能不全患者,男性6例,女性5例;年齡7~35歲,平均16.18歲。被檢敏感音為/m/、/pa/、/ku/,分別直接和間接輸入計算機語音工作站,測定音長、能量、音高和第一、二、三共振峰,并使用統(tǒng)計軟件(SPSS9.0)對數(shù)據(jù)進行處理和分析。結果 兩種語音輸入法的音長、音高和第一共振峰無明顯差異(P>0.05),而能量和第二、三共振峰有明顯差異(P<0.01)。結論 直接語音輸入法和間接語音輸入法有一定的區(qū)別,二者不能互相代替。

  在唇腭裂序列治療中,語音治療已越來越受到廣大臨床醫(yī)師的重視。但有關病理性語音的研究在國內尚不多見。隨著計算機技術的高速發(fā)展,計算機語音工作站(computerspeechlab,CSL)也已進入了語音研究領域,它可以直接對語音進行圖像化和定理分析,使“只能聽”的聲音“可視化”,使人們對語音的特性有了更加深入、全面的了解。由于大量的臨床語音資料均由磁帶保存,本文通過對病理性語音的直接輸入和間接輸入進行對照研究,希望能夠闡明兩種方法之間的異同,為進一步認識漢語病理性語音的音聲特征提供參考。醫(yī)學教育網(wǎng)搜集整理

  1.材料與方法

  研究對象:選自1999年6月~1999年9月在上海第二醫(yī)科大學附屬第九人民醫(yī)院口腔頜面外科確診的11例腭咽閉合功能不全(velopharyngealincompetence,VPI)患者,男性6例,女性5例,年齡7~35歲,平均16.18歲,其中6例為腭裂術后腭咽閉合功能不全,3例為咽成形術后腭咽閉合功能不全,2例為先天性腭咽閉合功能不全。所有患者智力正常,無明顯聽力障礙,熟練掌握普通話,未接收過語音治療。

  研究方法:被檢者取坐位,自然放松,距麥克風5cm,練習被檢敏感音/m/、/pa/、/ku/后,直接輸入CSL4300B(美國KAY公司)和錄音(日本松下公司EAC錄音器材)。錄音機距麥克風5cm,磁帶播放錄音再次輸入CSL.樣本采樣頻率為10000Hz,均測量音長(DOMAIN)、能量(ENERGY)、音高(PITCH)和第一、二、三共振峰(FORMANT)的平均值。重復三次,取平均值。使用SPSS9.0對數(shù)據(jù)行配對t檢驗。

  2.結果

  間接輸入法的平均能量較直接輸入法低,而它的第二、三共振峰的平均值較直接輸入法高(見表1),且有統(tǒng)計學上的差異(P<0.01),見表2.直接輸入法的音長、音高和第一共振峰的平均值較間接輸入法高,但無統(tǒng)計學上的差異(P>0.05),見表2。

表1 統(tǒng)計量 

      均值  例數(shù) 標準差 標準誤
1 

音長a
音長b(SEC)

33
 33 
0.568
 0.551
0.123
 0.138
0.021
 0.024 
2  能量a
能量b(dB)
33
 33 
67.627
 61.965
6.097
 6.900
1.061
 1.201 
3  音高a
音高b(H2
33
 33 
200.899
 192.945 
47.001
 44.261 
8.182
 7.705 
4  第一共振峰a
第二共振峰b(H2) 
33
 33 
461.617
 427.653 
177.252
 162.330 
30.856
 28.258 
5  第二共振峰a
第地共振峰b(H2
33
 33 
1240.445
 1413.815 
235.222
 216.350 
40.947
 37.662 
6  第三共振峰a
第三共振峰b(H2) 
33
 33 
2249.395
 2438.370 
257.777
 218.276 
44.873
 37.997 

  注:末位字母為a是直接輸入法,末位字母為b是間接輸入法。

  3.討論

  CSL:CSL是一種動態(tài)音頻頻譜分析議,可將聲音信號轉變?yōu)榭梢晥D譜并輸入計算機,具有語音信號獲取、分析、編輯和回放功能,能提供圖譜中的各種物理量并顯示它們之間的動態(tài)關系。它操作簡單、技術先進,分析手段主要包括波形圖、FFT頻譜和LPC濾波曲線、語圖和音高,為語音學研究提供了一種準確而有效的儀器,也是目前國際上在語音分析中最常用和先進的儀器之一。它的優(yōu)點為:對患者無損害,不帶來痛苦,在學齡前兒童中也可廣泛應用,既可研究元音,又可研究輔音,重復性和可靠性好。其不足之處是需要有一定的專業(yè)知識,同時其價格昂貴,還需要計算機、打印機和電腭圖等配套設備,難以在基層醫(yī)院推廣。

  VPI的診斷:VPI的診斷并不復雜,常包括以下幾個方面:詳細詢問病史、體格檢查、語音清晰度測試、輔助檢查(包括X線、內窺鏡、呼氣流體力學、超聲、電腭圖、EMG、CT等)和智力、個性和可教性的評價(包括IQ測試,個性測試和其它測試)。值得注意的是語音清晰度測試的手段。國際上通常是使用各種嚴格設計且經(jīng)過科學論證的字表進行測試。如美國一般使用IowaPressureArticulationTest(IPAT),現(xiàn)在國內也有類似的《漢語語音清晰度測試字表》。它既能較全面地評價語音障礙的程度,又能客觀地語音反映障礙的類型。還有比較重要的VPI的臨界值,Warren(1964)用氣流動力學方法對健康人和腭咽模型進行的試驗研究表明區(qū)別腭咽閉合是否完善的腭咽口面積的臨界值是20mm2,McWilliams(1981)采用鼻流計、壓力氣流儀、口腔氣壓計、和多位X線電影投照等四種方法結合語音檢查對腭裂術后患者的腭咽閉合狀況進行了深入的研究,提出應將臨界值修訂的15mm2,腭咽口面積0~5mm2者可認為有完善的腭咽閉合。Mayo(1998)再次將臨界值修訂為10mm2.也有學者(1985)認為語音效果優(yōu)劣的不一定與腭咽通道的大小有直接關系,腭咽結構的神經(jīng)肌肉運動模式才是最主要的影響因素??偠灾裱士陂]合面積是一個重要依據(jù),但它并非是診斷VPI的唯一標準。

表2 配對t檢驗

      均值 標準差  標準誤  t 自由度  概率 
1  音長 0.017 0.190 0.033  0.522  32 0.605 
2  能量 5.662 4.576 0.797  7.108  32 0.000 
3  音高 7.953 40.556 7.060  1.127  32 0.268 
4  第二共振峰  33.963 127.678  22.226  1.528  32 0.136 
5  第二共振峰  -173.370  219.213  38.160  -4.543  32 0.000 
6  第三共振峰  -188.975  217.105  37.793  -5.000  32 0.000 

  被檢音的選擇:音聲研究中被檢音的選定非常重要。VPI患者的異常語音有其自身的特點,以輔音為主,其語音清晰度往往較低,通常包括聲門爆破音、咽喉爆破音、咽喉摩擦音等。本研究所選的/pa/、/ku/均為VPI患者的敏感音,它們最容易在聲門爆破音和咽喉爆破音中檢測出。/m/為雙唇鼻輔音,它代表聲波在鼻腔內的共振狀況,對于過低鼻音的檢測有重要的意義。此三個音節(jié)也是選自于《漢語語音清晰度測試字表》。醫(yī)學教育網(wǎng)搜集整理

  語音的特征:音色、音高、響度和音長是語音的四要素。它們?yōu)楣P者提供了區(qū)別所有語音的最方便的方法。音色是聲音互相產(chǎn)生區(qū)別的本質特征。發(fā)音方法、發(fā)音體以及共鳴腔形態(tài)的不同都會產(chǎn)生音色上的差異。對音色的區(qū)別可以通過波形、共振峰頻率等表征語音聲學特征的物理量表現(xiàn)。國內有學者報道:“腭裂語音”的第一共振峰與正常人接近,而第二、三共振峰均低于正常人。本研究選擇了第一至三共振峰為對象,第一共振峰與開口度成正比;第二共振峰與舌位前后成反比,也與園唇有關,唇越園,第二共振峰越低;第三共振峰與軟腭的升降有關,軟腭降低,咽腔面積增大,第三共振峰就越低。根據(jù)本研究結果:兩種語音輸入法的第一共振峰無統(tǒng)計學差異,這是因為患者在發(fā)相同音節(jié)時開口度不會有較大變化。而間接輸入法的第二、三共振峰明顯高于直接輸入法,這可能與錄放音器材對不同頻率的語音處理不同有關,也可能與患者對敏感音的不穩(wěn)定發(fā)聲有關。音高是一種聽覺的主觀心理量,人們對聲音信號頻率的感覺表現(xiàn)為音調的高低,即音量。任何聲音都有基頻和許多諧波組成。音高的確切數(shù)值用聲音的基頻表示,而不包括聲音的諧波部分。本研究顯示:兩種語音輸入法的音高無統(tǒng)計學差異。這說明錄音對聲音的基頻影響較小。響度也是一種聽覺的主觀心理量,它受聲強的制約。音接輸入法的能量值明顯低于直接輸入法,可能與錄放音過程中能量的損耗有關,也可能與每次發(fā)音的響度不同有關。音長在輔音中非常重要,起著區(qū)別特征的作用。它包括聲母時長和韻母時長。本研究所指音長是指整個音節(jié)的長度。兩種輸入法的音長基本相同。這說明患者每次發(fā)音的長短基本一致。

  綜上所述,直接語音輸入法和間接語音輸入法雖然在音高、音長和第一共振峰上保持一致,但在決定音色的第二、三共振峰上有明顯的差別。這說明二者難以互相代替。建議在語音研究中固定使用一種輸入法,以保持數(shù)據(jù)的準確性和可靠性。

題庫小程序

  • 距2025口腔醫(yī)師實踐技能考試還有?
醫(yī)師資格公眾號
關注考試動態(tài)
發(fā)布考情動態(tài)
考試復習指導
免費1V1咨詢考試條件
  • 免費試聽
  • 免費直播
  • 輔導課程
2024中醫(yī)醫(yī)師入學摸底測試解析

張鈺琪老師 2024-02-27 19:25--21:00

回看
2024醫(yī)考報名后如何安排復習時間

張鈺琪老師 2024-01-30 19:25--21:00

回看
2025年備考方案,供你選!
精品題庫
  • 密題庫
  • 題庫小程序
  • 醫(yī)考愛打卡
口腔執(zhí)業(yè)醫(yī)師密題庫
上千道典型習題
仿真密卷 3
仿真歷年考點題
專業(yè)題目解析
原價:¥199
復購¥159.2
查看詳情
醫(yī)學題庫小程序
正保醫(yī)學題庫

· 每日一練 鞏固提升

· 仿真試卷 實戰(zhàn)演練

· 組隊刷題 互相激勵

查看 更多免費題庫
醫(yī)考愛打卡
醫(yī)考愛打卡

· 每天一個知識點

· 配套精選練習題

· 隨時記錄打卡心情

查看 更多免費題庫
學習社區(qū)
  • 備考交流
  • 微信
  • 視頻號
拒絕盲目備考,加學習群共同進步!
尋找學習搭子
回到頂部
折疊