•35•
特殊教育研究學刊
民 105,41 卷 3 期,35-66 頁
DOI: 10.6172/BSE.201611.4103002
語音異常兒童的語音區辨及聲學
調整對其聽知覺的影響
鄭靜宜
高雄師範大學 特殊教育學系
語音異常(speech sound disorders, SSD)兒童常有語音區辨困難,本研究
之目的在探討 SSD 兒童的語音對比區辨及調整聲學線索對語音區辨的影響。本
研究有 102 位參與者,包括 31 位六足歲的 SSD 兒童和 31 位年齡、性別配對無
SSD 的兒童為控制組;另有 40 位正常成人為控制組,作為和兒童聽辨表現比較
的基礎。實驗一的刺激材料是 52 對具最小音素對比的華語單音節音,含 13 類語
音對比。實驗二的材料是將實驗一的刺激用聲學再合成調整聲學特徵性,比較聲
學調整對三組聽者區辨的影響。聲學調整方式是在摩擦噪音強度、共振峰轉折
帶、VOT(voice onset time)、噪音遮蔽和梅爾倒頻(MFCC)濾波等方面做強化或
減弱對比的調整。結果發現 SSD 兒童的語音區辨正確率顯著低於兒童控制組,
兩個兒童組的區辨正確率皆顯著低於成人組;三組反應時間 (RT) 亦達顯著差異,
SSD 兒童組 RT 顯著慢於兒童控制組和成人組,成人組 RT 最短。在實驗二無論
是正確率或 RT,三組聽者對於強化類刺激的反應皆顯著優於減弱類刺激。SSD
組對於強化類刺激,RT 顯著較快於實驗一的原始刺激,顯現增益效果,但在正
確率未見提升效果;對於減弱類刺激和實驗一原始刺激相較則有顯著降低效果。
語音區辨的正確率和 RT 各與兒童構音測驗分數呈中度相關(r = .50,r = -.64,
p < .001)。可知六歲兒童的語音區辨,無論在正確率和 RT 皆不及成人,對於一
些較難的語音對比區辨習得應是在六歲之後;SSD 兒童語音區辨能力較一般兒童
為弱。由於聽知覺發展在學習「說」之前,推論語音區辨的困難可能是造成兒童
SSD 的原因之一。
關鍵詞:語音異常、構音/音韻異常、語音區辨、聲學調整、語音知覺
本文作者通訊方式(
[email protected])。
*
•36•
特殊教育研究學刊
緒論
兒童以「音韻異常」(phonological disorders)
稱之;然此名稱忽略了說話涉及的動作成
語音知覺是語言學習的重要基礎,兒
分,一些顧全整體性的學者,如 Bernthal、
童語言發展的順序一般是由先學「聽」,再
Bankson、Flipsen 等 人 則 將 之 稱 為 構 音 /
學「說」,之後再學會「讀」和「寫」,依
音 韻 異 常(articulatory disorders/phonological
此順序發展而成。兒童語言的聽、說、讀、
disorders)。因為這些語音異常兒童中,可能
寫能力的發展,乃是建立於語音知覺的能力
有的人屬於音韻異常問題,有的則純為構音
之 上。 過 去 的 一 些 研 究(Kronvall & Diehl,
動作問題,有的人則兼具兩種問題,故近年
1954; Nijland, 2009; Tallal, 1980; Tallal, Miller,
來一般研究或教科書乃逐漸多改以 SSD 來統
Jenkins, & Merz, 1997)顯示,語音知覺能力
稱這類的兒童,因為他們外在的表現皆是語
的缺陷常是造成兒童音韻異常(phonological
音的異常或錯誤。
impairment)、語言發展遲緩或是閱讀障礙的
根 據 美 國 聽 語 學 會(American Speech-
原因。這些聽知覺異常的兒童雖然通過聽力
Language-Hearing Association [ ASHA], 2016)
檢測,被視為聽力正常,但在聽辨語音方面
的界定,語音異常是指兒童具有持續性的語
卻常顯現困難。語音區辨是一種基礎的語音
音錯誤,這些語音錯誤在超過某特定年齡之
知覺能力,個體可辨別語言中語音類別間的
後仍未去除,仍舊存留著;而語言中各語音
不同。若個體無法區辨語音類別的差異,將
類別均有其可正確產生之特定時間或年齡階
無法正確辨認語音類別,在語音的製造方面
段。語音異常情況包括語音製造錯誤產生的
也可能出現相應的錯誤,連帶影響內在語音
構音問題和各種錯誤的音韻歷程(phonological
系統之音韻概念(或表徵)的建立,或是內
processes)類型。在《精神疾病診斷與統計
在音韻系統的完整性,且後續可能影響更高
手冊》(第五版)(Diagnostic and Statistical
層次的語言習得,例如:語意、語型、語法
Manual of Mental Disorders, DSM-5, 2013)中,
的學習,導致語言理解或表達的異常。臨床
語音異常(或稱音韻異常)的編碼是 315.39
上常可見語音知覺能力不佳的兒童在其本國
(F80.0),其中描述語音異常的關鍵診斷標
和外國語文的學習上,面臨相當大的困難。
準是個體具持續性的語音製造困難、干擾語
語音異常(Speech Sound Disorders, SSD)
音清晰度或是人際間口語訊息的溝通。以上
是指兒童說話時出現語音省略、代替、扭曲或
兩個頗具權威來源對 SSD 的定義皆強調,
添加音等錯誤情形,導致說話時整體清晰度不
SSD 是個體出現持續一段時間達一定嚴重程
佳,影響人際溝通,即俗稱「臭乳呆」(臺語)
度的語音錯誤問題,且此問題已干擾了正常
的情況。構音異常(articulatory disorders)、
人際之間的溝通互動。由於學前兒童尚在語
音韻障礙(phonological impairment)或構音/
言發展階段,兒童語音錯誤的嚴重度需要和
音韻異常這些名稱指的皆都是 SSD 的情況。
同年齡相較,因此對於語音異常兒童的診斷,
至於為何會有如此不同的稱呼,則涉及到一
需使用具有常模的構音/音韻評估工具。
些學術歷史的沿革。在最早期時,此情況稱
SSD 兒童是屬於功能性(functional)問
為「構音異常」(articulatory disorders)。但
題,而非器質性(organic)問題,純粹 SSD
於 1970 年代後因語言學學派興起,認為他們
兒童通常具有正常的聽力、智力、社交、情
問題的根源在於音韻發展的異常,因此對此類
感和肢體動作行為能力,但說話時語音不清
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•37•
楚,妨礙人際溝通。根據統計,構音/音韻
的語音區辨能力可探知語音異常的根源性,
異常兒童的出現率約占全部語言異常兒童人
有助於後續語言介入或治療的實施。
數 的 40% 左 右( 林 寶 貴,1984), 是 所 有
先前一些嬰幼兒語音相關研究(Eimas,
語言異常類別中最常見的一種。根據美國國
Gavin, & Wilson, 1979; Kuhl, 1991, 1992; Werker
家失聰及其他溝通障礙研究中心(National
& Tees, 2002)皆發現出生六個月大的嬰兒已
Institute on Deafness and Other Communication
初具一些分辨語音對比的能力,如構音部位、
Disorders[NIDCD], 1994)的統計,音韻障礙
構音方式與塞音有聲與否(有 / 無聲或送氣
(即語音異常)在學齡前和學齡期的盛行率
與否)等,然這些研究也顯示嬰兒並非對語
約佔 10%,其中有 80% 需要被介入。在一般
言中所有存在的語音對比都能有效辨認,亦
臨床上,語言治療師處理的兒童個案之中音
即,雖然嬰兒已初備可區辨一些語音特徵的
韻障礙兒童通常占大多數(Bernthal, Bankson,
能力,但並非全部,且處理效率也不及成人。
& Flipsen, 2013)。SSD 的出現率通常以四到
事實上,兒童語音知覺發展和語音產生的發
七歲左右為最高,且會隨著年齡增加而有下
展情況頗為類似,皆是需歷經數年成長而習
降的趨勢(Berntha et al., 2013),可見學齡前
得。Berthal 等人(2013)指出,兒童對於有
階段是 SSD 出現的主要年齡層,而學齡前階
些較難的語音聽覺對比區辨會遲至三歲或三
段同時也是語音知覺發展的重要時期。
歲後才學會。Holt 與 Lalonde(2012)探討 30
一、兒童的語音知覺發展
位二至四歲學步兒的語音區辨發現,顯著的
年齡效果和語音對比的難易度效果,對學步
健全的語音知覺能力是語音/語言學習
兒而言,有些語音對比是明顯較難區辨的。
的先備條件,當語音刺激進入個體的聽覺系
McAllister Byun(2015)測量 15 位三到五歲
統後,會先由週邊聽覺機制解析聲學信號中
典型發展兒童的單音節非詞對比的聽辨發現
一些基本屬性,如頻率、強度、時長等,再
學前兒童的語音聽辨正確率遠不及成人,甚
由中樞機制轉換或詮釋成具有意義的表徵。
至其中有三位兒童正確率只有猜測水準,推
個體語音知覺的目的通常是為求取聲學信號
論學前兒童在語音知覺方面的發展尚未成熟。
所代表的意義或表徵,以作為符合當時溝通
在華語兒童語音發展研究方面,也有
情境的解釋。一個語音意義則是建立於語音
許多學者採類似的看法,例如:張顯達與許
信號中對聲學特徵的對比區辨上,亦即,若
碧勳(2000)探討四到六歲華語兒童在輔音
要得到某一語音的正確意義,需先區辨該語
聽辨與新詞發音能力發現,兒童語音區辨的
音所具有的關鍵聲學特徵。例如:若要區分
正確率和他們的構音正確率呈正相關,並指
華語中「爸」和「怕」音需分辨兩音在 VOT
出各年齡組兒童聽辨與發音能力有同步漸進
(voice onset time)上的差異。若聽者聽知覺
的趨勢。劉惠美、曹峰銘、張鑑如與徐儷玲
上無法區辨 VOT 的長短,在沒有其他輔助線
(2013)探討 150 位四到八歲兒童的語音區
索(如上下文脈絡)情況下,無法區分兩音,
辨和詞彙理解間的關聯性發現兒童的語音區
會導致語意的混淆或理解。亦即若聽者無法
辨能力隨著年齡成長而增加,顯示語音知覺
把聲學信號轉換成具有正確意義的表徵,將
能力從四到八歲之間仍呈現持續發展狀態,
妨礙語意的理解或甚至影響自己的語音製造,
並發現這些兒童的聲調和塞音構音部位區辨
形成語音異常的問題。因此,藉由了解兒童
的發展優於塞擦音和摩擦音的區辨,且語音
•38•
特殊教育研究學刊
區辨敏感度與詞彙理解有顯著的正相關。曹
引導構音動作也有不可忽略的重要性。個體
峰銘、李菁芸、謝怡欣與邱建業(2009)調
聽知覺缺陷有可能導致語音產生的異常,出
查華語五至七歲兒童對於塞音及聲調區辨,
現構音的錯誤。
也發現語音區辨敏感度會隨著年齡成長。對
目前已有一些研究發現語音異常兒童
於捲舌音對比的辨識,算是華語語音中較難
具 有 聽 知 覺 的 問 題, 例 如:Edwards、Fox
的語音區辨項目,就算是一般正常成人的單
與 Rogers(2002)測量學前音韻異常兒童的
音節捲舌音對比區辨的正確率也只達 78% 的
CVC 音節末尾子音區辨,發現音韻異常兒童
水準(鄭靜宜,2009)。鄭靜宜(2011a)調
的區辨正確率低於年齡配對的正常發展兒童,
查一般兒童華語捲舌音對比的區辨能力,發
而年齡愈小的兒童的區辨正確率低於年齡較
現一般國小低年級兒童在捲舌對比區辨上仍
大的兒童,成人正確率高於兒童。由於兒童
無法如成人的水準,顯示低年級兒童對於捲
的語音區辨分數和其詞彙量及構音分數的相
舌音特徵的掌握仍有困難,推論或因捲舌音
關達顯著,Fox 等人即指出構音能力、聲學
是最晚習得的語音類別,習得的時間可能晚
聽覺表徵和細緻性語音區辨間存在著複雜的
至六、七歲之後。可見,兒童的語音知覺發
關 係。Gósy 與 Horváth(2015) 測 量 五 至 八
展受到語音類別的影響,有些語音(如鼻音、
歲說匈牙利語的功能性構音異常兒童,以語
塞音)較早習得,有些語音的習得(如捲舌
句和非詞複誦、非詞區辨以及句子和故事的
音對比)則較晚。
理解為測試作業,結果發現比起正常發展兒
二、語音異常和聽知覺的關係
童,構音異常兒童的聽知覺處理能力顯著較
落後。Bird 與 Bishop(1992)測量 14 位說英
語音的接收和產出的過程中,語音特徵
語的音韻異常兒童和 14 位控制組兒童的語音
的掌握、音韻表徵系統的形成和語音動作的
區辨和韻律判斷等作業,結果發現音韻異常
表現這三者間具有密切的關係。兒童由聽開
兒童在語音區辨的表現較差。然而也發現組
始學習母語語音,最後終能學會說出正確的
內個別差異很大,這些音韻異常兒童中有一
語音,而此除需具備成熟的構音動作能力外,
半比例的兒童語音區辨分數已接近滿分,且
感覺回饋系統也扮演著重要角色。言語相關
發現他們之中有些在未能說出的語音音素上
的感覺回饋系統包含有聽覺、觸覺、本體覺
實具有知覺區辨的能力,但卻仍無法認出不
和動覺(kinesthetic sense)等,其中最重要的
同詞語中相同的音素,由此推論音韻異常兒
莫過於聽覺。在語言學習過程中,個體必須
童存在著複雜的語音知覺問題。Edwards 等
先學會分辨語音間細微的差異,才能在自我
人和 Nijland(2009)的想法大致也與 Bird 和
構音動作做出不同語音間具有對比差異的行
Bishop 類似,他們觀察 21 位五至八歲「語音
為,並在發音的同時能自我回饋去調校自己
輸出異常」(speech output disorders)的兒童,
的構音動作,或覺察出自我產出和理想目標
發現和正常兒童相較,語音輸出異常兒童在
音之間的差異。因此在語言學習上,在聽覺
語音區辨和韻律判斷上有顯著的困難,且推
上需具有分辨語音對比的能力。一些聽障者
論音韻異常兒童是在較高層次的語音知覺有
往往因為缺乏充足的聽覺回饋,導致在語音
異常。然其研究中所謂「語音輸出異常」組,
製造的學習上備感困難。可見,語音聽知覺
其中有半數以上被判斷為言語失用症(apraxia
的重要性不僅反映在語音表徵的建立,對於
of speech, AOS)的兒童或合併有 AOS 的異常
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•39•
情況,而真正認定為單純的音韻異常兒童卻
調 查 六 至 七 歲 SSD 兒 童 的 音 韻 處 理 技 巧
只有四名,此研究的統計考驗力有明顯不足
(phonological processing skills)和閱讀的能
的問題。
力,使用多種語音知覺、音韻覺識等作業測
此外,有一些更早期的研究也提供語音
量兒童的音韻處理技巧,結果發現音韻處理
異常者存在著聽知覺區辨問題的證據,例如:
技巧差的 SSD 兒童在非詞複誦的分數顯著低
Travis 與 Rasmus(1931)探討語音區辨和構
於音韻處理技巧較佳的 SSD 兒童。若不管
音之間的關係,他們測量兒童和成人的語音
音韻處理技巧的高低,SSD 兒童語言理解皆
區辨能力,在 548 位參與者中 165 位具有語
在正常範圍,但閱讀能力則較差。其結果肯
音異常,但他們大多數屬於輕度語音異常,
定高層次的聽知覺能力(即音韻處理技巧)
分析發現語音異常組的語音區辨分數顯著較
和非詞複誦能力之間的關係,同時也暗示著
正常者低,且構音異常愈嚴重者的語音區辨
SSD 兒童和閱讀障礙者之間存有某部分的重
錯誤愈多。Sherman 與 Geith(1967)評估 529
疊關係。然而,對於 SSD 兒童的聽知覺問題
位學前兒童的語音區辨,之後找出其中 18 位
的本質則尚未有定論。
語音區辨分數最高者和 18 位區辨分數最低者
目前有關華語 SSD 兒童聽知覺的相關研
進行構音測驗評估,結果發現兩組間構音分
究相當少,僅有一篇稍有相關的是林佳儒、
數有顯著差異,聽覺區辨分數高者顯著具有
張顯達與鍾玉梅(2013)探討語音異常兒童
較佳的構音技巧,此研究結果為語音區辨能
兩種介入法的成效,該文中有一附帶的發現
力和構音能力之間的密切關係提供充分的支
是兒童的語詞聲母正確進步百分比和語音聽
持 證 據。 然 而,Waldman、Singh 與 Hayden
辨能力有顯著正相關(r = .53),即隨著介
(1978)測量 30 位五至七歲的語音異常兒童
入語音正確率增加,SSD 孩童的語音聽辨能
的構音和語音區辨能力,卻未發現兩測量變
力亦隨之增強。然而,因為所使用的介入方
項之間的相關性。綜合以上研究的回顧可知,
案中也包含了語音聽辨的訓練,混淆了聽辨
對於探討有關語音區辨和語音異常之間的關
和構音兩者間的因果關係,且此研究設計主
係,之前的研究多數持肯定的看法,但仍有
要在介入法成效的比較,SSD 兒童之聽知覺
少數研究的看法分歧,故此議題仍有深入探
區辨情形並非是其主要議題與關注的焦點,
討的必要性。
因此對於 SSD 兒童之聽知覺區辨的討論並不
是否 SSD 兒童皆有語音知覺的問題呢?
深刻。
Bauman-Waengler(2000) 以 及 Bernthal 等
綜上所述,目前西方研究文獻上大致支
人(2013)皆指出,語音異常和聽知覺的關
持 SSD 和語音聽知覺間之相關性,然因各
係在研究上似乎尚無明確的定論。事實上,
研究所採之研究方法和參與者取樣仍未臻完
SSD 兒童的群體異質性頗高,尤其在聽知覺
善,以及語言間的差異,有關華語 SSD 兒童
能力方面具較大的個別差異。有些 SSD 兒
之構音和語音聽辨之間的關係仍待進一步探
童的主要困難出現在構音動作學習上,沒
討,且目前因有關華語 SSD 兒童聽知覺方面
有語音知覺的問題,而一些音韻發展遲緩
的研究十分匱乏,臨床研究需求殷切,本研
(expressive phonological delays) 的 SSD 兒
究的目的即在探究華語 SSD 兒童的聽知覺區
童則可能有語音知覺處理的缺陷,且此問題
辨能力。
甚至可能影響閱讀的發展。Rvachew(2007)
•40•
特殊教育研究學刊
三、語音特徵的聲學調整
音作為訓練材料,有助於語音聽知覺的區辨,
Tallal 等人(1997)訓練七位五至九歲的特異
知覺區辨困難者可能對跨語音類別界線
性語言障礙兒童,使用電腦遊戲,遊戲中的
的聲學變項(如 VOT)的細微變化不若一
語音為聲學調整刺激,在為期六週的密集訓
般人敏感,對於這些細微的聲學線索也較不
練後,兒童有十分明顯的進步,他們對語音
去注意,易忽略一些關鍵的對比線索。此時
時長和時序整合(temporal integration)的閾
若能對聲學刺激加以調整,使其注意聽辨或
限值顯著降低,且不僅在語音區辨方面,在
可有助聽辨,例如:改變刺激中某一特徵呈
語言處理和文法理解方面也有進步,他們整
現的速度或強度,將攜帶特徵音段時長的拉
體語言能力提升了一年半至兩年的程度。
長或音強的加大,或是給予聽者較充足的處
除了共振峰轉折時長的調整外,還有
理時間,或是給予較多刺激特徵的量,或可
其他一些聲學的調整也會影響語音區辨。例
助 於 聽 辨。Tallal(1980) 認 為, 閱 讀 障 礙
如:有些語音容易受到噪音的遮蔽,尤其是
兒童存在著對於頻譜快速動態語音特徵處理
子音。Miller 與 Nicely(1955)研究英語子音
的缺陷,此乃是造成其在音韻覺知和閱讀理
之間的知覺混淆,使用不同的播放音量和頻
解方面表現不理想之因。此處所謂「快速頻
率濾波,實驗後發現語音中的一些特徵,如
譜動態的語音特徵」,是指介於子音和母音
有聲、鼻音、摩擦音、塞擦音等特徵在聽覺
間的共振峰轉折(formant transition),通常
區辨上有不同的干擾混淆,其中聽者最容易
此轉折時長雖不長(約 40 毫秒),然此段
辨識出「有聲與否」的特徵,在各音量和頻
音段攜帶著豐富的子音和母音共有的特徵訊
率濾波條件下相對最不被混淆,其次則是鼻
息,對於整個音節的辨識貢獻極大(Dorman
音、摩擦音等構音方式的區辨,而最容易被
& Loizou, 1996; Dorman, Studdert-Kennedy
混淆的是對構音位置的區辨,例如:齒槽、
& Raphael, 1977; Stevens & Blumstein, 1978;
上顎或軟顎間的對比。Miller 與 Nicely 推測可
Walley & Carrell, 1983),若能加強它,將對
能由於構音位置聲學涉及信號的頻率,需要
這些兒童有幫助。
較為精細的頻譜分析和正規化轉換才能做到,
一些有閱讀障礙的兒童無法掌握變化
而構音位置的特徵又容易受到高頻濾波或噪
迅速且時長短暫的共振峰轉折帶,也無法整
音 遮 蔽(masking) 的 影 響 所 致。 一 些 研 究
合語音聲學線索。這些聽覺處理缺陷導致
(Bradlow & Kraus, 2003; Kenyon, Leidenheim,
語音知覺辨識的困難,可能影響後續文字
& Zwillenberg, 1998)發現,和正常聽者相較,
讀寫能力的發展。若能將共振峰轉折帶拉長
語言能力較差的聽者容易受到噪音遮蔽的影
或加強,則有助於語音知覺辨識,並降低
響,語音信躁比(signal-to-noise ratio)的調整
閱障嚴重度。一些研究(Borman, Benson, &
對他們的衝擊較大。Bradlow 與 Kraus(2003)
Overman, 2009; Loeb, Gillam, Hoffman, Brandel,
發現,學障兒童在噪音情境下句子的語音聽
& Marquis, 2009; Cohen & Hodson, 2005; Friel-
知覺較控制組為差,學障兒童受噪音遮蔽的
Patti, & DesBarres, 2001 ; Gierut, 1998; Tallal et
影響比正常組兒童為大,尤其是當句子語音
al., 1996; Tallal et al., 1997)發現使用聲學調整
出現在低信噪比的情況時,雖然兩組皆受到
語音(acoustically modified speech)的訓練效
果,例如:使用共振峰轉折拉長處理過的語
影響,但以學習障礙兒童受到的干擾較強。
本研究的實驗二有針對子音音段進行噪音遮
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•41•
蔽的處理,觀察噪音遮蔽對 SSD 聽者語音區
出的送氣塞音和不送氣塞音的 VOT 值,發現
辨的影響。
不送氣塞音的 VOT 範圍由 0 到 40 ms 左右,
四、語音中存在的一些重要聲學特徵
平均 17 ms;不送氣塞音的 VOT 範圍由 30 ~
140 ms 左右,平均 76 ms。兩類語音 VOT 的
語音聽知覺的歷程就是一個解碼的歷
分布曲線交會處約在 30 ms 左右,此為兩類
程,語音區辨是語音知覺的基礎,為語音辨
(送氣 vs. 不送氣)語音 VOT 截切界線的所
識(speech identification)的先決條件。依據
在。在本研究實驗二將依據這些原則在 VOT
語音種類的特性,各有不同的特徵或線索,
做調整,在合理範圍內拉長或縮短送氣音的
就時間和頻率向度來看,也各有不同的線索
VOT,藉以強化或減弱送氣音對比之間的差
權重差異,例如:就母音而言,頻率向度如
距,觀察對聽者區辨反應的變化。
第一和第二共振峰(F1、F2)是最重要的聲
噪音時長對於構音方式的區分是有效
學線索,時長變項對於母音類別的區分相對
的線索,是區分摩擦音與塞擦音兩類語音
就不是很重要。但對子音而言,音段時長對
的 線 索(Repp, Liberman, Eccardt, & Pesetsky,
於子音類別的區分就可能是重要線索,例如:
1978),且塞擦音的噪音通常較摩擦音為短。
VOT 和噪音時長可提供語音類別區分的線
鄭靜宜(2005)測量具有嘶擦性摩擦音和塞
索,如送氣對比、構音方式(摩擦音 vs. 塞擦
擦音在華語雙音節詞中的噪音時長,推論在
音)對比等。子音特徵的區辨向度主要是出
平常速度下,華語嘶擦性摩擦音與送氣擦塞
聲與否(或送氣)、構音位置和構音方式的
音之間噪音時長的界線約在 120 ~ 210 ms 之
區分,其中,區分構音位置主要和頻譜頻率
間的位置,摩擦噪音時長大於此界線較會被
能量分布有關,送氣特徵則和 VOT 有關,至
聽成為摩擦音,而小於此界線的刺激較會被
於構音方式特徵則和各特徵出現與否或順序
聽成為塞擦音。然此截切點位置並非絕對,
有關,像是塞音出現有靜默、沖直條(爆破)
它會受到語速的影響而稍偏移。在中速時,
和母音共振峰轉折的特徵,鼻音則有低喃和
估計約在 150ms 左右。有聲摩擦音的噪音時
反共振峰訊息。
長較短,大約和不送氣塞擦音的時長相似,
在聽覺處理過程中,要達到正確的語音
約在 30 ~ 70ms 之間。本研究實驗二將針對
區辨需對音段時長有相當的敏銳度,例如:
噪音時長的調整,將強化或削弱有關區分構
VOT 只要時長 20、30 毫秒的差異就會造成子
音方式的對比,觀察聽者在摩擦音/塞擦音
音類別的改變。因此,對時長不夠敏感的聽
之間區辨反應的影響。
者就可能對送氣與否判斷錯誤。VOT 是指塞
在區分不同構音部位時,摩擦噪音的頻
音氣流的釋放和後續母音產生聲帶開始振動
率特性是重要線索,通常構音部位愈前方,
之間的時間差距,是區辨「有聲或無聲」或
共振頻率愈高,例如:/s/ 的噪音頻率會比 /
「送氣或不送氣」的有效聲學參數 (Lisker &
ʃ/ 的頻率來得高。構音位置較為前方的摩擦
Abramson, 1970)。先前研究(陳達德、蔡素
音噪音會聚集在較高頻區,噪音能量集中的
娟、洪振耀,1998;賴怡秀,2013;鄭靜宜,
平均頻率值會較為高。由於在一個具有摩擦
2005;Chao & Chen, 2008)結果顯示,華語送
音的音節中,摩擦噪音信號的強度和母音相
氣塞音的 VOT 長於不送氣塞音的 VOT。鄭靜
較,通常是微弱許多,尤其是一些非撕擦音
宜(2005)測量 30 位成年人在普通語速下說
(nonsibilant),噪音信號更是微弱。因此,
•42•
特殊教育研究學刊
若能增強摩擦噪音信號的音量,可能有助於
聽覺區辨。本研究實驗二將增強摩擦噪音信
號,觀察聽者區辨是否有助益效果。
辨影響。
五、研究目的
介於子音和母音之間共振峰轉折帶
本研究的目的在探討不同的聽者(SSD
(transition)攜帶著構音位置的消息(Kent &
兒童、非 SSD 兒童以及一般成人)語音區辨
Read, 2002),是重要的構音部位線索。轉折
能力的差異,並調整一些重要的語音聲學特
帶方向同時受子音與母音構音部位的影響,
徵或參數,觀察對三組聽者語音區辨的影響。
當舌頭的位置是由後方過渡至前方,轉折方
其中,聲學調整方向包括強化和減弱兩類。
向往上;當舌頭的位置是由前至後時,轉折
本研究包含兩個實驗,實驗一在比較三組聽
向下。Lehiste 與 Peterson(1961)測量英語子
者對華語 13 種語音對比的區辨反應差異,包
音母音之間的共振峰轉折時長,發現連續言
括區辨正確率和反應時間。實驗二考驗三組
語的語句中音節轉折時長約在 30 ~ 90ms 的
聽者對兩類聲學調整刺激區辨反應的影響,
範圍。由於轉折帶時長很短,普通語速下不
探討不同的聲學調整對語音對比區辨的影響。
過 30 ~ 40ms,較不易被知覺新手(如兒童)
實驗一
所掌握。有鑑於此,有些研究者特別將此段
語音做拉長處理,以擴大其特徵性。例如:
著名的訓練閱讀障礙兒童軟體 Fast ForWord
(Scientific Learning Corporation, 2010) 使 用
聲學調整語音為刺激,延長轉折帶的長度
50%,或是做強度增強 20dB 的處理,期使聽
者容易感知。本研究實驗二亦嘗試將共振峰
轉折帶做延長處理,觀察對聽者區辨是否有
幫助。
梅爾倒頻譜(Mel-scale Frequency Cepstral
Coefficients, MFCC)濾波是利用人耳聽覺頻
率區分的特性,先將信號頻率以 Mel 量尺做
轉換,再經過倒頻譜處理。所謂倒頻譜處理,
是傅立葉變換的頻譜再經過另一次的傅立葉
變換,可以分離語音信號的聲源和濾波特性
(王小川,2007)。Mel 量尺是根據人耳臨界
帶寬的實驗結果,濾除雜訊後只留下符合人
耳聽覺特性的聲學訊息。目前 MFCC 濾波技
術已廣泛地運用在數位語音和說話者的辨識
方面,此技術可提升聲學信號的信噪比,一
般認為對語音和說話者的辨識和區分有助益
效果。本研究實驗二中將語音進行 MFCC 濾
波的處理,考驗三組聽者對 MFCC 處理的聽
一、方法
(一)參與者
參與者共 102 位,其中有 31 位是語音異
常(SSD)兒童(21 男、10 女)、31 位是典
型發展非 SSD 兒童(21 男、10 女)、40 位
是正常成人(15 男、25 女)。這 31 位 SSD
兒童年齡範圍介於五歲六個月至六歲五個月
之間,平均 5.92 歲(SD = 0.28);31 位語音
正常兒童組年齡範圍在五歲四個月至六歲四
個月之間,平均 5.97 歲(SD = 0.27)。40 位
成人的年齡範圍為 18 至 25 歲,平均 19.75 歲
(SD = 1.88),皆為較年輕的成人。這些參
與者皆以華語為平日主要使用的語言,並排
除已知有聽力障礙、智能障礙、運動神經障
礙(如腦性麻痺)以及其他明顯神經性或顏
面解剖生理損傷者。為排除聽力異常,所有
參與的聽者皆通過攜帶式聽檢儀檢查三頻率
(1000Hz、2000 Hz、4000 Hz)純音聽覺閾值
(25dB HL)的檢查。
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•43•
SSD 兒童是經由幼兒園教師發現並轉介
些對比涵蓋了華語語音系統中絕大多數的對
的說話不清楚兒童,之後經標準化的兒童國
比特徵性(謝國平,1986)。材料中每一類
語構音測驗(鄭靜宜,2003)評估後,顯現
對比中各有四個音對,一個音對中有兩個對
具有明顯語音異常者(對照常模);選取標
比音節。
準是根據兒童國語構音測驗的詞語構音分數
語音刺激由四位成人(二男、二女)於
低於同年齡 1.5 個標準差以上。此外,並挑
隔音室中錄製,使用數位錄音機和專業麥克
選和 SSD 組兒童於同一幼兒園同一班級中,
風錄製。說話者以比平常稍慢語速和平常音
年齡最相近且性別相同的無 SSD 兒童配對組
量正確說出。所有的語音刺激經過數位錄音
成兒童控制組。所有參與兒童皆以國語構音
機取樣,取樣頻率為 44kHz。這些語音皆經
測驗評估構音能力,測驗蒐集的錄音資料皆
過 TF32 程式(Milenkovic, 2005)頻譜分析,
由受過標音訓練的碩士級助理仔細聆聽,標
並切割成音段檔案儲存為 wav 檔,經分析測
註錯誤音,之後計算詞語構音正確率。SSD
量這些單音節刺激的平均時長為 618ms(SD
組 的 平 均 詞 語 構 音 正 確 率 為 63.33(SD =
= 133)。
15.42),最高為 80,最低為 22;非 SSD 兒
童組的平均詞語構音正確率為 93.09(SD =
5.54),最高為 100,最低為 85,以 t 考驗比
表一 語音聽知覺區辨作業的語音對比類別
10 類聲母對比
較兩組兒童的構音正確率,顯示兩組兒童在
構音分數有顯著差異,t(60) = 10.11,p <
.001,SSD 組的構音正確率顯著低於非 SSD
兒童組。另有一名語言治療師隨機取約一半
數量的受測兒童測驗資料做語音分析,計算
兩人所評構音測驗分數間的相關,結果顯示
Pearson 相關係數為 .95(p < .001),顯示本
研究的構音評估具有良好的評分者間信度。
1. 語音材料
語音區辨作業使用的刺激材料是 52 組華
語單音節對比(見附錄一),如「帶/在」、
「擦/紮」或「蛋/盪」等,這些刺激以最
小音素對比(minimal pair contrast)的方式建
構,亦即除了對比目標音素之外,兩個音的
音節特性皆保持一樣,如韻母、聲調與音節
結構等皆相同。刺激材料中的對比依據對比
的特徵性質有 13 類(見表一),包含 10 類
聲母對比、兩類韻母對比與一類聲調對比。
其中,聲母區辨對比主要為送氣與否、構音
位置和構音方式的對比,韻母區辨對比的項
目有兩類(圓唇與否對比、鼻韻對比)。這
1
零聲母/軟顎摩擦音/塞音
2
送氣/不送氣 塞音
3
送氣/不送氣塞擦音 & 有聲/無聲
摩擦音
4
塞音/塞擦音
5
摩擦音/塞擦音
6
鼻音/不送氣塞音/邊音
7
齒槽塞音/擦音/邊音/有聲摩擦
音
8
唇齒摩擦音/軟顎摩擦音/唇塞音
9
三構音部位(雙唇、齒槽、軟顎)
10
捲舌/非捲舌音
其他對比
11
12
13
圓唇/非圓唇高母音
齒槽鼻韻/軟顎鼻韻/無鼻韻/鼻
韻母音
聲調
•44•
特殊教育研究學刊
2. 儀器設備
專業耳機(Audio-Technica ATH-WM77)、
耳 機 擴 大 機(FubarIV Plus) 與 筆 記 型 電 腦
(Fujitsu LifeBook T900)。
(二)程序
兒童組皆先進行構音評估,再進行區辨
作業。構音評估使用兒童國語構音測驗(鄭
靜宜,2003)進行測試。由於成人組皆具有
正常的構音能力,故不進行構音評估。進行
語音區辨作業時,由電腦外接耳擴機連接耳
機播放語音刺激,音量調整適中。
AX 區辨作業含 52 組對比音的區辨,共
104 題,以 AA 或 AB 的方式隨機呈現,AA
和 AB 出現的機率相當,聽者做「同」或是
「不同」的反應。使用 DMDX 程式(Forster
& Forster, 2003)編排程序,以控制刺激呈現
和刺激間時距(inter stimulus interval, ISI)。
ISI 設定為 500ms,而受試者按鍵後下一個刺
激呈現的間距為 300ms。語音刺激對比音對
題項的順序以隨機方式呈現。
施測時,要求受試聽者判斷連續播放的
兩個語音刺激是否相同,例如:判斷「怕」、
「爸」兩音是否相同。鼓勵受試者盡快按鍵
做答,鍵盤上貼有「○」和「╳」兩個選擇鍵,
各代表著「同」和「不同」。鼓勵聽者盡快
反應,反應愈快愈好。使用 DMDX 程式記
錄受試者的反應鍵和反應時間(reaction time,
RT),RT 的計算是由第二個語音刺激播放的
起始點開始至受試者按鍵為止的時長,最長
限制設定為三秒。正式實驗開始之前有 12 題
的練習題,並提供反應對錯的回饋和增強,
以確保受試者充分了解此區分作業;正式施
測時,則不提供反應回饋。為避免疲勞作業
分兩個區段進行,區段之間有短暫休息。此
區辨作業歷時約 20 分鐘;構音測驗的進行則
歷時約 5 至 10 分鐘。
二、結果與討論
反應時間資料的計算是取受試者在 AB
呈現方式時具正確回答題項的反應時間資料。
因為有少數反應時間可能因為受試者分心等
原因而有不合理過長的情形,約占 2% 左右,
屬於極端值予以排除;極端值設定為大於該
組總反應時間之兩個標準差以外的反應時間
資料。表二呈現三組受試者的區辨反應正確
率和反應時間的平均數和標準差。成人組的
平均正確率則接近百分之百,明顯高於兩兒
童組,而非 SSD 組的平均正確率約在 85%,
高於 SSD 組的 76%。以組別為自變項的變異
數分析結果顯示,三組間區辨反應正確率差
異達顯著,F(2, 99) = 69.99, p < .001;事
後考驗(使用 Bonferroni test)結果顯示,各
組兩兩成對比較皆達顯著差異(p < .001),
其中成人組的正確率顯著高於兩組兒童組(p
< .001),非 SSD 組的正確率又顯著高於 SSD
組(p < .001)。
表二 三組聽者之區辨反應正確率和反應時間的平均數和標準差
正確率(%)
SSD 兒童組
非 SSD 兒童組
成人組
Mean
SD
Mean
SD
Mean
SD
75.93
11.52
84.8
6.76
96.92
2.37
311
1459
232
1004
169
反應時間(ms)1721
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•45•
在反應時間方面,由表二見成人的平均
代表此年齡的兒童尚未習得這些語音對比的
反應時間(RT)快於非 SSD 兒童組,而 SSD
區辨,包括區辨鼻音/不送氣塞音/邊音、
組的 RT 則長於兒童控制組。以組別為自變
構音部位(雙唇、齒槽、軟顎或硬顎)、齒
項的 ANOVA 分析結果顯示,三組間的 RT 差
槽位置的不同構音方式、捲舌對比、鼻韻對
異 達 顯 著,F(2, 99)= 81.31,p < .001; 事
比以及聲調對比等。以錯誤出現率為依變項,
後考驗(使用 Bonferroni test)結果顯示,正
組別為自變項的 t 考驗結果顯示兩組間差異達
常成人的 RT 顯著快於兩兒童組的 RT (p <
顯 著,t(12)= 6.14,p < .001。SSD 組 顯 著
.001),而非 SSD 兒童組的 RT 顯著快於 SSD
比非 SSD 組有較高的錯誤出現率。也可見,
組(p < .001)。
一般六歲兒童對這些語音對比的區辨仍未習
由反應正確率和 RT 的分析結果來看,
SSD 組的語音對比區辨能力顯著不如兒童控
得,可推論六歲兒童的語音聽知覺仍處於尚
在發展階段,仍不及成人完備。
制組,而成人的語音對比區辨力則顯著優於兩
若比較兩組兒童,比起控制組,SSD 組
兒童組。語音異常兒童語音區辨的錯誤率明顯
在所有的 13 個對比皆有較高的錯誤出現率
較高,且反應時間明顯較慢,推論 SSD 兒童
(見圖一)。兩組之間差異最大的對比是送
在語音對比區辨方面能力較弱,至於他們是
氣/不送氣塞音對比,差異量達 42%;其次
對所有語音對比全面性地較弱,或是只在一
是摩擦音/塞擦音對比,兩組錯誤人數百分
些特定的語音對比有困難,則可進一步分析。
比差異達 39%,再其次為塞音/塞擦音的兩
由於本研究使用的材料有 13 類語音對比
組間差異有 32%。以上這些對比是兩組間表
的設計,可進一步比較兩組兒童這些對比錯
現最為不同之處。有半數以上的 SSD 兒童(約
誤出現率的差異,了解語音異常兒童對哪些
60%)在「送氣與否」對比上出現困難,尤其
語音對比會比較困難。「錯誤出現率」是指
是在塞音的送氣對比。「圓唇對比」以及「構
一組之中該對比出現錯誤的人數百分比。對
音部位」對比則是兩組表現最為相近的對比,
比有錯誤者的定義是在一個對比(共八題)
錯誤百分比差距約只在 3% 左右。然而,這兩
中出現錯誤的題數達兩題以上者。因為每一
個對比的整體錯誤人數百分比情況卻大不相
個對比都有八題,若錯兩題以上,則錯誤率
同,圓唇對比的整體錯誤率較低,兩組的錯
在 25% 以上,即正確率未達 75%,以一般習
誤人數百分比約在 20% 左右,也是 13 個對比
得(acquired)的標準來看,代表兒童尚未習
中錯誤率較低的一個對比,這可能是因為對
得該語音對比。由於成人在各對比區辨的錯
母音區分通常較為簡單所致。構音部位對比
誤量極少,因此這項分析只限於兩兒童組。
的錯誤率則很高,兩組的錯誤人數百分比皆
圖一呈現兩組兒童各對比的錯誤出現率
的比較,分析結果顯示兒童控制組在七類語
在 55% 左右,可見六歲兒童對於不同構音部
位對比的區辨半數以上皆感到困難。
音對比的錯誤出現率低於 25%,例如:他們
雖然捲舌對比也是屬於構音部位性質,
大多皆可區辨送氣/不送氣、可區辨構音方
但因為它的特殊性,在本研究中把它獨立出
式之不同以及圓唇/非圓唇的差異,代表正
來為一類。無論是聽辨或是構音,捲舌音對
常的六歲兒童已習得區辨這些語音對比的能
比是所有對比中兒童最感困難的對比,由圖
力。另一方面,此組兒童在 13 類對比中仍有
一可見兩組兒童皆在捲舌音對比區辨上有最
六類對比的錯誤人數比率仍高於 25% 以上,
高的錯誤出現率。其次讓兒童感困難的是在
•46•
特殊教育研究學刊
圖一 兩組兒童在 13 類對比聽辨錯誤人數百分比之比較
齒槽位置不同構音方式(塞音/擦音/邊音
(2011b)的研究結果很相似,構音錯誤以不
/有聲摩擦音)的區辨對比,顯示六歲兒童
捲舌化歷程為最多,其次依序是塞音化、後
對於同樣是位於齒槽位置附近的幾種不同構
置音化、塞擦音化和不送氣化。非 SSD 兒童
音方式的語音有區辨上的困難,例如:區辨
組則是除了不捲舌化以外,其餘音韻歷程的
ㄙ / ㄊ、ㄉ / ㄌ、ㄌ / ㄖ等音,由於這些音的
出現為 0% 或接近 0%。
構音位置皆在齒槽附近,不同的是構音方式,
構音測驗和聽辨作業之間性質的差異可
兒童若錯失這些音的頻譜特徵性則容易造成
否將兩者做對應的分析呢?由於本研究所採
混淆。此外,聲調也是六歲兒童較感困難的
之構音評估為一般常用的詞語念名的方式,
對比,約有近 60% 的正常組兒童出現聲調區
並無音素對比的設計,因此,構音錯誤無法
辨的錯誤,且有約 70% 的 SSD 兒童有聲調
直接對應於聽知覺區辨錯誤。但若就構音音
區辨的困難。整體而言,由圖一兩組兒童在
韻歷程和其相關的對比區辨錯誤比較,仍可
13 類對比聽辨錯誤出現率(人數百分比)的
做一些相關的探討。例如:就不捲舌化歷程
趨勢線型大致呈同步高低變化的型態,可見
來看,兩組兒童在此歷程錯誤出現率均高,
兩組的差異性質較屬於是「量」上的差異,
在知覺上也有捲舌對比區辨的困難。再者,
而非「質」的不同,亦即 SSD 兒童的異常可
就塞音化而言,SSD 兒童組有 50% 以上的高
能較屬於發展遲緩的問題,而非發展的歧異
出現率,正常組則接近零。在聽知覺部分,
(deviant)狀況。
和構音塞音化歷程有關的對比有三種:塞音
若欲探討語音產生和知覺之間的關係,
/塞擦音、齒槽位置的構音方式對比(塞擦
可針對兩個兒童組的構音錯誤類型和知覺錯
/摩擦/塞音)以及唇齒/軟顎摩擦/唇塞
誤做比對。本研究分析了 SSD 兒童組的構
音(ㄈ / ㄏ / ㄅ)對比,SSD 兒童組在這三個
音錯誤音韻歷程(見圖二)其實和鄭靜宜
對比錯誤出現率其實都不低,也接近 50% 或
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•47•
圖二 兩組兒童各音韻歷程(構音錯誤類型)的錯誤出現率(%)
50% 以上。塞音/塞擦音對比在兩組之間有
直接對應的關係存在呢?多數兒童知覺區辨
較大的差異(差異量達 39%),和構音錯誤
錯誤出現率有高於構音錯誤率的情形。若仔
之間有相同的趨勢。在唇齒/軟顎摩擦/唇
細觀察圖一和圖二,可發現兩種錯誤率之間
塞音(ㄈ / ㄏ / ㄅ)對比方面也是如此,此對
似乎存在著某種比例關係,推論是因聽辨和
比就正常兒童而言,聽辨和構音的錯誤率皆
構音兩者錯誤本質不同之故。構音錯誤的特
不高,但在 SSD 兒童組聽辨錯誤出現率卻達
性通常為單向性歷程,因為兒童多數傾向把
45%,且構音錯誤出現率也是較高的。在聽辨
動作困難的語音說成簡易動作語音的趨勢,
上,兩組在齒槽位置構音方式(塞擦/摩擦
亦即錯誤的方向通常固定會是單向形式。而
/塞音)對比,錯誤出現率皆在 60% 以上,
聽知覺區辨錯誤則可能出現雙向混淆情形,
而正常組兒童在構音上則無此方面相關的錯
因此聽知覺錯誤率自然偏高。若把聽知覺錯
誤,推論在此對比上,聽辨的難度較構音動
誤出現率除以二,則可發現大致和構音歷程
作困難。就後置音化而言,在本研究中與之
出現率略近似,例如:在知覺區辨上,塞音
相關的 13 組區辨對比中,單只有「構音部位」
和塞擦音的送氣/不送氣對比錯誤出現率為
一個;在知覺上,三個構音部位對比在兩組
54%,與之相關的構音音韻歷程是不送氣化,
兒童錯誤出現率則皆在 55% 左右,然就構音
SSD 兒童組的歷程錯誤出現率為 26%,很接
而言,正常兒童組並沒有出現相關的音韻歷
近聽知覺錯誤率的一半。在 SSD 兒童組組在
程問題,但卻在語音區辨出現這樣的錯誤量。
塞擦音化歷程的出現率上也可見類似的關係,
由以上比較似乎可推論兒童在一些對比
摩擦音/塞擦音對比錯誤出現率為 55%,塞
聽辨的表現比起相關的語音構音表現為差,
擦音化的出現率為 29%。可見,在一些語音
然如此推論似乎和研究假設有悖,何以出現
對比部分,兒童的構音和知覺區辨的錯誤率
如此情況呢?構音和知覺之間的關係是否有
似存在著某種比例式的關聯性。
•48•
特殊教育研究學刊
在正確率方面,計算所有參與兒童的區
正確率和構音正確率的分布,兩組趨勢線接
辨正確率和構音分數的相關係數,Pearson
近平行狀態也可支持前段推論兩組的差異性
相關分析結果顯示構音詞語正確率和區辨正
質較屬於是「量」上的差異,而非「質」的
確率相關達 .50 (p < .001),呈中度正相
不同。
關。圖三呈現兩兒童組個別聽者的區辨正確
在 RT 方面,Pearson 相關分析結果顯示
率和構音正確率的分布,其中,SSD 兒童
構音測驗的正確率和實驗一的區辨反應時間
組大多皆分布於右上角區區域,其知覺區辨
相關達 -.64(p < .001),為中度負相關,亦
正確率皆在 70% 以上,多數集中於 80% ~
即區辨反應的時間愈長的兒童,其構音分數
90%,控制組的構音正確率皆在 85% 以上;
有愈低的趨勢。由以上這些正確率和反應時
而 SSD 兒童組的知覺區辨正確率分布則較
間的相關分析可推論兒童的語音聽覺區辨能
廣,由 37% 到 92% 皆有,個別差異極大;
力可用以解釋一部分的構音能力,亦即有一
其中有些 SSD 兒童的區辨能力和控制組兒
部分 SSD 兒童構音的錯誤可能與其語音聽
童組相近。由圖三呈現出的兩組聽者的區辨
知覺能力不足有關。
圖三
兩兒童組個別聽者的區辨反應正確率和構音正確率對應的分布圖
實驗二
實驗二的目的在比較三組聽者對於語音
再合成刺激(分為強化類/減弱類)的語音
區辨正確率和反應時間之差異,並探討兩類
聲學調整語音刺激對語音區辨反應的影響,
以及兒童語音區辨能力和他們的構音能力之
間的關係。
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
一、方法
•49•
時長時,需特別避免跨越語音類別界線,以
免改變了原有刺激所屬的語音類別,例如:
(一)參與者
同實驗一。
1. 語音材料
將實驗一使用的語音刺激經過再合成聲
學 調 整, 使 用 Praat 聲 學 軟 體 (Boersma &
Weenink, 2012)進行語音再合成的調整。所
進行的語音調整,包括摩擦噪音強度增強與
減弱、共振峰轉折帶拉長或縮短、子音音段
(VOT /噪音)拉長或縮短、白噪音遮蔽和
MFCC 濾波。這些經過再合成改變的語音可
簡單分為兩類,一類預期可強化語音分辨,
另一類為不利語音分辨。例如:MFCC 濾波
處理可強化語音特徵,增加信噪比,預期有
助於語音區辨;而噪音遮蔽則相反,是降低
信噪比值的處理,將不利於語音區辨。
由每種對比(聲調除外)各八對的原始
語音對比音中挑選四對語音對比做聲學改變,
而每一組各產生有一組聲學調整為「強化類」
和一組「減弱類」對比。由此組成一套含有
96 組對比的華語單音節聲學再合成的刺激,
其中一半為「強化類」對比,另一半為「減
弱類」對比。「強化類」對比是預期可擴大
對比聲學特徵的差距;「減弱類」的對比刺
激是預期可減少對比聲學特徵的差距。「強
化類」包括摩擦噪音強度增強(簡稱摩擦增
強)、共振峰轉折帶拉長、VOT(或噪音)
等子音代表音段拉長或縮短、MFCC 濾波、
基頻範圍增加等。「減弱類」包括 VOT(或
噪音)時長縮短、噪音遮蔽、低通濾波。
針對構音方式區辨的對比,主要是改變
音節中子音(聲母)音段的時長,例如:縮
短或拉長 VOT、噪音時長或鼻音喃喃,主要
是針對送氣/不送氣的塞音、送氣/不送氣
的塞擦音或和有聲/無聲摩擦音對比,以及
和鼻音有關的對比做處理。當改變這些音段
在縮短送氣塞音 VOT 時不會減至 40 毫秒以
下以避免變成不送氣塞音,而摩擦音的噪音
音段也不會縮得過短以免變成塞擦音。針對
構音位置區辨的對比,主要是改變音節中聲
母音段的頻譜特性,例如:摩擦噪音強度、
改變共振峰轉折帶,處理的對比包括有不同
的構音部位(雙唇、齒槽、軟顎或硬顎)、
捲舌/非捲舌音、唇齒/軟顎的摩擦音等對
比。經使用 Praat 聲學分析後,統計摩擦噪
音強度增強摩擦音音段平均增加 4.80 dB。噪
音縮短時長平均約減為原來時長的 0.7 倍。
共振峰轉折帶的拉長增長約為原來該音段的
1.5 倍,在噪音遮蔽部分,調整前平均信噪比
(S/N ratio)為 17.23,調整後為 8.66。低通
濾波和 MFCC 濾波的調整則對於整體刺激音
量的改變極小(各平均降低 0.1 dB 和 0.003
dB)。
在韻母對比方面,對於圓唇/非圓唇高
母音對比則以拉長轉折帶時長為主。對於齒
槽鼻韻/軟顎鼻韻/無鼻韻對比增強部分是
增強鼻音段的音強或是拉長轉折帶,在減弱
部分,對於圓唇/非圓唇高母音對比以低通
濾波處理,此處理主要是針對語音對比的子
音或母音段,進行 2,000Hz 低通濾波。噪音遮
蔽則以 20dB 的白噪音遮蔽語音的子音或母音
音段的處理。以上這些聲學特徵的調整理念
根據大多已在緒論中有說明,在此不再重複。
表三列出各對比各聲學改變方式的題項數目。
2. 儀器設備
同實驗一。
(二)程序
語音區辨作業的進行方式程序和實驗一
相同。含有 96 組單音節對比音對,且每一對
各有 AA 和 AB 兩種形式,共 192 個題項。強
化類刺激題項和減弱類刺激題項各占一半,
•50•
特殊教育研究學刊
順序以隨機方式呈現,使用 DMDX 程式隨機
施測時,則不提供反應回饋。由於題項較多,
呈現題項,並記錄聽者的反應鍵和反應時間。
兒童組分為四個區段進行,成人組則分為三
正式開始之前有 12 個練習題項,且會提供反
個區段進行,區段之間有二至三分鐘的短暫
應回饋,以確保受試者了解作業方式;正式
休息。整個作業約需 20 至 30 分鐘。
表三
各語音對比經過各種聲學改變方式的題項數目
強化類
對比項目
減弱類
摩擦
增強
MFCC
小計
轉折帶
音段
噪音
低通 音段
拉長
拉長
遮蔽
濾波 縮短
零聲母/ 軟顎摩擦音/ 塞音
2
0
0
2
4
0
0
8
送/ 不送氣塞音
2
0
0
2
4
0
0
8
0
0
0
4
0
0
4
8
塞音/ 塞擦音
2
0
0
2
4
0
0
8
鼻音/ 不送氣塞音/ 邊音
4
0
0
0
0
4
0
8
摩擦/ 塞擦音
0
2
0
2
4
0
0
8
構音部位
0
2
2
0
2
2
0
8
齒槽塞音/ 擦音/ 邊音
2
2
0
0
2
2
0
8
唇齒/ 軟顎摩擦音/ 唇塞音
4
0
0
0
4
0
0
8
捲/ 非捲舌音
2
2
0
0
4
0
0
8
圓唇/ 非圓唇高母音
0
0
4
0
0
4
0
8
齒槽/ 軟顎鼻韻/ 無鼻韻
2
0
2
0
0
4
0
8
小計
20
8
8
12
28
16
4
96
送/ 不送氣塞擦音&有/ 無
聲摩擦音
二、結果與討論
變項,組別為受試者間變項,刺激類別為受
試者內變項的 ANOVA 分析結果顯示組別效
表四呈現三組受試者的區辨平均正確率
果 達 顯 著,F(2, 99)= 148.98,p < .001,
和標準差,顯示無論對於強化類或漸弱類刺
Partial η2 = .75,刺激類別效果亦達顯著,F(1,
激,成人組的正確率均高於兩兒童組,而非
SSD 兒童組的正確率亦高於 SSD 兒童組,
且在三組中對於強化類刺激的平均區辨正確
率均高於減弱類的刺激。以區辨正確率為依
99)= 256.79,p < .001,Partial η2 = .72,兩
變項的交互作用不顯著,F(2, 99)= 1.33,
p = 2.7。事後考驗(使用 Bonferroni test)結
果顯示各組別兩兩成對比較皆達顯著差異(p
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
表四
•51•
三組聽者對兩類語音刺激之反應正確率的平均數和標準差
強化類
減弱類
組別
Mean
SD
Mean
SD
成人組
98.13
2.20
79.11
8.88
非 SSD 兒童組
77.22
12.12
54.03
10.19
SSD 兒童組
64.99
17.20
43.36
10.16
< .001),亦即成人組的正確率顯著高於兩
激類效果亦達顯著,F(1, 99)= 26.86,p <
組兒童組(p < .001),非 SSD 兒童組的正
.001,Partial η2 = .21,兩變項的交互作用則不
確率又顯著高於 SSD 兒童組(p < .001)。
顯著,F(2, 99)= 0.81,p = .45。對強化類
這些受試者對於強化類刺激的平均區辨正確
刺激的 RT 顯著較快於對減弱類刺激。三組
率均顯著高於減弱類刺激,三組的區辨表現
比較的事後考驗(使用 Bonferroni test)結果
皆有類似的趨勢。
顯示正常成人組的 RT 顯著小於兩個兒童組
在 RT 方面,RT 資料以受試者的 AB 部
分具正確反應題目的反應時間資料計算,並
(p < .001),但兩兒童組之間 RT 未達顯著
差異(p >. 05)。
剔除極端值;極端值是指大於該組總反應時
由於實驗一和實驗二所採用之刺激是源
間兩個標準差以外的反應時間資料。表五呈
自同一套語音材料,實驗二的語音是再經聲
現三組受試者的平均區辨 RT 和標準差。正常
學調整「強化」或「減弱」的再合成處理,若
成人組的平均反應時間較快於兩個兒童組的
將實驗二的「強化」或「減弱」RT 和正確率
時間,SSD 兒童組反應最慢。三組對強化類
資料拆開和實驗一做比較,可得知實驗二中的
刺激的 RT 均較減弱類刺激的 RT 為快。
兩類刺激是否真有預期的強化或削弱的反應。
以區辨反應的 RT 為依變項,組別為受
在成人組正確率方面,成人組對實驗二的「強
試者間變項,刺激類別為受試者內變項的變
化類」刺激有得到達顯著的增益效果,paired t
異數分析結果顯示組別效果達顯著,F(2,
(39)= 3.01, p = .005 < .01。然而,因為成人
99)= 80.23, p < .001,Partial η = .62, 刺
組在實驗一正確率已經接近百分之百,實驗
2
表五
三組聽者對兩類語音刺激之反應時間的平均數和標準差
組別
強化類
減弱類
Mean
SD
Mean
SD
成人組
938.06
127.34
1000.89
118.72
非 SSD 兒童組
1501.00
236.28
1594.61
282.64
SSD 兒童組
1566.55
277.96
1718.51
373.57
•52•
特殊教育研究學刊
二對於「強化類」刺激正確率的提升效果受
異。由圖五顯示在反應時間方面,SSD 兒童
「天花板效應」(ceiling effect)牽制。此外,
組對強化類刺激和實驗一中之原始刺激相較,
「強化類」刺激的提升效果也可見於 RT 部
實驗二的強化類刺激有顯著降低 RT 的增益
分,兩者差異達顯著,paired t(39)=-4.34,p
效果,paired t(39)= -3.75,p=.001,但對非
= .001。「減弱類」刺激在正確率方面,成人
SSD 兒童組則效果未達顯著,paired t(39)=
組對實驗二的「減弱」刺激具有顯著降低的效
1.26,p=.22。
果,paired t(39)= -12.51, p < .001,但在 RT
對於減弱類刺激的分析,在正確率部分,
則沒有顯著,paired t(39)= 0.39,p = .70。進
在兩個兒童組皆發現有顯著降低正確率的不
一步分析減弱類刺激在各對比正確率的比較,
利影響(SSD 組:paired t(39)= -10.99,p <
由表六可知在噪音遮蔽聲學調整部分,破壞性
.001;兒童控制組:paired t(39)= -21.59,p
影響較大的是捲舌音對比、摩擦/塞擦對比和
< .001),且降低的幅度較成人組為更多,且
構音部位對比,對其餘對比的影響則較小,而
兩兒童組反應正確率下降的幅度相近,皆約
低通濾波改變則對圓唇對比以及構音部位對比
在 30% 左右。在反應時間方面,SSD 兒童組
的破壞性影響較大。
對減弱類刺激和實驗一的 RT 相較並無顯著差
在兒童組方面,由圖四的各組正確率呈
異,paired t(396)= 1.90,p = .07;但對於非
現可知兩個兒童組對實驗二「強化類」刺激
SSD 兒童組實驗二的減弱類刺激和實驗一的
在區辨正確率方面並未得到增益效果,正確
原始刺激相較,有顯著增加 RT 的不利影響,
率反有些微下降,此情況和成人組的表現迥
paired t(39)= 3.22, p < .001。
表六
成人組強化類和減弱類調整對各語音對比的區辨正確率(%)
強化類
語音對比
零聲母/軟顎摩擦音/塞音
送/不送氣塞音
摩擦增強
MFCC
轉折帶拉長
98.75
98.75
100
100
送/不送氣塞擦音&有/無聲摩擦音
99.38
塞音/塞擦音
100
鼻音/不送氣塞音//邊音
100
100
摩擦/塞擦音
96.25
構音部位
98.75
齒槽塞音/擦音/邊音
93.75
唇齒/軟顎摩擦音/唇塞音
99.38
捲舌/非捲舌音
91.25
小計
減弱類
98.75
97.5
95
91.25
圓唇/非圓唇高母音
齒槽/軟顎鼻韻/無鼻韻
音段拉長
98.75
100
98.06
100
95.31
98.75
99.38
捲舌/非捲舌音
圓唇/非圓唇高母音
齒槽/軟顎鼻韻/無鼻韻
小計
表六
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•53•
成人組強化類和減弱類調整對各語音對比的區辨正確率(%)(續)
減弱類
語音對比
噪音遮蔽
零聲母/軟顎摩擦音/塞音
95.63
送//不送氣塞音
93.75
低通濾波
送/不送氣塞擦音&有/無聲摩擦音
塞音/塞擦音
音段縮短
85.63
90.00
鼻音/不送氣塞音/邊音
98.75
摩擦/塞擦音
61.25
構音部位
67.50
62.50
齒槽塞音/擦音/邊音
82.50
93.75
唇齒/軟顎摩擦音/唇塞音
84.38
捲舌/非捲舌音
58.75
圓唇/非圓唇高母音
30.63
齒槽/軟顎鼻韻/無鼻韻
97.50
小計
79.82
圖四
76.25
實驗一和實驗二的三組聽者區辨正確率比較
85.63
•54•
特殊教育研究學刊
圖五
實驗一和實驗二的三組聽者區辨反應時間比較
圖六比較兩組兒童在 12 個語音對比兩種
比例少,稀釋了所獲得的增益效果所致。此
聲學調整方式的錯誤率的差異,此圖趨勢大
外,MFCC 的增益效果對兩個兒童組皆不如
致上與實驗一中的圖一相近。雖然兩圖數據
預期,甚至反而有降低正確率的不利效果。
計算的基準有不同(實驗一為錯誤人數百分
另外,在增加摩擦音段音強對兒童的區辨增
比,此為平均錯誤率),但具相似的趨勢。
益效果也不明顯。
由圖六可見非 SSD 兒童組在前五個對比上,
在減弱類刺激方面,進一步分析的結果
由於他們的聽辨正確率已接近 90%,天花板
顯示,圓唇/非圓唇對比受低通濾波的影響
效應導致調整的增益並不大,在 SSD 兒童組
最大,其次是噪音遮蔽對摩擦/塞擦音對比
則反而有降低正確率的情形。兩組兒童對於
區辨的不利影響,兩兒童組反應正確率皆受
聲學調整的反應並不相同,進一步分析結果
到明顯的影響。噪音遮蔽在塞音/塞擦音對
顯示,SSD 兒童組在零聲母/軟顎摩擦音/
比的影響對 SSD 兒童組尤為明顯,且噪音段
塞音對比、摩擦音/塞擦音對比、齒槽/軟
縮短也是對 SSD 兒童組的影響較大,顯示噪
顎鼻韻對比相對地獲較多增益;而非 SSD 兒
音遮蔽對兒童的區辨有不利影響,尤其是對
童組則在聲調、零聲母/軟顎摩擦音/塞音
SSD 兒童。此外,音段縮短(如 VOT 縮短)
對比、齒槽/軟顎鼻韻對比相對地獲較多增
對於兩組的影響皆不大。
益。對應於表三中所列七種聲學強化或減弱
兩組兒童對兩類聲學調整語音區辨的正
處理的調整,可見到這些增益主要來自相關
確率和構音之間的相關為何?構音測驗的正
音段(如 VOT)或轉折帶的拉長。然而,在
確率和實驗二的強化類調整刺激正確率的相
圓唇/非圓唇對比轉折帶的拉長效果卻不如
關達 .43(p < .001)屬中度正相關;而構音測
預期,推論原因可能是其所使用的刺激詞中
驗的正確率和實驗二的減弱類刺激區辨正確
八對中只有兩對是屬於音段較短的介音形式,
率的相關則較弱,為 .33(p < .001),屬低中
其餘皆是音段較長的母音形式,介音形式的
度正相關。在反應時間,構音測驗的正確率
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•55•
圖六 SSD 組和非 SSD 兒童組各語音對比兩類聲學調整刺激的平均錯誤率(%)
和實驗二的強化類反應時間相關達 -.53(p <
影響。聲學調整刺激對於兒童組的效果則較
.01),為中度負相關。構音測驗的正確率和
不一致,對 SSD 兒童組「強化類」刺激在反
實驗二的減弱類刺激區辨反應時間相關較弱,
應時間有縮短的促進效果,但在正確率效果
為 -.44(p < .001),屬中度負相關。和正確
不顯著;減弱類調整刺激則是一致性地顯著
率相關的資料比較,可發現反應時間和構音
降低聽者的區辨正確率的效果,並對非 SSD
能力之間的相關強度皆屬中度相關,相關強
兒童組有顯著拖長 RT 的不利影響。
度則較正確率的相關稍略強,在實驗一中也
呈現此相似的趨勢,構音能力和實驗一的區
綜合討論
辨反應時間之間相關較高(-.64),可見反應
時間的測量似乎比正確率更敏感。綜合以上
本研究探討華語 SSD 兒童的語音區辨能
結果可知,兒童構音能力和知覺區辨能力約
力,藉由和年齡、性別配對的兒童正常控制
呈中度相關。
組和正常成人組相較,顯見 SSD 兒童在語音
經由實驗一和實驗二的比較,在成人組
區辨方面能力的不足,且比較正常兒童和成
方面,實驗二的兩類聲學調整刺激在成人組
人之間的聽辨反應也發現學前兒童和成人間
大致得到預期的效果,即是「強化類」刺激
語音區辨能力的差異。實驗一和實驗二的結
具有顯著提升反應正確率和降低反應時間的
果皆顯示,不管是對於原始未調整的語音刺
效果;「減弱類」刺激類刺激則具有顯著降
激或是經聲學調整的再合成刺激,SSD 兒童
低區辨正確率的效果,但在 RT 方面則無顯著
的區辨表現(包括正確率和反應時間)皆較
•56•
特殊教育研究學刊
控制組為差,且成人的區辨表現也顯著較學
童區辨反應正確率較低的原因。且構音錯誤
前兒童為佳。由此可推論多數學前 SSD 兒童
和知覺區辨錯誤本質上的差異,聽知覺區辨
在語音區辨方面不如同年齡的一般兒童,而
的錯誤比率不必然和構音錯誤率相近,此部
六歲兒童的語音區辨能力仍不及成人,學前
分已在實驗一的結果部分有深入的討論。
兒童的語音聽知覺無論在區辨的精確性和語
由實驗一的結果(如圖三所呈現)可知,
音處理的效率皆不若成人完備,語音區辨能
並非所有 SSD 兒童皆具有語音區辨的困難,
力尚未發展成熟。
在本研究中,SSD 兒童組內的語音區辨表現
由於本研究受試者年齡為六歲左右,可
有個別差異存在,其中約有半數的 SSD 兒童
顯示出此年齡階段的典型發展兒童語音區辨
的區辨正確率和正常組相近。這樣的結果也
能力的樣貌,即對於華語各重要語音對比區
符合一般學者(如 Bernthal et al., 2013)對於
辨的大致情形,並呈現學前兒童語音聽知覺
SSD 的看法,亦即 SSD 包含了構音異常和音
不及成人的差異部分。這些發現和之前的研
韻異常。構音異常兒童在聽知覺區辨正常,
究推論(張顯達、許碧勳,2000;曹峰銘等人,
但卻無法正確地說出語音,他們是因構音動
2009;劉惠美等人,2013;鄭靜宜,2011a;
作的缺陷導致 SSD,亦即他們的 SSD 問題
McAllister, 2015)大致相符。本研究成人組在
的根源是動作而非語音聽知覺。而另有一群
13 種對比區辨中,除了捲舌音對比略低外,
SSD 兒童則具有較差的語音聽辨力,其 SSD
其餘皆接近 100%。本研究中做為正常控制組
問題的根源有可能是因為聽知覺或其後續較
的六歲兒童對於華語 13 類語音對比的區辨,
高層次音韻處理問題所致。由於語音對比的
卻尚有近半數對比錯誤出現率在 25% 以上,
區分需要在頻率或時間向度上做細微處理,
可見學前六歲兒童在語音區辨方面仍有許多
若無法做到,則在更高一層次的音韻處理上
進步的空間,對於屬於較細微差異的語音對
可能會有分化不足的問題,影響到整個音韻
比,例如:捲舌音對比、齒槽位置的構音方
系統的架構,同時也可能造成語音產生的錯
式對比、構音部位以及聲調對比等,此階段
誤。然而這些具有較弱區辨能力的兒童在日
兒童仍未能充分掌握,仍尚待精進。
常生活中是否會有嚴重的語言聽覺理解困難
實驗一的結果顯示正常兒童在 13 種語音
呢?在一般自然情境下,由於語音理解常因
對比中有近半數對比尚未達習得的程度,此
語句中存在著豐富可預測的脈絡線索或情境
語音聽覺區辨能力程度若和兒童的構音能力
線索,即使兒童語音區辨能力不佳,但對於
相較,語音區辨能力的發展似乎有落後於構
一般的聽語理解的影響仍可能有限。因此,
音能力的趨勢。由於本研究採用的是最小音
輕微聽辨異常的兒童在一般的聽語理解狀況
素對比的語音刺激項,語音區辨需要較為精
仍可能有接近正常或是正常的語言理解表現。
細的區分辨識才能答對。對於聽知覺能力尚
本研究的實驗二使用聲學調整語音嘗試
未精進的學前兒童而言,捕捉稍縱即逝語音
提升或降低聽者對語音特徵的敏感度,一方
刺激間的差異,他們會稍感困難,但對成人
面尋找不利兒童語音區辨的因素(如噪音遮
則顯得十分簡單容易。此外,和成人相較,
蔽),另一方面則嘗試尋找有效提升語音知
兒童的專注力和耐力較差,而語音區辨作業
覺能力的訓練方法,未來可再建立一套語音區
需要高度的專心,也可能是造成本研究中兒
辨訓練模式改善兒童的語音聽知覺,就如同
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•57•
Tallal 等人(1996, 1997)和 Rvachew(1994) 的
人和兒童的區辨表現型態大致相類似,差異
研究對學習障礙和 SSD 兒童的介入訓練。本
只在敏感度。Bradlow 等人(1999)的研究試
研究在實驗一和實驗二結果皆得到顯著的組
圖調整語音的共振峰轉折帶(加長)來增進
別效果,但若將實驗一和實驗二的區辨結果
學障兒童的/ da-ga /塞音位置的區辨,結果
做比較,整體上實驗二聲學改變未達預期的
發現在正確率上並沒有得到提升效果,但卻
效果。在兒童組部分,強化性聲學調整效果
於 MMN(mismatch negativity)電生理反應中
只見於提升 SSD 兒童組的反應時間,在正確
觀察到增益效果。本研究的強化性刺激只在
率方面並未得到預期的效果。在成人組部分,
反應時間上顯現了增益效果,而沒有在正確
雖有天花板效應,但可見到聲學操弄的效果,
率方面有所助益,這有可能是刺激改變的量
不管是正確率或是反應時間均可見顯著效果。
不足,導致改變幅度不明顯。因此,若在實
減弱類刺激在兩個兒童組皆發現顯著降低正
驗二強化類刺激聲學調整的幅度上再予以增
確率的不利影響,可見這些不利語音區辨的
加,或是測量一些相關電生理反應,或許可
因素(如噪音遮蔽、低通濾波或音段縮短)
得到較說服人的正向效果。而這些則有待日
在一般教學或語言治療環境中應盡量避免,
後研究進一步探討。
例如:應避免在吵雜環境中進行教學,教師
就本研究結果的解釋或推論限制部分,
說話的聲音應保持清晰,避免透過口罩來傳
值得一提的是由於本研究的刺激皆屬於語音
達語音,或是說話的語速不可過快等。
刺激或是再合成的語音刺激,並沒有使用非
何以聲學調整刺激對於聽辨的影響在成
語音的聽覺刺激來測試,因此無法推論 SSD
人和兒童間有如此大的差異?究其眾多可能
兒童的語音聽辨障礙是否可能源自於更基礎
原因,其中之一可能是學前兒童的專心注意
的聽知覺層次,例如:在緒論中提到的對聲
度不足所致。由於實驗二的刺激項較多,作
音時長或頻率的區辨,未來或可設計有關
業時間較長,兒童容易浮躁,常沒有仔細聆
SSD 兒童在基礎聽知覺層次方面的測試,可
聽語音刺激,便貿然做答。而且在實驗二中
更深入探討他們聽知覺困難的根源。
採用增強類和減弱類刺激混合隨機出現的方
本研究藉由對三組聽者(SSD 兒童、非
式,有些減弱類刺激較怪異(如噪音遮蔽或
SSD 兒童和成人)的語音區辨測試探討 SSD
低通濾波)容易讓兒童短時間無法接受,而
兒童對華語單音節語音對比的區辨能力,結
失去耐心作答。但此推論是否正確,則因沒
果在區辨正確率和反應時間上皆呈現三組受
有真正測量兒童的注意力轉移的情況而無法
試者聽辨反應的顯著性差異:SSD 兒童表現
證實。另一個可能則是一些聲學調整方式(如
顯著不如一般兒童,而一般兒童則顯著不如
MFCC)是真的沒有增益效果,或是聲學調整
成人。此結果讓我們對於語音異常兒童和一
的量並不足以造成知覺上的改變?在知覺上,
般六歲學前兒童的語音區辨能力有更進一步
成人是「熟練」的聽者,成人所依賴的聲學
的認識,並增進對兒童和成人之間知覺區辨
線索或是對於聲學線索的敏感度可能和兒童
能力差異的認識。藉由比較兒童在各個語音
有所不同,而此差異是「量」或是「質」上
對比區辨缺陷的分布情形,可讓我們深入了
的差異呢?此問題可由 McAllister(2015)的
解 SSD 兒童語音區辨的弱點。教師或是語言
非詞區辨研究結果得到一些啟示,他認為成
治療師若想提升SSD兒童的聽知覺區辨能力,
•58•
特殊教育研究學刊
即可針對他們那些普遍表現不佳的語音對比
Hin-Tat, & Hsu, Bi-Hsun (2000). Chinese
(例如:送氣音對比或摩擦/塞擦音對比)
children’s production and perception of
加以訓練其區辨或辨識,並評估 SSD 兒童語
consonants: A developmental study. Speech-
音聽知覺對於其構音行為的影響性,如此或
Language-Hearing Association of the
可出現改善其構音正確率的契機,進而改變
Republic of China, (15), 1-10.] doi: 10.6143/
其構音和溝通互動行為。至於促進兒童的語
JSLHAT.2000.11.01
音知覺是否可改善其構音動作,例如:改善
陳達德、蔡素娟、洪振耀(1998):國語聲
兒童的聽知覺機制是否有助於其構音行為的
母音長之聲學基礎研究與臨床意義。
改變,這些議題則有待後續研究加以探討。
聽 語 會 刊,13,138-149。[Chen, DaDer., Tsay, Su- Chuan & Hong, G. (1998).
參考文獻
Duration of initials in mandarin: Fundamental
王小川(2007):語音信號處理。 臺北:全華。
Speech-Language-Hearing Association of the
[Wang, Shiau-Tshruan (2007). Speech signal
processing. Taipei, Taiwan: Chuan Hwa.]
acoustic research and its clinical significance.
Republic of China, 13, 138-149].
曹峰銘、李菁芸、謝怡欣、邱建業(2009):
林寶貴(1984):我國四至十五歲兒童語言
學齡前兒童塞音及聲調知覺與詞彙發
障礙出現率調查研究。國立台灣教育
展 的 關 係。 台 灣 聽 力 語 言 學 會 雜 誌,
學 院 學 報,9,119-158。[Lin, Bau-Guei
(24),39-57。[Tsao, Feng-Ming, Lee,
(1984). An investigation for 4-15 years old
Ching-Yun, Hsieh, Yi-Hsin, & Chiu, Chien-
children with speech and language disorders
Yeh (2009). Assessing stop and lexical
in Taiwan. National Taiwan Education
Tone perception in preschool children and
College Journal, 9, 119-158.]
relationship with word development. Journal
林佳儒、張顯達、鍾玉梅(2013):語音異
of the Speech-Language-Hearing Association
常兒童的語音聽辨與聲韻覺識能力與不
of Taiwan , (24) , 39-57.] doi: 10.6143/
同治療方式的關係。台灣聽力語言學會
JSLHAT.2009.12.03
雜 誌,(30),1-19。[Lin, Jia-Ru, Cheung,
劉惠美、曹峰銘、張鑑如、徐儷玲(2013):
Hin-Tat, & Chung, Yuh-Mei (2013). The
學前到學齡兒童的語音區辨能力發展
correlation between phonetic discrimination,
及其與詞彙理解的關係。教育心理學
phonological awareness and different
報,45(2),221-240。[Liu, Huei-
treatment approach for children with speech
Mei, Tsao, Feng-Ming, Chang, Chien-Ju
sound disorders. Speech-Language-Hearing
& Hsu, Li-Ling (2013).The development
Association of the Republic of China, (30),
of speech discrimination in preschool and
1-19.] doi: 10.6143/JSLHAT.2013.06.01
school-aged children: Association with word
張顯達、許碧勳(2000):國語輔音聽辨與
comprehension. Bulletin of Educational
發音能力之發展研究。中華民國聽力
Psychology, 45(2), 221-240.] doi: 10.6251/
語 言 學 會 雜 誌,(15),1-10。 [Cheung,
BEP.20130527
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
•59•
賴 怡 秀(2013):VOT for mandarin stops and
mandarin retroflex features for children
affricates produced by L1 and L2 speakers
with learning disabilities. Bulletin of Special
of mandarin Chinese。 高 雄 師 大 學 報:
Education, 36(2), 27-50.] doi: 10.6172/
人 文 與 藝 術 類,35,57-78。[Lai, Yi-
BSE201107.3602002
Show (2013). VOT for mandarin stops and
鄭 靜 宜(2011b): 學 前 兒 童 華 語 聲 母 之
affricates produced by L1 and L2 speakers
音 韻 歷 程 分 析。 特 殊 教 育 學 報,34,
of mandarin Chinese. Kaohsiung Normal
135-169。[Jeng, Jing Yi (2011b). The
University Journal-Education and Social
phonological processes of syllable-Initial
Sciences, 35, 57-78.]
consonants Spoken by the preschool children
謝國平(1986): 語言學概論。臺北:三民。
[Shie, Guo- Ping (1986). An introduction to
linguistics. Taipei, Taiwan: San Min Book.]
of mandarin Chinese. Journal of Special
Education, 34, 135-169.].
American Psychiatric Association. (2013).
鄭 靜 宜(2003): 兒 童 國 語 構 音 測 驗。 臺
Diagnostic and statistical manual of mental
南:國立臺南大學特殊教育系。[Jeng,
disorders (5th ed.). Arlington, VA: American
Jing Yi (2003). An articulatory Test for
Psychiatric Publishing.
mandarin speaking children. Tainan, Taiwan:
American Speech-Language-Hearing Association
Department of Special Education, National
(2016). Speech sound disorders: Articulation
Tainan University.]
and phonological processes. Retrieved from
鄭靜宜(2005):不同言語速度、發語單位
和發語位置對國語音段時長的影響。南
http://www.asha.org/public/speech/disorders/
speechsounddisorders.htm
大學報,39,161-185。[Jeng, Jing Yi (2005).
Bauman-Waengler, J. (2000). Articulation and
The influence of speaking rate, utterance
phonological impairments. Boston, MA:
unit and position on segmental duration of
Allyn and Bacon.
mandarin. Journal of National University
Tainan- Education, 39, 161-185.]
鄭靜宜(2009):華語捲舌音對比的聽覺辨
Bernthal, J. E., Bankson, N. W., & Flipsen, P.
Jr. (2013). Articulation and phonological
disorders: Speech sound disorders in children
識與頻譜動差分析。中華心理學刊,51
(7th ed.). Boston, MA: Allyn and Bacon.
(2),157-173。[Jeng, Jing Yi (2009). The
Bird, J., & Bishop, D. (1992). Perception and
auditory discrimination of mandarin retroflex
awareness of phonemes in phonologically
contrasts and spectral moment analysis.
impaired children. International
Chinese Journal of Psychology, 51(2), 157-
Journal of Language & Communication
174.] doi: 10.6129/CJP.2009.5102.02
D i s o rd e r s , 2 7 ( 4 ) , 2 8 9 - 3 11 . d o i :
鄭靜宜(2011a) :學習障礙兒童對華語捲
10.3109/13682829209012042
舌音特徵的聽知覺辨識。特殊教育研
Boersma, P., & Weenink, D. (2012). PRAAT, a
究 學 刊, 36(2),27-50。[Jeng, Jing
system for doing phonetics by computer.
Yi (2011a). The auditory identification of
Cambridge, England: Cambridge University
•60•
特殊教育研究學刊
Press..
spectral change and formant transitions
Borman, G. D., Benson, J. G., & Overman, L.
as cues to labial and alveolar place of
(2009). A randomized field trial of the
articulation. The Journal of the Acoustical
fast for word language computer-based
Society of America, 100(6), 3825-3830. doi:
training program. Educational Evaluation
10.1121/1.417238
and Policy Analysis, 31(1), 82-106. doi:
10.3102/0162373708328519
Dorman, M. F., Studdert-Kennedy, M., & Raphael,
L. J. (1977). Stop-consonant recognition:
Bradlow, A. R., Kraus, N., Nicol, T. G., McGee,
Release bursts and formant transitions as
T. J., Cunningham, J., Zecker, S. G., &
functionally equivalent, context-dependent
Carrell, T. D. (1999). Effects of lengthened
cues. Perception & Psychophysics, 22(2),
formant transition duration on discrimination
109-122. doi: 10.3758/BF03198744
and neural representation of synthetic CV
Edwards, J., Fox, R. A., & Rogers, C. L. (2002).
syllables by normal and learning-disabled
Final consonant discrimination in children:
children. Journal of the Acoustical Society
effects of phonological disorder, vocabulary
of America, 106(4), 2086-2096. doi:
size, and articulatory accuracy. Journal of
10.1121/1.427953
Speech, Language, and Hearing Research:
Bradlow, A. R., & Kraus, N. (2003). Speaking
clearly for children with learning disabilities:
JSLHR, 45(2), 231-242. doi: 10.1044/10924388(2002/018)
Sentence perception in noise. Journal of
Eimas, R. E., Gavin W., & Wilson W. R. (1979).
Speech, Language & Hearing Research,
Linguistic experience and phonemic
46(1), 80. doi: 10.1044/1092-4388(2003/007)
perception in infancy: A cross-linguistic
Chao, K.-Y., & Chen, L.-M. (2008). A cross-
study. Child Development, 50(1), 14-18. doi:
linguistic study of voice onset time in stop
10.2307/1129035
consonant productions. International Journal
Forster, K. L., & Forster, J. C. (2003). DMDX: a
of Computational Linguistics & Chinese
windows display program with millisecond
Language, 13(2), 215-231.
accuracy. Behavior Research Methods
Cohen, W., & Hodson, A. (2005). Effects of
computer-based intervention through
Instrument & Computers, 35(1), 116-124.
doi: 10.3758/BF03195503
acoustically modified speech (fast for
Friel-Patti, S., & DesBarres, K. (2001). Case
word) in severe mixed receptive-Expressive
studies of children using fast for word.
language impairment: Outcomes from a
American Journal of Speech-Language
randomized controlled trial. Journal of
Pathology, 10(3), 203. doi: 10.1044/1058-
Speech, Language & Hearing Research,
0360(2001/019)
48(3), 715-729. doi: 10.1044/10924388(2005/049)
Dorman, M. F., & Loizou, P. C. (1996). Relative
Gierut, J. (1998). Treatment efficacy: Functional
phonological disorders in children. Journal
of Speech, Language, and Hearing Research,
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
41(1), S85-100. doi: 10.1044/jslhr.4101.s85
•61•
Lisker, L., & Abramson, A. S. (1970). The voicing
Gósy, M., & Horváth, V. (2015). Speech
dimension: Some experiments in comparative
processing in children with functional
phonetics. In Proceedings of the sixth
articulation disorders. Clinical Linguistics
International Congress of Phonetic Sciences
& Phonetics, 29(3), 185-200. doi:
Prague (pp. 563-567). Prague: Academia.
10.3109/02699206.2014.983615
Loeb, D. F., R. B. Gillam, Hoffman, L., Brandel,
Holt, R. F., & Lalonde, K. (2012). Assessing
J., & Marquis, J. (2009). The effects of
toddlers’ speech-sound discrimination.
Fast ForWord language on the phonemic
International Journal of Pediatric
awareness and reading skills of school-age
Otorhinolaryngology, 76(5), 680-692. doi:
children with language impairments and poor
10.1016/j.ijporl.2012.02.020
reading skills. American Journal of Speech-
Kent, R. D., & Read, C. (2002). The acoustic
analysis of speech. San Diego, CA: Singular.
Language Pathology, 18(4), 376-387. doi:
10.1044/1058-0360(2009/08-0067)
Kenyon, E. L., Leidenheim, S. E., & Zwillenberg,
McAllister Byun, T. (2015). Perceptual
S. (1998). Speech discrimination in the
discrimination across contexts and contrasts
sensorineural hearing loss patients: How is
in preschool-aged children. Lingua, 160, 38-
it affected by background noise? Military
53. doi: 10.1016/j.lingua.2015.02.007
Medicine, 163, 647-650.
Kronvall, E., & Diehl, C. (1954). The relationship
of auditory discrimination to articulatory
Milenkovic, P. (2005). TF32: Time frequency
analysis for32bit windows [Computer
software]. Madison, WI: Author.
defects of children with no known organic
Miller, G. A., & Nicely, P. (1955). The analysis of
impairment. Journal of Speech and Hearing
perceptual confusions among some English
Disorders, 19(3), 335-338. doi: 10.1044/
consonants. Journal of the Acoustical Society
jshd.1903.335
of America, 27, 338-352.
Kuhl, P. K. (1991). Human adults and human
National Institute on Deafness and Other
infants show a “perceptual magnet effect” for
Communication Disorders (1994). National
the prototypes of speech categories, monkeys
strategic research plan. Bethesda, MD:
do not. Perception & Psychophysics, 50(2),
Department of Health and Human Services.
93-107. doi: 10.3758/BF03212211
Nijland, L. (2009). Speech perception in children
Kuhl, P. K. (1992). Infants' perception and
with speech output disorders. Clinical
representation of speech: Development of a
Linguistics & Phonetics, 23(3), 222-239. doi:
new theory. In ICSLP, 449-456.
10.1080/02699200802399947
Lehiste, I., & Peterson, G. E. (1961). Transitions,
Repp, B. H., Liberman, A. M., Eccardt, T., &
glides, and diphthongs. Journal of Acoustical
Pesetsky, D. (1978). Perceptual integration of
Society of America, 33(3), 268-277. doi:
acoustic cues for stop, fricative, and affricate
10.1121/1.1908638
manner. Journal of Experimental Psychology:
•62•
特殊教育研究學刊
Human Perception and Performance, 4(4),
621-637. doi: 10.1037//0096-1523.4.4.621
Tallal, P., Miller, S. L., Bedi, G., Byma, G., Wang,
X., Nagarajan, S. S., Schreiner, C., Jenkins, W.
Rvachew, S. (1994). Speech perception training
M., & Merzenich, M. M. (1996). Language
can facilitate sound production learning.
comprehension in language-learning
Journal of Speech Language and Hearing
impaired children improved with acoustically
Research, 37(2), 347-357. doi: 10.1044/
modified speech. Science, 271 (5245), 81-84.
jshr.3702.347
doi: 10.1126/science.271.5245.81
Rvachew, S. (2007). Phonological processing
Travis, L. E., & Rasmus, B. (1931). The speech
and reading in children with speech sound
sound discrimination ability of cases with
disorders. American Journal of Speech-
functional disorders of articulation. Quarterly
Language Pathology, 16(3), 260-270. doi:
Journal of Speech, 17(2), 217-226. doi:
10.1044/1058-0360(2007/030)
10.1080/00335633109379803
Scientific Learning Corporation.(2010). Fast For
TM
Word
[Computer software].
Walley, A. C., & Carrell, T. D. (1983). Onset
spectra and formant transitions in the adult’s
Sherman, D., & Geith, A. (1967). Speech Sound
and child’s perception of place of articulation
and discrimination and articulation skill.
in stop consonants. The Journal of the
Journal of Speech, Language, and Hearing
Acoustical Society of America, 73(3), 1011-
Research, 10(2), 277-280. doi: 10.1044/
1022. doi: 10.1121/1.389149
jshr.1002.277
Waldman, F. R., Singh, S., & Hayden, M. E. (1978).
Stevens, K. N., & Blumstein, S. E. (1978).
A comparison of speech-sound production
Invariant cues for place of articulation in stop
and discrimination in children with functional
consonants. The Journal of the Acoustical
articulation disorders. Language & Speech,
Society of America, 64(5), 1358-1368. doi:
21(3), 205-220.
10.1121/1.382102
Werker, J. F., & Tees, R. C. (2002). Cross-
Tallal, P. (1980). Auditory temporal perception,
language speech perception: Evidence for
phonics, and reading disabilities in children.
perceptual reorganization during the first year
Brain and Language, 9(2), 182-198. doi:
of life. Infant Behavior and Development,
10.1016/0093-934X(80)90139-X
25(1), 121-133. doi: 10.1016/S0163-
Tallal, P., Miller, S., Jenkins, B., & Merzenich,
6383(02)00093-0
M., (1997). The role of temporal processing
in developmental language-based learning
disorders: Research and clinical implications.
In B. Blachman (Ed.), Foundations of
reading acquisition and dyslexia (pp. 49-66).
Hillsdale, NJ: Lawrence Erlbaum.
收稿日期:2015.07.26
接受日期:2016.05.09
語音異常兒童的語音區辨及聲學調整對其聽知覺的影響
附錄一
•63•
華語語音區辨單音節對比材料
語音對比
1
2
3
4
5
6
7
8
C1
零聲母/軟顎摩擦音/塞音
阿哈
物布
故護
暗漢
物故
護兔
望晃
暗蛋
C2
送氣/不送氣 塞音
怕爸
踏大
喀尬
鋪布
兔肚
褲故
拼冰
聽丁
擦紮
抽周
出豬
妻雞
茄街
事日
熟柔
少繞
送氣/不送氣 塞擦音 &
C3
有聲/無聲摩擦音
C4
塞音/塞擦音
他擦
帶在
敦尊
端鑽
寬鑽
脫搓
龜追
拓錯
C5
鼻音/不送氣塞音/邊音
罵爸
那大
怒肚
蜜必
溺地
內累
農榮
怒路
C6
摩擦音/塞擦音
撒紮
撒擦
酥粗
酥租
松聰
西妻
鞋茄
雄窮
C7
構音部位
怕踏
爸大
兔褲
肚故
譬替
必地
蜜溺
孫勳
薩踏
訴兔
辣大
梨地
度路
路入
樂熱
龍榮
發哈
父護
佛猴
防航
法怕
護舖
父鋪
佛婆
齒槽塞音/擦音/邊音/
C8
有聲摩擦音
唇齒摩擦音/軟顎摩擦音/
C9
唇塞
C10
捲舌/非捲舌音
扎紮
殺撒
書酥
受嗽
豬租
出粗
鐘棕
專鑽
V1
圓唇/非圓唇高母音
居雞
區妻
需西
驢梨
與椅
軍金
群勤
雲銀
半棒
蛋盪
環黃
船床
專裝
酸雙
大盪
紅黃
無五
屋五
屋無
賭肚
髓歲
婆頗
梨李
龍攏
齒槽鼻韻/軟顎鼻韻/
V2
無鼻韻/鼻韻母音
T1
聲調
•64•
Bulletin of Special Education
2016, 41(3), 35-66
DOI: 10.6172/BSE.201611.4103002
Speech Discrimination of Mandarin- Speaking Children
with Speech Sound Disorders
Jing-yi Jeng
Dept. of Special Education,
National Kauhsiung Normal University
ABSTRACT
Purpose: Preschool children with speech sound disorders (SSD), previously called
“articulatory/phonological disorders,” frequently show deficiency in speech perception,
specifically in speech–sound discrimination. The purpose of this study was to investigate
the speech discrimination ability of Mandarin-speaking children with SSD and to explore
the effects of acoustically modified stimuli on speech discrimination. Methods: The
participants consisted of 31 preschool children with SSD and two control groups. One
of the control groups consisted of 31 normal preschool age-matched non-SSD children
and the other control group consisted of 40 normal young adults. In Experiment I, the
stimuli comprised 52 pairs of Mandarin monosyllables consisting of 13 phonetic minimal
pair contrasts for speech discrimination testing. The discrimination task involved judging
whether the two presented monosyllables were perceived as the same syllable sound.
The children were tested individually. The speech stimuli used in Experiment II were
acoustically modified from the stimuli in Experiment I. The acoustical modification
involved altering the time or frequency domains of the target speech segments through
resynthesis; specifically, the noise duration, VOT, and vowel transition duration were
modified, and noise masking and MFCC filtering were applied. Findings: The results of
Experiments I and II indicated that the SSD group exhibited significantly lower correct
rates and longer reaction times (RTs) than did the child control group. Additionally, the
adult group exhibited the highest correct rates and the shortest RTs. The articulation scores
of the children were moderately correlated with the correct rates and RTs of the speech
discrimination task (r = .50, p < .001; r = −.64, p < .001, respectively). Retroflex contrast,
manner contrast at the alveolar place of articulation, and tone contrast were the three most
•65•
difficult contrasts for the children with SSD. Aspiration contrast and fricative–affricate
contrast were the two contrasts with the greatest differences between the two groups of
children (SSD vs. normal). In Experiment II, the stimuli with acoustical enhancement
significantly reduced the RTs in the SSD group, but exhibited no facilitating effect on
the correct rates. For acoustically reduced stimuli, the two groups of children had lower
correct rates than they did for the enhanced stimuli and original stimuli. The noise masking
had a greater effect on the children with SSD. Conclusions/Implications: The results
suggest that the ability of speech discrimination of the preschool children remains lower
compared with that of adults, and that the development of speech perception is ongoing
in preschool children. Difficulty in speech discrimination may be a crucial factor for SSD.
Some acoustical modification can influence the discrimination of speech in children.
Keywords:speech sound disorders, articulatory/phonological disorders, speech
discrimination, acoustical modification, speech perception