تعداد نشریات | 25 |
تعداد شمارهها | 926 |
تعداد مقالات | 7,634 |
تعداد مشاهده مقاله | 12,435,149 |
تعداد دریافت فایل اصل مقاله | 8,851,001 |
بازشناسی تمایز خیشومی-انسدادی در شرایط نامطلوب شنیداری | ||
زبان پژوهی | ||
مقاله 3، دوره 10، شماره 29، اسفند 1397، صفحه 45-60 اصل مقاله (907.57 K) | ||
نوع مقاله: مقاله پژوهشی | ||
نویسنده | ||
زهرا محمودزاده* | ||
هیئت علمی پژوهشگاه علوم و فناوری اطلاعات ایران | ||
چکیده | ||
برای بهبودِ بازشناسیِ خودکارِ تمایزهای واجی، میتوان از سرنخهای درکی که شنوندگان برای بازشناسی طبیعی، آنها را در موقعیتهای نامطلوب شنیداری مانند گفتار تلفنی یا نوفة محیط به کار میبرند، استفاده نمود. در این پژوهش، برای یافتن سرنخهای درکیِ مؤثر در بازشناسیِ طبیعیِ تمایزِ خیشومی-انسدادی در جفترقمهای «دو-نه» [do]-[noh] در شرایطِ نامطلوبِ گفتارِ تلفنی، از آزمونهای درکی استفاده شد. بررسی سیگنال آکوستیکیِ [no] نشان میدهد که سرنخهای گذر واکهای و زمزمة خیشومی، تحتِ تأثیر عوامل مختلفِ اختلالِ سیگنال قرار گرفته، از جنبة آکوستیکی کاهش پیدا میکنند و سببِ ابهام در درک خیشومی [n] میشوند. در شرایط مطلوبِ شنیداری، دقت بازشناسی طبیعی [n] بر اساس تنها پارامتر زمزمة خیشومی، درحدود 40 درصد است. اما با افزودن 10 میلیثانیه از ابتدای گذرهای واکهای به آن، دقت بازشناسی به 96 درصد افزایش مییابد. در گفتار تلفنی، دقت بازشناسیِ طبیعی براساس زمزمة خیشومی 29 درصد و براساس هر دو پارامتر، فقط 48 درصد است. به نظر میرسد عدمِ قطعیت و ابهامِ واژگانی شنونده، به دلیل حذف یا کاهش اطلاعات آوایی در شرایط نامطلوب شنیداری از یک سو و گرایش درکی شنونده به سمت همخوان بینشان [d] از سوی دیگر منجر به کاهش بازشناسی خیشومی [n] شدهاست. براساس یافته های پژوهش، پارامتر آکوستیکی زمزمة خیشومی، نقش مؤثری در بازشناسیِ طبیعیِ خیشومی در شرایط مطلوب یا نامطلوبِ شنیداری ندارد و فقط با افزودن اطلاعاتِ گذرهای سازهای است که بازشناسی به طور معناداری افزایش مییابد. بنابراین، برای بازشناسی خودکار این واژه ها، لازم است اطلاعات زمانی و طیفی واکههای مجاور و گذرهای آنها به کار گرفته شود. | ||
کلیدواژهها | ||
شرایط نامطلوب شنیداری؛ ارقام فارسی؛ آزمایش درکی؛ تمایز خیشومی- انسدادی؛ گذر واکهای | ||
عنوان مقاله [English] | ||
The recognition of nasal-stop distinction in adverse listening conditions | ||
نویسندگان [English] | ||
Zahra Mahmoodzade | ||
Faculty of Information Science and Technology Research Institute of Ira | ||
چکیده [English] | ||
The automatic recognition of Persian numerals [sefr-se] “zero–three”, [do-noh] “two-nine” and [haft-haʃt] “seven-eight” is considered as a challenge for speech recognition systems. Mahmoodzadeh and Bahrani (2014) found that the acoustic reduction of telephone speech triggers lexical ambiguity for the automatic recognition of [sefr-se] pair. The numeral [sefr] is produced with the deletion of [r] at word final position and the weak labial friction of [f] is masked by the channel noise, which results in an increase of acoustic similarity between [sefr] and [se]. The automated recognition of phonological distinctions can be improved by using perceptual cues which listeners apply for the natural recognition of sounds in adverse listening conditions such as telephone speech or noisy environment. In this research for discovering efficient perceptual cues responsible for distinction of numerals [do]-[noh] “two-nine” in both natural and telephone speech, perception tests were used. The acoustic signal of [noh] shows a weak or practically deleted final [h], which is not audible and recognizable from background noise. Therefore, the acoustic differences of nasal-stop distinction and the co-articulatory effects of nasal on the following vowel play an important role in [do-no] recognition. Results show that the acoustic landmarks, nasal murmur and nasal-vowel transitions affected by various sources of signal disruption, undergo phonetic reduction, which leads to perceptual similarity of [do-noh] pair and ultimately listeners` lexical ambiguity. In optimal listening condition, natural recognition of [n] based on nasal murmur is about 40% which increases to 96% after the addition of 10ms of the beginning of vowel [o]. However in telephone speech, natural recognition of [n] based on murmur is about 29% and after the addition of 10ms of vowel [o] transitions rises to just about 48%. According to the outcomes, nasal murmur is not an influential perceptual cue for the recognition of [n] in both optimal and adverse listening conditions; however recognition rises significantly after adding only 10 ms of the beginning of following vowel. It is likely that listeners’ lexical confusion and uncertainty due to lack and reduction of phonetic information reinforced by listeners’ perceptual bias toward unmarked consonant, give rise to [d] responses and failure of [n] identification in adverse listening conditions. The automatic recognition of these words should be done by capturing further temporal and spectral information from neighboring vowel transitions. | ||
کلیدواژهها [English] | ||
adverse listening conditions, Persian numerals, perception test, nasal-stop distinction, vowel transition | ||
سایر فایل های مرتبط با مقاله
|
||
مراجع | ||
ثمره، یدالله (1385). آواشناسی زبان فارسی. تهران: مرکز نشر دانشگاهی. جانسون، کیث (1394). آواشناسی آکوستیک و شنیداری. ترجمة زهرا محمودزاده و رحیمه روحپرور. تهران: نشر چاپار. محمودزاده، زهرا و محمد بحرانی (1393). «بررسی موردی کاهش آوایی در ارقام تلفنی فارسی». زبانپژوهی. دورة 6. شمارة 13. صص 110-134. | ||
آمار تعداد مشاهده مقاله: 767 تعداد دریافت فایل اصل مقاله: 440 |