Digital Speech Processing
نویسنده:
saeed seyedtabaii
تاریخ انتشار:
17 خرداد 1402
دیدگاه ها:
دیدگاهها برای Digital Speech Processing بسته هستند
درس اصلی مقطع کارشناسی ارشد و دکترای تخصصی رشته مهندس برق
Units: 3
Course text
Discrete Time Processing of Speech Signal, J.R. Deller, J.H.L. Hansen, J.G. Proakis, Wiley,2000 این کتاب در کتابخانه موجود است
Course outline
- Digital signal processing: مقدمه بر پردازش سیگنال و صوت
- نمونه برداری، افزایش و کاهش فرکانس نمونه برداری
- تحلیل طیف سیگنالهای گسسته
- سیستم و فیلترهای گسسته
- Speech production, Modelling: – تولید صوت انسانی
- – آواهای فارسی و کد گذاری آواها
- پروژه 1 استخراج مشخصات صوت فارسی با praat و SFS
- مدلسازی اکوستیکی و دیجیتالی تولید صوت (
- بخش 3: تحلیل سیگنال صوتی: short time energy,
- –short time autocorrelation
- STFT 1
- تحلیل سیگنال صوت
- FILTER BANKS 1
- -Linear Prediction Coding
- Covariance LPC 1
- -Cepstrum 1
- feature extraction
- بخش 4: کدینگ سیگنال صوتی Linear, logarithmic, adaptive PCM
- 9: ADPCM, LDM,
- : source hybrid coding ,
- CELP
- بخش 5: تولید سیگنال صوتی speech synthesis 22- کلمه به کد آوا front end 2
- 3- کد آوا به صوت back end 2
- 4- Linear Prediction method
- بخش 6: شناسایی سیگنال صوتی—–5- مقدمه شناسایی تک کلمه
- -آموزش HMM 2
- -شناسایی صوت پیوسته
- language modeling
- – شناسایی گوینده
- – درک زبان
Labs
آزمایشها
آزمایش 1: ویرایش سیگنال–
آزمایش2: فیلتر دیجیتال–
آزمایش 3: آنالیز و سنتز در فیلتر بانکها-
آزمایش 4: آنالیز طیف و مدلسازی–
آزمایش5: آنالیز فرمنت و پیچ–
– آزمایش 6: متن به صوت–
آزمایش 7: تولید سیگنال برای تولید صوت–
آزمایش 8: شناسایی تک کلمه-
آزمایش 9: شناسایی صوت
پروژه های درس
پروژه 1: مدلسازی اندامی و زمانی-فرکانسی صوت فارسی دانشجویان: موضوع جلسات 5 و 6 کلاس
پروژه 2: تولید صوت فارسی بر اساس مدلسازی فرکانسی: formant Based
پروژه 3: پروژه انتخابی شناسایی و یا تولید صوت
جلسات درس
پردازش صوت: نرم افزارهابرای اجرای برنامه ها به میکرفن و هدفون (یا بلندگو ) نیاز است. |
|
برنامه های ویرایش و تحلیل سیگنال صوتی: speech filling system (SFS): این برنامه منبع باز برای ویرایش و تحلیل سیگنال صوتی استفاده می شود. برای برداشتن فایلها اینجا و برای اجرا اینجا را کلیک کنید. برنامه های تجاری تحلیل سیگنال صوت مانند GoldWave ، cooledit، All editor هستند. برای برداشتن فایلهای all editor اینجا را کلیک کنید. برنامه را روی کامپیوتر خود نصب کرده استفاده کنید. Voice box مجموعه برنامه های پردازش صوت در محیط MATLAB است. از آن می توان بعنوان SPEECH TOOLBOX در کنار برنامه های نوشته شده MATLAB سود برد. برای راهنمای آن اینجا و برای فایلهای آن اینجا را کلیک کنید.
برنامه های شناسایی و تولید صوت و آوا امکانات پردازش صوت در Windows LPC: برنامه تولید اوا به روش linear predictive coding. بعد از اجرا، صفحه برنامه ظاهر می گردد. برای شنیدن صدا نیاز به بلندگو یا گوشی است. با کلیک روی آن برنامه اجرا می شود. برنامه چند زبانهMBOLA : مقدمه : این برنامه قابلیت تبدیل نگارش آوایی زبانهای مختلف از جمله فارسی به صوت را دارد. این برنامه به زبان C نوشته شده و لیست برنامه آن در دسترس است. برای راهنمایی اینجا را کلیک کنید. برای اجرا، برنامه را به کامپیوتر خود منتقل کرده آن را باز و اجرا کنید. برای برداشتن برنامه ها اینجا را کلیک کنید. INVTOOL-MODELTALKER: این برنامه قادر است متون انگلیسی را قرائت کند بعلاوه می تواند نوعی نگارش اوایی (نگارش فونتیکی) مربوط به خود را نیز قرائت کند. آنرا امتحان کنید. این برنامه نوشتار انگلیسی را تلفظ می کند. بعلاوه دارای invtool است که اجازه می دهد با تن صدای کاربر این قرائت صورت گیرد. برای این منظور کاربر جملاتی را قرائت می کند. بعد از پایان قرائت؛ تن صدا مورد پردازش قرار گرفته و در قرائت های بعدی متن این تن مورد استفاده قرار می گیرد. برای برداشتن برنامه اینجا را کلیک کنید. برنامه Festival: این برنامه منبع باز برای تولید صوت استفاده می گردد. ما این برنامه را امتحان نکرده ایم. برا برداشتن فایلهای آن اینجا را کلیک کنید. برای برداشتن برنامه های منبع باز کدینگ سیگنال صوتی CELP, LDCELP, LP10 را کلیک کنید. برای برنامه های منبع باز فرمنتی تولید صوت، اینجا را کلیک کنید. |
فایلها و اسلایدهای مربوط درس