Online

2009-III
  • Balázs P. — Az akusztikai nyalábformálás alapjai
    kivonat | pdf
    Kivonat — A cikk a széleskörűen alkalmazott akusztikai kamerák elméleti alapjaival, az akusztikai nyalábformálással foglalkozik. Bemutatja az akusztikai nyalábformálás két típusának, a végtelen és véges fókusztávolságú nyalábformálásnak az elméleti alapjait, ismertet egy laboratóriumi körülmények között végzett, véges fókusztávolságú nyalábformálást vizsgáló mérést, szó esik a módszert korlátozó térbeli aliasing jelenségről és annak kiküszöböléséről, valamint röviden kitér a mikrofontömbök típusaira.
    Abstract — This article deals with the Acoustic Beamforming method, as the basic theory of acoustic cameras. It exposes the theory of the two main types of acoustic beamforming: the infinite and finite focus distance beamforming, an experiment made to examine the finite focus distance beamforming is introduced, a cutback on the method called spacial aliasing and it's elimination is presented, and finally, the main types of microphone arrays are shortly discussed.
  • Csapó T. G. — Változatos prozódia megvalósítása szövegfelolvasó rendszerekben
    kivonat | pdf
    Kivonat — A korszerű gépi szövegfelolvasó rendszerek által létrehozott hang érthetősége ma már megközelíti az emberi beszédét, azonban a természetességben még érezhető különbségek jelentkeznek. Jelen cikk az emberi beszéd változatosságát modellezi beszédszintetizátorokban a dallam és hangsúlyozás megfelelő minták szerint előállításával, nagyméretű beszédkorpusz felhasználásával. Az eredmények szerint a változatos gépi beszéd megvalósítható, így a beszédszintetizátorok ezen tulajdonságban is közelíthetik az emberi beszédet.
    Abstract — The intelligibility of state-of-the art text-to-speech (TTS) systems has approached that of human speech recently. However, there are still perceivable differences in naturalness. In this paper, the variability of human speech is modeled in speech synthesizers. Our method varies the intonation and emphasis of synthesized speech based on samples from a large speech corpus. According to our results, variable machine-generated speech is realizable. Future Text-To-Speech synthesizers can approach the variability property of human speech.
  • Fürjes A. T. — Stúdióépületek akusztikai kérdései az ajánlások és szabványok tükrében
    kivonat | pdf
    Kivonat — Az akusztikai tervezés, megvalósítás és ellenőrzés lépései természetes módon hangsúlyosabban fontosak az építtető és az üzemeltető számára egy stúdió komplexum esetében, azonban éppen a nem hétköznapi (gyakori) szituációk adhatnak okot a vitákra, mivel a szabványok inkább csak a hétköznapi szituációkat járják körül. Előzetes megállapodás híján a sajátos körülmények tisztázatlansága konfliktusokhoz vezet. Cikkemben a stúdiókkal kapcsolatos tervezői, kivitelezői, szakértői tanulságokat szeretném bemutatni és értelmezni.
    Abstract — Acoustic design, construction and verification are more evident to be important in the case of any studio complex. However, unusual situations may cause problems when interpreting acoustic criteria, because standards cover mostly usual situations only. The lack of an a priori agreement between the parties usually causes conflicts. In this paper I present possible conflicts and suggest solutions.
  • Pfliegel P. — Microflown -- Az akusztikai mérések újszerű eszköze
    kivonat | pdf
    Kivonat — A háromrészes cikksorozat második része egyrészt a részecskesebesség-mérő mikrofonnal szembeni előnyeit ismerteti, kiemelten foglalkozva az eszköz hatékony háttérzaj-elnyomásával. A folytatásban a micro-flown kalibrálásának változatos lehetőségeit mutatja be, rámutatva az egyes módszerek előnyeire, illetve alkalmazhatósági korlátaira.
    Abstract — Second paper of a three-paper series written on particle velocity sensor, known as micro-flown aim to show advantages of the device compared to microphone, with emphasis on its efficient background noise suppression. In the second part, the paper presents various methods used for micro-flown calibration, pointing at the advantages and limits of their application.
  • Szaszák Gy. — A prozódia felhasználási lehetőségei a gépi beszédfelismerésben
    kivonat | pdf
    Kivonat — Cikkemben az emberi beszéd prozódiájának beszédfelismerésbeli felhasználási lehetőségeit taglalom, illetve néhány konkrét felhasználási módot mutatok be. Röviden áttekintem a beszéd szupraszegmentális szerkezetét és szerveződését a nyelvészeti szakirodalom alapján, eközben igyekszem a fontosabb akusztikai összefüggéseket is megvilágítani. Bemutatok egy automatikus prozódiai szegmentálást - beszédfolyam-tagolást - megvalósító rendszert is, amely a fonológiai frázisok rejtett Markov-modellezése alapján működik. Ez a rendszer gépi beszédfelismerőbe építve a hipotézisgráfok újrasúlyozásával javítja a felismerés hatékonyságát. Hasonló alapokon a tagmondathatárok detektálása és a mondatok mondattípus szerinti automatikus osztályozása is megvalósítható a prozódia alapján.
    Abstract — This article addresses the usage of speech prosody in automatic speech recognition (ASR). First, the supra-segmental features and structure of the human speech is presented, based mainly on literature in phonetics, however, the acoustic correlates of the phenomena are also highlighted. Hereafter, a Hidden Markov model based automatic system is presented which performs prosody-based segmentation of the speech signal. This system models the prosody of phonological phrases and augment the accuracy of speech recognition when built into an ASR system by rescoring of the hipotheses graph. In a similar framework, automatic segmentation for clasuses and sentences and the recognition of the sentence modality is also possible.
© 2010 — Akusztikai Szemle Szerkesztősége, Rezidiuum Kft. | elérhetőség | jogvédelem