©copyright Raimo Olavi Toivonen 19822019. All rights reserved. Last updated 1 Jun 2019

Home  Signal displays 1985−  Multi-envelope displays 1998−  FFT displays 1985−  Cepstrum displays 1983−  Auditory displays 1983−  Loudness curves 1998−  Timbre spectrum 1983−  LPC displays 1992−  LTAS displays 1982−  Harmonic FFT displays 1989−  Waterfall displays 1983−  F0 displays 1983−  F0 histograms with semi scale 1989−  Jitter/shimmer 1990−  Computer Voice Fields 1983−  FFT spectrogram displays 1985−  LPC spectrogram displays 1998−  Auditory spectrogram displays 1985−  Bark, ERB, mel, st ja Hz scales formant charts 1988−  Bark scale 1983−  ERB scale 1996−  Semi scale 1989−  Sone scale 1995−  Works 1972− Maailman kielten Bark-asteikkoiset formanttikartat 2018−  Other links

ISA software


Auditoriset äänekkyysspektrit Soni/Bark-asteikolla
Intelligent Speech Analyser™ (ISA)-ohjelmassa 1995 lähtien

Auditoriset äänekkyysspektrit ovat olleet Intelligent Speech Analyser™ (ISA) -ohjelmassa käytössä 26.4.1998 lähtien.

Googlaa Scholarilla "loudness scale", 1.560 tulosta.

Googlaa teoshaulla "loudness scale", 3.090 tulosta.

Googlaa Scholarilla "sone scale", 799 tulosta.

Googlaa teoshaulla "sone scale", 1.620 tulosta.

Googlaa "loudness spectrum" Bark, 710 tulosta.

Googlaa Scholarilla "loudness spectrum" Bark, 135 tulosta.

Googlaa kuvahaulla "loudness spectrum" "Bark", monta tulosta.

Käsitteet "auditorinen" (auditory) ja "auditiivinen" (auditive) ovat eri käsitteitä. ISA:ssa käytetään nimenomaan käsitettä "auditorinen" (auditory).

35 vuoden ajan Bark-asteikko ja auditorinen suodinpankkimalli ovat olleet minulla rutiinikäytössä Otaniemen työvuodestani 1983 lähtien. Kehitin tällöin auditorista suodinpankkimallia yhdessä professori Matti Karjalaisen kanssa.

Olen vuosien varrella DSP-miehenä koodannut auditorisen suodinpankkimallin täysin nollasta
(1) "PDP-11/34:n Floating Point Systems FPS 100 vektoriprosessori"-ympäristöön Fortranilla,
(2) Texasin 16-bittiselle TMS320-signaaliprosessoriperheelle konekielellä,
(3) Motorolan 16- ja 32-bittisille M68000-mikroprosessoriperheille konekielellä ja C-kielellä,
(4) IBM:n 600-sarjan 32-bittiselle PowerPC-mikroprosessoriperheelle konekielellä ja C-kielellä,
(5) Intelin 32- ja 64-bittisille mikroprosessoriperheille C++-kielellä.

Analyysikuvat olen alusta saakka koodannut älykkäiksi Neon olio-ohjelmointikielellä.

Äänekkyyden (loudness) kaava on N=2(L-40)/10. Äänekkyyden yksikkö on Soni. L on siniäänen dBSPL äänenvoimakkuustaso.

Hz:t muunnetaan Bark:eiksi kaavalla Hz->Bark=7asinh(f/650)=7ln[f/650+√(1+(f/650)2)] ja
Bark:it muunnetaan Hz:eiksi kaavalla Bark->Hz=650sinh(x/7).

Edellä mainitut Bark-asteikon muunnoskaavat käytössäni jo vuodesta 1983.

Äänekkyysspektri soni-asteikolla. Kuvan tapauksessa kokonaisäänekkyys soneina syntyy lähes kokonaan alle 1.5 kHz:n puheaineksesta.

Mies luettelee 8 pitkää vokaalia. Kun ne segmentoidaan ja segmentit nostetaan ISA:n segmenttieditorilla samalle SPL-tasolle saadaan soni-asteikolla arvoiksi 47, 44, 33, 42, 35, 34, 40, 36. Saman äänenvoimakkuuksiset vokaalit poikkeavat toisistaan huomattavasti soni-asteikolla välillä 3347.

Nainen luettelee 8 pitkää vokaalia. Kun ne segmentoidaan ja segmentit nostetaan ISA:n segmenttieditorilla samalle SPL-tasolle saadaan soni-asteikolla arvoiksi 53, 46, 36, 44, 34, 34, 54, 36. Saman äänenvoimakkuuksiset vokaalit poikkeavat toisistaan huomattavasti soni-asteikolla välillä 3454. 

Äänenvoimakkuuskäyrä ja äänekkyyskäyrä päällekkäin testilauseesta "ai ai kun on kaunis päivä".



Suomen Akatemian "Modelling of Auditory and Speech Communication" -perustutkimushankkeen 1983−1987 loppuraportti Otaniemessä Akustiikan laboratoriossa 1987.