©copyright Raimo Olavi Toivonen 19852019. All rights reserved. Last updated 12 Jun 2019.

Home  Signal displays  Multi-envelope displays  FFT displays  Cepstrum displays 1983−  LPC displays  Auditory displays 1983−  Loudness displays  Loudness curves  Timbre spectrum 1983−  Harmonic FFT displays  Waterfall displays 1983−  F0 displays 1983−  F0 histograms with semi scale 1989−  Jitter/shimmer 1990−  Computer Voice Fields 1983−  FFT spectrogram displays  LPC spectrogram displays  Auditory spectrogram displays  Bark, ERB, mel, st ja Hz scales formant charts 1988−  Bark scale 1983−  ERB scale 1996−  Semi scale 1989−  Works 1972−  Other links  Maailman kielten Bark-asteikkoiset formanttikartat

ISA software

LTAS-spektrit dB/Hz/Bark-asteikolla
Intelligent Speech Analyser™ (ISA) -ohjelmassa

|X(k,m)|2 (k=0...N/2-1) = |SUM(w(n)x(n)e-jk(2π/N)n)|2, n=0...N-1,m=0...M-1. |Y(k)|dB (k=0...N/2-1) = 10log10(SUM(|X(k,m)|2)/M), m=0...M-1. Signaali x(n) = xa(nT), n=0...N-1, T on näytejakso, xa= analogiasignaali. Jos xa on mikrofonin jännitesignaali, niin xa(nT) = kPa(nT), jossa Pa on paine ja k on vakiokerroin.

Laskenta käyttää decimation-in-time (DIT) laskentatapaa.
Olen vuosien varrella koodannut DSP-miehenä FFT:n täysin nollasta

(1) Texasin 16-bittiselle TMS320-signaaliprosessoriperheelle konekielellä,
(2) Motorolan 16- ja 32-bittisille M68000-mikroprosessoriperheille konekielellä ja C-kielellä,
(3) IBM:n 600-sarjan 32-bittiselle PowerPC-mikroprosessoriperheelle konekielellä ja C-kielellä,
(4) Intelin 32- ja 64-bittisille mikroprosessoriperheille C++-kielellä.

Signaalin ikkunointi tapahtuu Hamming-ikkunalla, suorakaide-ikkunalla tai yli 90 dB:n Blackman-Harris-ikkunalla.


Analyysikuvat olen alusta saakka koodannut älykkäiksi Neon olio-ohjelmointikielellä.

Hamming-ikkuna w(n) = 0.54-0.46cos(2πn/(N-1)).

Blackman-Harris-ikkuna w(n) = 0.35875-0.48829cos(2πn/(N-1))+0.14128cos(4πn/(N-1))-0.01168cos(6πn/(N-1)).
 
Hz:t muunnetaan Bark:eiksi kaavalla x/Bark=7ln[f/650+√(1+(f/650)
2)] ja
Bark:it muunnetaan Hz:eiksi kaavalla f/Hz=650sinh(x/7).

Hz:t muunnetaan ERB:eiksi kaavalla x/ERB=21,3log
10(1+f/228,7) ja
ERB:it muunnetaan Hz:eiksi kaavalla f/Hz=228,7(10
x/21,3-1).

Hz:t muunnetaan mel:eiksi kaavalla x/mel=2595log
10(1+f/700) ja
mel:it muunnetaan Hz:eiksi kaavalla f/Hz=700(10
x/2595-1).

Long-Time-Average-Spectrum display in Hz-scale

Keskiarvospektri dB/Hz/Bark-asteikolla.

Long-Time-Average-Spectrum display

Keskiarvospektrit dB/Hz/Bark-asteikolla.

Long-Time-Average-Spectrum analysis with segment controls in Hz-scale

Keskiarvospektrit segmentticontrolleilla dB/Hz/Bark-asteikolla.