©copyright Raimo Olavi Toivonen 19822019. All rights reserved. Last updated on August 8, 2019.

Home  Signal displays 1985–  Multi-envelope displays 1998–  FFT displays 1985–  Cepstrum displays 1983−  LPC displays 1992–  Auditory displays 1983−  Loudness displays 1995–  Loudness curves 1998–  Timbre spectrum 1983−  LTAS displays 1982–  Harmonic FFT displays 1989–  F0 displays 1983−  F0 histograms in semitone scale 1989−  Jitter/shimmer 1990−  Computer Voice Fields 1983−  FFT spectrogram displays 1985–  LPC spectrogram displays  Auditory spectrogram displays 1985–  Bark, ERB, mel, semitone and Hz scales formant charts 1988−  Bark scale 1983−  ERB scale 1996−  Semitone scale 1989−  Sone scale 1995−  Other links  Formant charts of world languages in Bark scale 2018−

Works 1972−

ISA software


Spectrum series on Intelligent Speech Analyzer ™ (ISA)

FFT-spektrisarja dB/Hz-asteikolla.

|X(k)|dB (k=0...N/2-1) = 20log10|SUM(w(n)x(n)e-jk(2π/N)n)|, n=0...N-1. Signaali x(n) = xa(nT), n=0...N-1, T on näytejakso, xa= analogiasignaali. Jos xa on mikrofonin jännitesignaali, niin xa(nT) = kPa(nT), jossa Pa on paine ja k on vakiokerroin.

The computation uses the decimation-in-time (DIT) computation method. Over the years, I have coded as a DSP man FFT spectrum of the Intelligent Speech Analyser™ (ISA) program
(1) for the Texas 16-bit TMS320 signal processor family in machine language,
(2) for Motorola's 16 and 32-bit M68000 microprocessor families in machine language and C language,
(3) for IBM 600 Series 32-bit PowerPC Microprocessor Family in machine language and C language,
(4) for Intel 32-bit and 64-bit microprocessor families in C++ language.


Signaalin ikkunointi tapahtuu Hamming-ikkunalla, suorakaide-ikkunalla tai yli 90 dB:n Blackman-Harris-ikkunalla.

Analysis pictures I have coded from the very beginning in Neon object-oriented programming language.

Hamming-ikkuna w(n) = 0.54-0.46cos(2πn/(N-1)).

Blackman-Harris-ikkuna w(n) = 0.35875-0.48829cos(2πn/(N-1))+0.14128cos(4πn/(N-1))-0.01168cos(6πn/(N-1)).

Hz:t muunnetaan Bark:eiksi kaavalla Hz->Bark=7sinh(f/650)=7ln[f/650+√(1+(f/650)2)] ja
Bark:it muunnetaan Hz:eiksi kaavalla Bark->Hz=650sinh(x/7).

Hz:t muunnetaan ERB:eiksi kaavalla Hz->ERB=21,3log10(1+f/228,7) ja
ERB:it muunnetaan Hz:eiksi kaavalla ERB->Hz=228,7(10x/21,3-1).

Hz:t muunnetaan mel:eiksi kaavalla Hz->mel=2595log10(1+f/700) ja
mel:it muunnetaan Hz:eiksi kaavalla mel->Hz=700(10x/2595-1).

Edellä mainitut Bark-asteikon muunnoskaavat käytössäni jo vuodesta 1983 saakka.

Psychoacoustic links to "en.wikipedia.org/wiki":  Psychoacoustics   Auditory  Auditive  Auditory phonetics    Sone   Phon   Loudness   Equal-loudness contour   Bark scale   ERB scale   Mel scale   Semitone scale    Hertz scale

LPC-spektrisarjat dB/Hz-asteikolla.

The calculation uses the PARCOR method. Over the years, I have coded as a DSP man PARCOR method of the Intelligent Speech Analyser™ (ISA) program
(1) for the Texas 16-bit TMS320 signal processor family in machine language,
(2) for Motorola's 16 and 32-bit M68000 microprocessor families in machine language and C language,
(3) for IBM 600 Series 32-bit PowerPC Microprocessor Family in machine language and C language,
(4) for Intel 32-bit and 64-bit microprocessor families in C++ language.

Signaalin ikkunointi tapahtuu Hamming-ikkunalla, suorakaide-ikkunalla tai yli 90 dB:n Blackman-Harris-ikkunalla.

Analysis pictures I have coded from the very beginning in Neon object-oriented programming language.

Auditoriset spektrisarjat dB/Bark-asteikolla.

Käsitteet "auditorinen" (auditory) ja "auditiivinen" (auditive) ovat eri käsitteitä. ISA:ssa käytetään nimenomaan käsitettä "auditorinen" (auditory).

36 vuoden ajan Bark-asteikko ja auditorinen suodinpankkimalli ovat olleet minulla rutiinikäytössä Otaniemen työvuodestani 1983 lähtien. Kehitin tällöin auditorista suodinpankkimallia yhdessä professori Matti Karjalaisen kanssa. Työskentelin vuosikymmeniä 1970-luvulta saakka Karjalaisen kanssa.

Over the years, I have coded as a DSP man auditory filter bank model completely from zero
(1) for "PDP-11/34  Floating Point Systems  FPS 100 Vector Processor" in Fortran,
(2) for the Texas 16-bit TMS320 signal processor family in machine language,
(3) for Motorola's 16 and 32-bit M68000 microprocessor families in machine language and C language,
(4) for IBM 600 Series 32-bit PowerPC Microprocessor Family in machine language and C language,
(5) for Intel 32-bit and 64-bit microprocessor families in C++ language.


Analysis pictures I have coded from the very beginning in Neon object-oriented programming language.

Hz:t muunnetaan Bark:eiksi kaavalla Hz->Bark 7asinh(f/650)=7ln[f/650+√(1+(f/650)2)] ja
Bark:it muunnetaan Hz:eiksi kaavalla Bark->Hz=650sinh(x/7).

Edellä mainitut Bark-asteikon muunnoskaavat käytössäni jo vuodesta 1983 saakka.

Kepstrisarjat lin/Hz-asteikolla.

|X(k)|dB (k=0...N/2-1) = 20log10|SUM(w(n)x(n)e-jk(2π/N)n)|, n=0...N-1. |Y(k)| (k=0...N/4-1) = |SUM(|X(n)|dBe-jk(2π/N)n)|, n=0...N/2-1. Signaali x(n) = xa(nT), n=0...N-1, T on näytejakso, xa= analogiasignaali. Jos xa on mikrofonin jännitesignaali, niin xa(nT) = kPa(nT), jossa Pa on paine ja k on vakiokerroin.

The computation uses the decimation-in-time (DIT) computation method. Over the years, I have coded as a DSP man Ceptrum of the Intelligent Speech Analyser™ (ISA) program
(1) for the Texas 16-bit TMS320 signal processor family in machine language,
(2) for Motorola's 16 and 32-bit M68000 microprocessor families in machine language and C language,
(3) for IBM 600 Series 32-bit PowerPC Microprocessor Family in machine language and C language,
(4) for Intel 32-bit and 64-bit microprocessor families in C++ language.


Signaalin ikkunointi tapahtuu Hamming-ikkunalla, suorakaide-ikkunalla tai yli 90 dB:n Blackman-Harris-ikkunalla.

Analysis pictures I have coded from the very beginning in Neon object-oriented programming language.

Hamming-ikkuna w(n) = 0.54-0.46cos(2πn/(N-1)).


Blackman-Harris-ikkuna w(n) = 0.35875-0.48829cos(2πn/(N-1))+0.14128cos(4πn/(N-1))-0.01168cos(6πn/(N-1)).