©copyright Raimo Olavi Toivonen 1982-2021. All rights reserved. Last updated on Jan 30, 2021.

Home  Signal displays 1985-  Multi-envelope displays 1998-  FFT displays 1985-  Cepstrum displays 1983-  LPC displays 1992-  Auditory displays 1983-  Loudness displays 1995-  Loudness curves 1998-  Timbre spectrum 1983-  Harmonic FFT displays 1989-  Waterfall displays 1983-  F0 displays 1983-  F0 histograms in semitone scale 1989-  Jitter/shimmer 1990-  Computer Voice Fields 1983-  FFT spectrogram displays 1985-  LPC spectrogram displays 1998-  Auditory spectrogram displays 1985-  Formant charts in Bark, ERB, mel, semitone and Hz scales 1988-   Synte 2 demo video speech on 8.8.1977 analyzed 2018- Formant charts of world languages in Bark scale 2018-   Other links

Works   Works before ISA

ISA software

LTAS spectra in dB/Hz/Bark scale

|X(k,m)|2 (k=0...N/2-1) = |SUM(w(n)x(n)e-jk(2π/N)n)|2, n=0...N-1,m=0...M-1.
|Y(k)|dB (k=0...N/2-1) = 10log10(SUM(|X(k,m)|2)/M), m=0...M-1. Signal x(n) = xa(nT), n=0...N-1, T is the sample period, xa= analog signal. If xa is the voltage signal of the microphone, then xa(nT) = kPa(nT), where Pa is the pressure and k is the constant factor.

The computation uses the decimation-in-time (DIT) computation method. Over the years, I have coded as a DSP man LTAS spectrum of the Intelligent Speech Analyser™ (ISA) program
(1) for the Texas 16-bit TMS320 signal processor family in machine language,
(2) for Motorola's 16 and 32-bit M68000 microprocessor families in machine language and C language,
(3) for IBM 600 Series 32-bit PowerPC Microprocessor Family in machine language and C language,
(4) for Intel 32-bit and 64-bit microprocessor families in C++ language.

Signal windowing is done with a Hamming window, a rectangular window or a Blackman-Harris window with more than 90 dB.

Analysis pictures I have coded from the very beginning in Neon object-oriented programming language.

Hamming-window w(n) = 0.54-0.46cos(2πn/(N-1)).

Blackman-Harris-window w(n) = 0.35875-0.48829cos(2πn/(N-1))+0.14128cos(4πn/(N-1))-0.01168 cos(6πn/(N-1)).
 
Hz is converted to Bark by the formula x/Bark=7ln[f/650+√(1+(f/650)2)] and Barks are converted to Hz by the formula f/Hz=650sinh(x/7).

Hz is converted to ERBs by the formula x/ERB=21,3log10(1+f/228,7) and ERBs are converted to Hz by the formula f/Hz=228,7(10x/21,3-1).

Hz is converted to mel by the formula x/mel=2595log10(1+f/700) and mels are converted to Hz by the formula f/Hz=700(10x/2595-1).


Raimo Toivonen 1.12.2000: NORMALISOIDUT LTAS-SPEKTRIT. Normalisointi muuttaa erivoimakkuuksisten ja eripituisten äänten keskiarvospektrit vertailukelpoisiksi keskenään. Oleellista on keskiarvospektrin muoto. Jokaisen keskiarvoon laskettavan yksittäisen spektrin kohdalla käyttäjä voi valita poistetaanko laskennasta (1) ässän kaltainen spektri, (2) heikko spektri, (3) voimakas spektri, (4) tauon spektri, (5) soinnillinen spektri ja/tai (6) soinniton spektri. Normalisoitujen keskiarvospektrien laskenta toimii myös segmenttiohjatusti + ja - merkeillä. Normalisoitujen FFT-keskiarvospektrien automaattinen laskenta äänitietokannasta. Laskenta muodostaa spektritietokannan. Normalisoitujen FFT-keskiarvospektrien ja F0/SPL-käyrien laskenta segmenttiohjatusti. Voi määrätä esim. laskemaan keskiarvospektrin tai F0/SPL-käyrän vokaalisegmenteistä. Nämä puheanalyysimenetelmät ovat  ansiokkaasti käytössä Tampereen yliopiston Puheopin laitoksen johtaja lehtori Timo Leinon kansainvälisesti merkittävissä julkaisuissa.

Raimo Toivonen 26.4.1998: New segment controlled LTAS. New way of thinking. Ensimmäisessä kuvassa on signaaliin merkitty miinus-merkillä segmenttiohjaus, jolla keskiarvospektri jättää s-äänteen pois laskennasta. Toisessa kuvassa on taustakuvassa (paksumpi viiva) keskiarvospektri kaikista segmenteistä ja etukuvassa (ohuempi viiva) on keskiarvospektri kun s-äänne on jätetty pois laskennasta. Kolmannessa kuvassa on signaaliin merkitty plus-merkeillä segmenttiohjaukset, joilla laskenta ottaa mukaan vain a-äänteet. Neljännessä kuvassa on keskiarvospektri kaikista lauseen "ai ai kun on kaunis päivä" a-ääneistä ja vain niistä. Viidennessä kuvassa on signaaliin merkitty plus-merkeillä segmenttiohjaukset, joilla laskenta ottaa mukaan vain i-äänteet. Kuudennessa kuvassa on keskiarvospektri kaikista lauseen ai ai kun on kaunis päivä i-ääneistä ja vain niistä.

Raimo Toivonen (1987) LTAS-spektrit ISA-ohjelmaan.

Raimo Toivonen (1982) Tampereen yliopiston Puheopin laitoksella LTAS-spektrien siirto B&K 2031-analysaattorilta IEC-liityntäkortin avulla EXORset30-kehitystietokoneen levykkeille, LTAS-spektrien siirto IEC-liityntäkortin avulla EXORset:iltä B&K 2031-analysaattorille, LTAS-spektrien käsittely EXORset:issä, LTAS-spektrien laskenta levykkeillä olevista spektritiedostoista ja laskettujen LTAS-spektrien tulostus piirturilla. Ohjelman ja sen käyttöohjeen julkistus tapahtui 20.10.1982 juuri ennen TKK:n Akustiikan laboratorion kauttani 18.10.1982-12.10.1983.

Long-Time-Average-Spectrum display in Hz-scale

LTAS on the dB/Hz/Bark scale.

Long-Time-Average-Spectrum display

LTAS on the dB/Hz/Bark scale.

Long-Time-Average-Spectrum analysis with segment controls in Hz-scale

LTAS on the dB/Hz/Bark scale.