©copyright Raimo Olavi Toivonen 19852018. All rights reserved. Last updated 8 Dec 2018.

Signal displays 1985−  Multi-envelope displays 1998−  FFT displays 1985−  Cepstrum displays 1983−  Loudness displays 1995−  Loudness curves 1998−  Timbre spectrum 1983−  LPC displays 1992−  Auditory displays 1983−   LTAS displays 1982−  Harmonic FFT displays, S/N-ratio  Waterfall displays 1983−  F0 displays 1983−  F0 histograms with semi-scale 1989−  Jitter/shimmer 1990−  Computer Voice Fields with Hz-scale 1983−  Computer Voice Fields with semi-scale 2017−  Fonetograms with semi-scale 2017−  FFT spectrogram displays 1985−  LPC spectrogram displays 1998−  Auditory spectrogram displays 1985−  Bark-, ERB-, mel-, st- ja Hz-scales formant charts 1988−  Bark-scale 1983−  ERB-scale 1996−  Semi-scale 1989−  Sone-scale 1995−  Computer Voice Fields (CVF) 1983  Works 1972−  DSP:n teorian jatko-opinnot TTKK:ssa eli DSP:n matemaattisen kompleksilukuteorian tuonti Suomeen 1976−1978  SYNTE2 1977−  Puhuva lehti 1977−   Puhuva tietokonepääte 1979−  ICASSP 1980  SYNTE3 1980−   SPL1-puhesynteesikieli 1980−  SPL1-tutkimuspuhesyntetisaattori 1981−  Bark-asteikkoinen 48-kanavainen kaistanpäästösuodinpankkiin perustuva ihmiskuulon malli 1983−  Intelligent Speech Analyser™ (ISA) 1985−  SYNTE2-esittelyvideon 8.12.1977 puhe analysoituna 2018−  Maailman kielten Bark-asteikkoiset formanttikartat 2018−   Äänekkyysasteikko 1995−   Other links

Soni-asteikolla tapahtuvia mittauksia ollaan lisäämässä kaikkialle ISA-ohjelmaan.

Tulossa kuvauksia auditoriseen spektriin perustuvista spektrimitta-asteikoista.

4.12.2016 tuli 30 vuotta täyteen ensimmäisen Intelligent Speech Analyser™ (ISA) -puheanalyysiohjelmani toimituksestani asiakkaalle.

Lainaan 18.10.2016 ohjelmaversiotani ilmaiseksi suomalaisille puhe- ja äänialan tutkijoille ja laitoksille tukeakseni puhe- ja äänialan tutkimusta Suomessa niinkuin olen tehnyt jo 32 vuotta 1986−2018.



ISA-ohjelmaversio 18.10.2016 ja kolmekymmentä samanaikaista analyysi-ikkunaa toisiinsa synkronoituna.

SYNTE2 sanoo 41 vuotta sitten 8.12.1977 "Tämä on ohjelma, joka käsittelee tulevaisuutta". Nimettyjen segmenttien äänekkyysarvot soni-asteikolla ovat "tämä" 31, 48, 33, 46, "on" 53, 32, "ohjelma" 46, 28, 40, 55, 56, 34, 49, "joka" 34, 54, 20, 58, "käsittelee" 44, 62, 60, 55, 16, 56, 61, 57, "tulevaisuutta" 20, 44, 47, 52, 27, 57, 54, 60, 13, 62.

a

Intelligent Speech Analyser™ (ISA) software and it's unique speech, sound and signal analysis methods

Googlaa Scholarilla "Intelligent Speech Analyser", 97 tulosta.


Googlaa "Intelligent Speech Analyser", monta tulosta.

Googlaa kuvahaulla "Intelligent Speech Analyser"

The main scopes of application include:
- Phonetics
- Phoniatrics
- Vocology (https://en.wikipedia.org/wiki/Vocology)
- Logopedics
- Audiology
- Speech Analysis
- Sound Analysis
- Singing Analysis
- Music Analysis
- Music Instrument Analysis
- Research on Children's Crying
- Research on Lung Sounds and Heart Sounds
- Bird Sounds
- Brain Research
- Muscle Signals
- Emotions in Voice
- Vocal loading

- Sound Editing
- Geology Signal Analysis
- Earth Coughing Signal Analysis
- Vulcano Signal Analysis
- Astronomy Signal Analysis.


Intelligent Speech Analyser™ (ISA) is the unique software in the world. It´s use is very simple. All the analyses have their own windows. All the functions are controlled by the mouse. All the displays can be listened to.
Software is running in Apple Macintosh computer. Macintosh is a trademark of Apple Computer, Inc.

Olen vuosien varrella DSP-miehenä koodannut Intelligent Speech Analyser™ (ISA) -ohjelman puheanalyysimenetelmät 
(1) Texasin 16-bittiselle TMS320-signaaliprosessoriperheelle konekielellä,
(2) Motorolan 16- ja 32-bittisille M68000-mikroprosessoriperheille konekielellä ja C-kielellä,
(3) IBM:n 600-sarjan 32-bittiselle PowerPC-mikroprosessoriperheelle konekielellä ja C-kielellä,
(4) Intelin 32- ja 64-bittisille mikroprosessoriperheille C++-kielellä.

Käyttöliittymän olen alusta saakka koodannut älykkääksi Neon olio-ohjelmointikielellä.

          Puheanalyysimenetelmät.
       
  a


  • Signaalinäyttö ja puheen amplitudiverhokäyränäyttö segmenttiviivojen kera. 

    Signaali x(n) = xa(nT), n=0...N-1, T on näytejakso, xa= analogiasignaali. Amplitudiverhokäyrä = 10log10(x(n)2), n=0...N-1. Jos xa on mikrofonin jännitesignaali, niin xa(nT) = kPa(nT), jossa Pa on paine ja k on vakiokerroin. SPLdb = 10log10[SUM(x(n)2)/N], n=0...N-1.

  • Signaalinäyttö ja puheen monen amplitudiverhokäyrän näyttö segmenttiviivojen kera.

    a

  • FFT näyttö, 512 kanavaa, taustakuvat, suuri dynamiikka, monta aikaikkunaa.
  • FFT spektrisarjanäyttö.

    a

  • Kepstritasoitettu FFT näyttö.

    a

  • LPC näyttö, analyysi näyttää formanttien paikat ja mittaa formanttien arvot, 512 kanavaa, aste 2−60, taustakuvat, monta aikaikkunaa.
  • LPC spektrisarjanäyttö.
  • LPC spektrogramminäytöt, segmenttiviivojen kera.

    a

  • Auditorinen spektrinäyttö, taustakuvat, 48, 120, 240, 480 kanavaa.
  • Auditorinen spektrinäyttö äänekkyysasteikolla, 48 kanavaa, taustakuvat.
  • Auditorinen spektrogramminäyttö, 2, 6 erilaista näyttöä, 48 kanavaa, segmenttiviivojen kera.
  • Auditorinen spektrisarjanäyttö, 48 kanavaa.

    Käsitteet "auditorinen" (auditory) ja "auditiivinen" (auditive) ovat eri käsitteitä. ISA:ssa käytetään nimenomaan käsitettä "auditorinen" (auditory).

    a

  • Kepstrinäyttö vaakatason Hz-asteikolla, 512 kanavaa, taustakuvat, monta aikaikkunaa.
  • Kepstrisarjanäyttö, 512 kanavaa, monta aikaikkunaa.

    a

  • Keskiarvospektri (LTAS) näyttö, 512 kanavaa, suuri dynamiikka, monta aikaikkunaa, taustakuva.
  • Normalisoitava keskiarvospektri (LTAS). Suuren LTAS-spektrijoukon keskiarvotus. Jotta LTAS-spektrit voidaan keskiarvottaa keskenään ne täytyy ensin nostaa vakiodesibelimäärään ja muuttaa sen jälkeen teholliseen muotoon.

    a

  • Laajakaistainen FFT spektrogramminäyttö.
  • Lyhytaikainen laajakaistainen FFT spektrogramminäyttö.
  • Kapeakaistainen FFT spektrogramminäyttö.
  • Lyhytaikainen kapeakaistainen FFT spektrogramminäyttö 2.

    a

  • F0/A0 käyränäyttö ajan kera, alue 40−500 Hz, segmenttiviivoilla, tarkkuudet 0.1 Hz ja 0.1 dB, F0-käyrät voidaan siirtää tuloskuviin joissa on taustakuvat, laskee SPL arvot askeltavalla aikaikkunalla.
  • F0/A0 käyränäyttö ajan kera ja zoomauksella.
  • F0/A0 käyränäyttö ilman aikaa.

    a

  • Puheäänikenttä, alue 40−500 Hz ja (0 − -40) dB.

    a

  • Puheäänikenttä puolisävelasteikolla, alue g−G st ja (40−100) dB.

    a

  • Fonetogrammi puolisävelasteikolla, alue g−G st ja (40−100) dB.

    a

  • F0-histogramminäyttö alue 40−500Hz, taustakuvat.

    a

  • Jitter-käyränäyttö, alue 40−500 Hz, 2 jitter prosenttia, tarkkuus 0.1 Hz.
    -Jitter1 100 * hajonta arvoista (f2-f1/f1), f1 ja f2 perusjaksot.
    -Jitter2 100 * keskiarvo arvoista |(f2-f2/f1)|, f1 ja f2 perusjaksot.
  • Shimmer-käyränäyttö, alueet 40−500 Hz ja (0  -40) dB.
    -Shimmer keskiarvo arvoista |a2-a1|, a1 ja a2  perusjaksojen max. amplitudit dB:einä.
  • Jitter-jakauma analyysi.
  • Shimmer-jakauma analyysi.
  • a

  • S/N-signaalikohinasuhdeanalyysi, korkea dynamiikka, monta aikaikkunaa.
  • Harmooninen FFT-analyysinäyttö, 4.096, 2.048, 1.024 ja 512 kanavaa, korkea dynamiikka, monta aikaikkunaa, taustakuvat.

    a

  • Phonetogrammi-näyttö, monta aikaikkunaa.

    a

  • SPL analyysi, 5 erilaista SPL analyysiä. SPLdb = 10log10[SUM(x(n)2)/N], n=0...N-1.
  • SPL lyhytaikaisanalyysi signaali- ja verhokäyräkursorilla, 5 erilaista SPL analyysiä.
  • a

  • Erospektri.
  • Spektrin eromitat.
  • Spektrin vertailu.

    a

  • Äänen automaattinen segmentointi soinnillisiin ja soinnittomiin segmentteihin. Em. segmenteillä voidaan myös ohjata aiemmin kehitettyjä segmenttiohjattuja F0-analyysejä.

    a

  • Äänen soinnillisten segmenttien jako edelleen vokaalisegmentteihin auditiivisen spektrierokäyrän avulla, spektrierokäyrä syntyy summaamalla äänen matalasta päästä (F1-alue) laskettu spektrieromitta ja äänen korkeasta päästä (F2-alue) laskettu spektrieromitta, auditiivisille spektrieroille käytössä tarkka mitta-asteikko, erokäyrästä voidaan mitata äänteen staattisen osan pituus ms:eissa ja äänteen liukumaosan pituus ms:eissa. Erokäyrästä voi tutkia myös aiemmin mittaamattomia äänteen sisäisiä ilmiöitä, erokäyrän avulla äänen mielenkiintoisia osia voi tietysti myös kuunnella (since 1996).
  • Auditorinen muutosspektri (muutosvaihe ja vakiovaihe), joka tuo herkästi esille äänessä esiintyvät spektrimuutokset ja niitten ajalliset paikat ja samalla selvästi osoittaa, missä kohdin ääni on melko vakioista. Muutosten arvointiin on käytössä selkeä mitta-asteikko.

    a

  • Intelligent Speech Analyseria ohjaavan korkean tason komentokielen kehitystyö. Käytössä ensimmäiseksi Intelligent Speech Analyser™ (ISA) tietokantapohjaisissa LTAS-analyyseissä.

    a

    Perussignaalioperaatiot.

  • Signaalin näytteenottotaajuussarja I 44.100 (1/1), 22.050 (1/2), 14.700 (1/3), 11.025 (1/4). Sen taajuusalueet 22.050 (1/1), 14.700 (1/2), 11.025 (1/3), 5.512,5 (1/4), 2.756,25 (1/8), 1.378,125 (1/16), 689,0625 (1/32) Hz.
  • Signaalin näytteenottotaajuussarja II 192.000 (1/1), 96.000 (1/2), 64.000 (1/3), 48.000 (1/4). Sen taajuusalueet 96.000 (1/1), 48.000 (1/2), 32.000 (1/3), 24.000 (1/4), 12.000 (1/8), 6.000 (1/16), 3.000 (1/32) Hz.
  • Signaalin näytteenottotaajuussarja III 384.000 (1/1), 192.000 (1/2), 128.000 (1/3), 96.000 (1/4). Sen taajuusalueet 192.000 (1/1), 96.000 (1/2), 64.000 (1/3), 48.000 (1/4), 24.000 (1/8), 12.000 (1/16), 6.000 (1/32) Hz.
  • Signaalin näytteenottotaajuussarjassa IV käyttäjä itse kirjoittaa ruudulle haluamansa näytteenoton ylimmän taajuuden kuten vaikkapa 1.000 Hz ja sarja IV on siten 1.000 (1/1), 500 (1/2), 333,3 (1/3), 250 (1/4). Sen taajuusalueet 500 (1/1), 250 (1/2), 133,3 (1/3), 125 (1/4), 62,5 (1/8), 31,25 (1/16), 15,625 (1/32) Hz.
  • Signaalimuistia käytettävissä useita gigatavuja.
  • Monta signaalin sisäänottomenetelmää.
  • Hyvin monta signaalien kuuntelumenetelmää.
  • Hyvin monta signaalien kuuntelumenetelmää analyysinäyttöjen kanssa.
  • Hyvin monta signaalien kuuntelumenetelmää tuloskuvien kanssa.
  • Signaalien dymamiikka 96 dB.
  • Signaalien segmentointi ja nimeäminen.
  • Signaalien editointi.
  • Signaalien generointi.
  • Signaalien suodatus.
  • Signaalitiedostot ISA:n omassa tiedostomuodossa sekä wav-tiedostoina. Netistä saatavissa olevat 44.100 Hz:n näytteenottotaajudella äänitetyt signaalitiedostot toimivat ISA:ssa hyvin.
  • Signaalin kuuntelu signaalin suodatuksen kanssa, signaalin kuuntelu värinmuokkauksen kanssa, formanttien kuuntelu.
  • Fourier-analyysi ja synteesi perustaajuutta ja formantteja muuttamalla.
  • a

    Mittausmenetelmät.

  • Mittaustaulut ja tilastolliset tulokset.
  • Tuloskuvat. Esimerkiksi formanttikartat  Hz-asteikolla,  Bark-asteikollaERB-asteikolla, mel-asteikolla. Esimerkiksi f0-käyrät hz-asteikolla,  st-asteikolla,   Bark-asteikollaERB-asteikolla,  mel-asteikolla. Reaaliaikaiset tilastolliset tulokset.

    Hz:t muunnetaan Bark:eiksi kaavalla Hz->Bark=7sinh(f/650)=7ln[f/650+√(1+(f/650)2)] ja
    Bark:it muunnetaan Hz:eiksi kaavalla Bark->Hz=650sinh(x/7).

    Hz:t muunnetaan ERB:eiksi kaavalla Hz->ERB=21,3log10(1+f/228,7) ja
    ERB:it muunnetaan Hz:eiksi kaavalla ERB->Hz=228,7(10x/21,3-1).

    Hz:t muunnetaan mel:eiksi kaavalla Hz->mel=2595log10(1+f/700) ja
    mel:it muunnetaan Hz:eiksi kaavalla mel->Hz=700(10x/2595-1).

    Hz:t muunnetaan st:eiksi kaavalla x->st=57+12log2(f/440) ja
    st:t muunnetaan Hz:eiksi kaavalla st->Hz=440(2(x-57)/12).

    Edellä mainitut Bark-asteikon muunnoskaavat käytössäni jo vuodesta 1983 saakka.

  • Monitoroiva formanttikartta.
  • Mittaukset aika-asteikolla (ms),  Hertsi-asteikolla (Hz)Bark-asteikolla (Bark).
  • Mittaukset puolisävelasteikolla (st)  2, senttiasteikolla (cent).
  • Mittaukset Koenig-asteikolla (k),  mel-asteikolla (mel)  ja  ERB-asteikolla (ERB)  2  3  4.

    a

    Kursorimenetelmät.

  • Näyttökursorit ja mustat alueet analyysinäytöissä.
  • Globaali aikasynkronointi kaikkien analyysinäyttöjen välillä.
  • Globaali aikasynkronointi kaikkien analyysinäyttöjen ja tuloskuvien välillä.
  • Globaali taajuussynkronointi kaikkien analyysinäyttöjen välillä.
  • Globaali taajuussynkronointi kaikkien analyysinäyttöjen ja tuloskuvien välillä.
  • a

    Muut analyysimenetelmät.

  • Taustakuvat analyysinäytöissä.
  • Taustakuvat tulosnäytöissä.
  • Taustakuvia voidaan siirtää analyysinäyttöjen välillä.
  • Monta signaalipuskuria.
  • Globaali SPL-kalibrointi.
  • Segmenttiviivat analyysinäytöissä.
  • Segmenttiviivat tulosnäytöissä.

    a

    Raimo Toivosen vakiinnuttamat tavaramerkit suomen kielisissä teksteissä:
    1980−2018:
    SANA1™-puheentunnistin,
    SPS1™-puheanalysaattori,
    SPS2™-puheanalysaattori,
    1975−2018:
    SYNTE2™-puhesyntetisaattori,
    SYNTE3™-puhesyntetisaattori,
    1979−2018:
    SPL1 korkean tason ohjelmointikieli puhesyntetisaattoria varten™,
    SPL1-tutkimuspuhesyntetisaattori™,
    Sokeain ohjelmoijain audiovisuaalinen tietokonepääte™,
    1982−2018:
    F0/A0-analyysi™,
    ISA F0-jakauma™,
    F0/A0-puheäänikenttäanalyysi™,
    Computer Voice Fields™,
    ISA fonetogrammi™,
    Jitter/Shimmer-analyysi™,
    ISA F1/F2-formanttikartta™,
    ISA fonetogrammi™,
    Auditorinen spektrogrammi™,
    Auditorinen spektrisarja™,
    Auditorinen äänekkyysasteikko™,
    Auditorinen äänekkyysspektri™,
    Auditorinen äänekkyyskäyrä™,
    Auditorinen äänekkyysmuutoskäyrä™,
    Auditorinen sointispektri™,
    Rikosäänilausunto™,
    1985−2018:
    Intelligent Speech Analyser™ (ISA) -ohjelma,
    Intelligent Speech Analyser™ (ISA) -menetelmät.

    Raimo Toivosen vakiinnuttamat tavaramerkit englannin kielisissä teksteissä:
    1980−2018:
    SANA1™ Speech Recognizer,
    SPS1™ Speech Analyser™,
    SPS2™ Speech Analyser™,
    1975−2018:
    SYNTE2™ Speech Synthesizer,
    SYNTE3™ Speech Synthesizer,
    1979−2018:
    SPL1 High Level Computer Language for Speech Synthesizer™,
    SPL1 Research Speech Synthesizer™,
    Audiovisual Terminal For Blind Programmers™,
    1982−2018:
    F0/A0 Analysis™,
    ISA F0 Histogram™,
    Computer Voice Fields™,
    ISA Fonetogram™,
    Jitter/Shimmer Speech Analysis™,
    ISA F1/F2 Formant Chart™,
    Auditory Spectrum™,
    Auditory Spectrogram™,
    Auditory Spectrum Waterfall™,
    Auditory Spectrogram™,
    Auditory Loudness Scale™,
    Auditory Loudness Curve™,
    Auditory Chance in Loudness Curve™,
    Auditory Timbre Spectrum™,
    1985−2018:
    Intelligent Speech Analyser™ (ISA) program,
    Intelligent Speech Analyser™ (ISA) methods.

    a

    All Intelligent Speech Analyser™ (ISA) ownerships and copyrights belong to Raimo Olavi Toivonen, MSc, who has 33 years 1985−2018 developed unique Intelligent Speech Analyser™ (ISA) software and unique speech, sound and signal analysis Intelligent Speech Analyser™ (ISA) methods. My company name is Pitchsystems Oy.

    home