©copyright Raimo Olavi Toivonen 19852018. All rights reserved. Last updated 22 Jul 2018.

Signal displays  Multi-envelope displays  FFT displays  Cepstrum displays  Loudness displays  Loudness curves  Timbre spectrum  LPC displays  Auditory displays   LTAS displays  Harmonic FFT displays  Waterfall displays  F0 displays  F0 histograms  Jitter/shimmer  Computer Voice Fields  FFT spectrogram displays  LPC spectrogram displays  Auditory spectrogram displays  Bark-, ERB-, mel-, st- ja Hz-scales formant charts  Bark-scale  ERB-scale  Semi-scale  Puheäänikentät  Works 1972−  SPL1-tutkimuspuhesyntetisaattori  Other links  Rikosäänilausunnot

Tulossa oma sivu "maailman kielten Bark-asteikkoisille formanttikartoille".

ISA-ohjelmisto toimii 22.7.2017 lähtien Windows10 koneissa SheepShaverin avulla Mac OS 9.0.4 käyttöjärjestelmässä.

Mac OS 9.0.4 käynnistyy Windows10 käyttiksen sisältävässä i7&SSD-koneessa 15 sekunnissa. Intelligent Speech Analyser -ohjelmani käynnistyy 9.0.4:ssä 5 sekunnissa. ISA laskee 500 spektrisen 1024 pisteisen FFT-keskiarvospektrin yhdessä sekunnissa. ISA:n signaali- ja analyysitiedostot voi koko ajan pitää Windows10 käyttislevyllä. Ainoastaan suoritettavan ISA-ohjelman tulee olla 9.0.4 käyttiksen puolella. Sisäänottamalla ja tallettamalla äänet wav-tiedostoiksi Windows10 puolella voi ISA:n yhteydessä käyttää monenlaisia monikanavaisia äänimuunnin-/äänivahvistinboxeja.

4.12.2016 tuli 30 vuotta täyteen ensimmäisen Intelligent Speech Analyser™ (ISA) -puheanalyysiohjelmani toimituksestani asiakkaalle.

Lainaan 18.10.2016 ohjelmaversiotani ilmaiseksi suomalaisille puhe- ja äänialan tutkijoille ja laitoksille tukeakseni puhe- ja äänialan tutkimusta Suomessa niinkuin olen tehnyt jo 31 vuotta 1986−2018.




ISA-ohjelmaversio 18.10.2016 ja kolmekymmentä samanaikaista analyysi-ikkunaa toisiinsa synkronoituna.


a

Intelligent Speech Analyser™ (ISA) software and it's unique speech, sound and signal analysis methods.

Googlaa Scholarilla "Intelligent Speech Analyser", 97 tulosta.

Googlaa "Intelligent Speech Analyser", 281 tulosta.

Googlaa kuvahaulla "Intelligent Speech Analyser"

The main scopes of application include:
- Phonetics
- Phoniatrics
- Vocology (https://en.wikipedia.org/wiki/Vocology)
- Logopedics
- Audiology
- Speech Analysis
- Sound Analysis
- Singing Analysis
- Music Analysis
- Music Instrument Analysis
- Research on Children's Crying
- Research on Lung Sounds and Heart Sounds
- Bird Sounds
- Brain Research
- Muscle Signals
- Emotions in Voice
- Vocal loading

- Sound Editing
- Geology Signal Analysis
- Earth Coughing Signal Analysis
- Vulcano Signal Analysis
- Astronomy Signal Analysis.


Intelligent Speech Analyser™
(ISA) is the unique software in the world. It´s use is very simple. All the analyses have their own windows. All the functions are controlled by the mouse. All the displays can be listened to. Software is running in Apple Macintosh computer. Macintosh is a trademark of Apple Computer, Inc.

Olen vuosien varrella DSP-miehenä koodannut Intelligent Speech Analyser™ (ISA) -ohjelman puheanalyysimenetelmät 
(1) Texasin 16-bittiselle TMS320-signaaliprosessoriperheelle konekielellä,
(2) Motorolan 16- ja 32-bittisille M68000-mikroprosessoriperheille konekielellä ja C-kielellä,
(3) IBM:n 600-sarjan 32-bittiselle PowerPC-mikroprosessoriperheelle konekielellä ja C-kielellä,
(4) Intelin 32- ja 64-bittisille mikroprosessoriperheille C++-kielellä.

Käyttöliittymän olen alusta saakka koodannut älykkääksi Neon olio-ohjelmointikielellä.

          Puheanalyysimenetelmät.
       
  a


  • Signaalinäyttö ja puheen amplitudiverhokäyränäyttö segmenttiviivojen kera. 

    Signaali x(n) = xa(nT), n=0...N-1, T on näytejakso, xa= analogiasignaali. Amplitudiverhokäyrä = 10log10(x(n)2), n=0...N-1. Jos xa on mikrofonin jännitesignaali, niin xa(nT) = kPa(nT), jossa Pa on paine ja k on vakiokerroin. SPLdb = 10log10[SUM(x(n)2)/N], n=0...N-1.

  • Signaalinäyttö ja puheen monen amplitudiverhokäyrän näyttö segmenttiviivojen kera.

    a

  • FFT näyttö, 512 kanavaa, taustakuvat, suuri dynamiikka, monta aikaikkunaa.
  • FFT spektrisarjanäyttö.

    a

  • Kepstritasoitettu FFT näyttö.

    a

  • LPC näyttö, analyysi näyttää formanttien paikat ja mittaa formanttien arvot, 512 kanavaa, aste 260, taustakuvat, monta aikaikkunaa.
  • LPC spektrisarjanäyttö.
  • LPC spektrogramminäytöt, segmenttiviivojen kera.
  • a

  • Auditorinen spektrinäyttö, taustakuvat, 48, 120, 240, 480 kanavaa.
  • Auditorinen spektrinäyttö äänekkyysasteikolla, 48 kanavaa, taustakuvat.
  • Auditorinen spektrogramminäyttö, 2, 6 erilaista näyttöä, 48 kanavaa, segmenttiviivojen kera.
  • Auditorinen spektrisarjanäyttö, 48 kanavaa.

    Käsitteet "auditorinen" (auditory) ja "auditiivinen" (auditive) ovat eri käsitteitä. ISA:ssa käytetään nimenomaan käsitettä "auditorinen" (auditory).

    a

  • Kepstrinäyttö vaakatason Hz-asteikolla, 512 kanavaa, taustakuvat, monta aikaikkunaa.
  • Kepstrisarjanäyttö, 512 kanavaa, monta aikaikkunaa.

    a

  • Keskiarvospektri (LTAS) näyttö, 512 kanavaa, suuri dynamiikka, monta aikaikkunaa, taustakuva.
  • Normalisoitava keskiarvospektri (LTAS). Suuren LTAS-spektrijoukon keskiarvotus. Jotta LTAS-spektrit voidaan keskiarvottaa keskenään ne täytyy ensin nostaa vakiodesibelimäärään ja muuttaa sen jälkeen teholliseen muotoon.
  • a

  • Laajakaistainen FFT spektrogramminäyttö.
  • Lyhytaikainen laajakaistainen FFT spektrogramminäyttö.
  • Kapeakaistainen FFT spektrogramminäyttö.
  • Lyhytaikainen kapeakaistainen FFT spektrogramminäyttö 2.
  • a

  • F0/A0 käyränäyttö ajan kera, alue 40−500 Hz, segmenttiviivoilla, tarkkuudet 0.1 Hz ja 0.1 dB, F0-käyrät voidaan siirtää tuloskuviin joissa on taustakuvat, laskee SPL arvot askeltavalla aikaikkunalla.
  • F0/A0 käyränäyttö ajan kera ja zoomauksella.
  • F0/A0 käyränäyttö ilman aikaa.

  • a

  • Puheäänikenttäanalyysinäyttö, alue 40500 Hz ja (0 -40) dB.
  • a

  • F0-histogramminäyttö alue 40500Hz, taustakuvat.

    a

  • Jitter-käyränäyttö, alue 40500 Hz, 2 jitter prosenttia, tarkkuus 0.1 Hz.
  • Shimmer-käyränäyttö, alueet 40500 Hz ja (0 -40) dB.
  • Jitter-jakauma analyysi.
  • Shimmer-jakauma analyysi.
  • a

  • S/N-signaalikohinasuhdeanalyysi, korkea dynamiikka, monta aikaikkunaa.
  • Harmooninen FFT-analyysinäyttö, 4.096, 2.048, 1.024 ja 512 kanavaa, korkea dynamiikka, monta aikaikkunaa, taustakuvat.

    a

  • Phonetogrammi-näyttö, monta aikaikkunaa.

    a

  • SPL analyysi, 5 erilaista SPL analyysiä. SPLdb = 10log10[SUM(x(n)2)/N], n=0...N-1.
  • SPL lyhytaikaisanalyysi signaali- ja verhokäyräkursorilla, 5 erilaista SPL analyysiä.
  • a

  • Erospektri.
  • Spektrin eromitat.
  • Spektrin vertailu.

    a

  • Äänen automaattinen segmentointi soinnillisiin ja soinnittomiin segmentteihin. Em. segmenteillä voidaan myös ohjata aiemmin kehitettyjä segmenttiohjattuja F0-analyysejä.

    a

  • Äänen soinnillisten segmenttien jako edelleen vokaalisegmentteihin auditiivisen spektrierokäyrän avulla, spektrierokäyrä syntyy summaamalla äänen matalasta päästä (F1-alue) laskettu spektrieromitta ja äänen korkeasta päästä (F2-alue) laskettu spektrieromitta, auditiivisille spektrieroille käytössä tarkka mitta asteikko, erokäyrästä voidaan mitata äänteen staattisen osan pituus ms:eissa ja äänteen liukumaosan pituus ms:eissa. Erokäyrästä voi tutkia myös aiemmin mittaamattomia äänteen sisäisiä ilmiöitä, erokäyrän avulla äänen mielenkiintoisia osia voi tietysti myös kuunnella (since 1996).
  • Auditorinen muutosspektri (muutosvaihe ja vakiovaihe), joka tuo herkästi esille äänessä esiintyvät spektrimuutokset ja niitten ajalliset paikat ja samalla selvästi osoittaa, missä kohdin ääni on melko vakioista. Muutosten arvointiin on käytössä selkeä mitta-asteikko.

    a

  • Intelligent Speech Analyseria ohjaavan korkean tason komentokielen kehitystyö. Käytössä ensimmäiseksi Intelligent Speech Analyser™ (ISA) tietokantapohjaisissa LTAS-analyyseissä.

    a

    Perussignaalioperaatiot.

  • Signaalin näytteenottotaajuussarja I 44.100 (1/1), 22.050 (1/2), 14.700 (1/3), 11.025 (1/4). Sen taajuusalueet 22.050 (1/1), 14.700 (1/2), 11.025 (1/3), 5.512,5 (1/4), 2.756,25 (1/8), 1.378,125 (1/16), 689,0625 (1/32) Hz.
  • Signaalin näytteenottotaajuussarja II 192.000 (1/1), 96.000 (1/2), 64.000 (1/3), 48.000 (1/4). Sen taajuusalueet 96.000 (1/1), 48.000 (1/2), 32.000 (1/3), 24.000 (1/4), 12.000 (1/8), 6.000 (1/16), 3.000 (1/32) Hz.
  • Signaalin näytteenottotaajuussarja III 384.000 (1/1), 192.000 (1/2), 128.000 (1/3), 96.000 (1/4). Sen taajuusalueet 192.000 (1/1), 96.000 (1/2), 64.000 (1/3), 48.000 (1/4), 24.000 (1/8), 12.000 (1/16), 6.000 (1/32) Hz.
  • Signaalin näytteenottotaajuussarjassa IV käyttäjä itse kirjoittaa ruudulle haluamansa näytteenoton ylimmän taajuuden kuten vaikkapa 1.000 Hz ja sarja IV on siten 1.000 (1/1), 500 (1/2), 333,3 (1/3), 250 (1/4). Sen taajuusalueet 500 (1/1), 250 (1/2), 133,3 (1/3), 125 (1/4), 62,5 (1/8), 31,25 (1/16), 15,625 (1/32) Hz.
  • Signaalimuistia käytettävissä useita gigatavuja.
  • Monta signaalin sisäänottomenetelmää.
  • Hyvin monta signaalien kuuntelumenetelmää.
  • Hyvin monta signaalien kuuntelumenetelmää analyysinäyttöjen kanssa.
  • Hyvin monta signaalien kuuntelumenetelmää tuloskuvien kanssa.
  • Signaalien dymamiikka 96 dB.
  • Signaalien segmentointi ja nimeäminen.
  • Signaalien editointi.
  • Signaalien generointi.
  • Signaalien suodatus.
  • Signaalitiedostot ISA:n omassa tiedostomuodossa sekä wav-tiedostoina. Netistä saatavissa olevat 44.100 Hz:n näytteenottotaajudella äänitetyt signaalitiedostot toimivat ISA:ssa hyvin.
  • Signaalin kuuntelu signaalin suodatuksen kanssa, signaalin kuuntelu värinmuokkauksen kanssa, formanttien kuuntelu.
  • Fourier-analyysi ja synteesi perustaajuutta ja formantteja muuttamalla.
  • a

    Mittausmenetelmät.

  • Mittaustaulut ja tilastolliset tulokset.
  • Tuloskuvat. Esimerkiksi formanttikartat  Hz-asteikolla,  Bark-asteikollaERB-asteikolla, mel-asteikolla. Esimerkiksi f0-käyrät hz-asteikolla,  st-asteikolla Bark-asteikollaERB-asteikolla,  mel-asteikolla. Reaaliaikaiset tilastolliset tulokset.

    Hz:t muunnetaan Bark:eiksi kaavalla Hz->Bark=7sinh(f/650)=7ln[f/650+√(1+(f/650)2)] ja
    Bark:it muunnetaan Hz:eiksi kaavalla Bark->Hz=650sinh(x/7).

    Hz:t muunnetaan ERB:eiksi kaavalla Hz->ERB=21,3log
    10(1+f/228,7) ja
    ERB:it muunnetaan Hz:eiksi kaavalla ERB->Hz=228,7(10
    x/21,3-1).

    Hz:t muunnetaan mel:eiksi kaavalla Hz->mel=2595log
    10(1+f/700) ja
    mel:it muunnetaan Hz:eiksi kaavalla mel->Hz=700(10
    x/2595-1).

    Hz:t muunnetaan st:eiksi kaavalla x->st=57+12log2(f/440) ja
    st:t muunnetaan Hz:eiksi kaavalla st->Hz=440(2
    (x-57)/12).

    Edellä mainitut Bark-asteikon muunnoskaavat käytössäni jo vuodesta 1982 saakka.

  • Monitoroiva formanttikartta.
  • Mittaukset aika-asteikolla (ms),  Hertsi-asteikolla (Hz)Bark-asteikolla (Bark).
  • Mittaukset puolisävelasteikolla (st)  2, senttiasteikolla (cent).
  • Mittaukset Koenig-asteikolla (k),  mel-asteikolla (mel)  ja  ERB-asteikolla (ERB)  2  3  4.

    a

    Kursorimenetelmät.

  • Näyttökursorit ja mustat alueet analyysinäytöissä.
  • Globaali aikasynkronointi kaikkien analyysinäyttöjen välillä.
  • Globaali aikasynkronointi kaikkien analyysinäyttöjen ja tuloskuvien välillä.
  • Globaali taajuussynkronointi kaikkien analyysinäyttöjen välillä.
  • Globaali taajuussynkronointi kaikkien analyysinäyttöjen ja tuloskuvien välillä.
  • a

    Muut analyysimenetelmät.

  • Taustakuvat analyysinäytöissä.
  • Taustakuvat tulosnäytöissä.
  • Taustakuvia voidaan siirtää analyysinäyttöjen välillä.
  • Monta signaalipuskuria.
  • Globaali SPL-kalibrointi.
  • Segmenttiviivat analyysinäytöissä.
  • Segmenttiviivat tulosnäytöissä.

    a

    Raimo Toivosen vakiinnuttamat tavaramerkit suomen kielisissä teksteissä:
    1980−2018:
    SANA1™-puheentunnistin,
    SPS1™-puheanalysaattori,
    SPS2™-puheanalysaattori,
    1975−2018:
    SYNTE2™-puhesyntetisaattori,
    SYNTE3™-puhesyntetisaattori,
    1979−2018:
    SPL1 korkean tason ohjelmointikieli puhesyntetisaattoria varten™,
    SPL1-tutkimuspuhesyntetisaattori™,
    Sokeain ohjelmoijain audiovisuaalinen tietokonepääte™,
    1982−2018:
    F0/A0-analyysi™,
    ISA F0-jakauma™,
    F0/A0-puheäänikenttäanalyysi™,
    Computer Voice Fields™,
    Jitter/Shimmer-analyysi™,
    ISA F1/F2-formanttikartta™,
    Auditorinen spektri™,
    Auditorinen spektrogrammi™,
    Auditorinen spektrisarja™,
    Auditorinen äänekkyysspektri™,
    Auditorinen äänekkyyskäyrä™,
    Auditorinen äänekkyysmuutoskäyrä™,
    Auditorinen sointispektri™,
    1996−2018:
    Rikosäänilausunto™,
    1985−2018:
    Intelligent Speech Analyser™ (ISA) -ohjelma,
    Intelligent Speech Analyser™ (ISA) -menetelmät.

    Raimo Toivosen vakiinnuttamat tavaramerkit englannin kielisissä teksteissä:
    1980−2018:
    SANA1™ Speech Recognizer,
    SPS1™ Speech Analyser™,
    SPS2™ Speech Analyser™,
    1975−2018:
    SYNTE2™ Speech Synthesizer,
    SYNTE3™ Speech Synthesizer,
    1979−2018:
    SPL1 High Level Computer Language for Speech Synthesizer™,
    SPL1 Research Speech Synthesizer™,
    Audiovisual Terminal For Blind Programmers™,
    1982−2018:
    F0/A0 Analysis™,
    ISA F0 Histogram™,
    Computer Voice Fields™,
    Jitter/Shimmer Speech Analysis™,
    ISA F1/F2 Formant Chart™,
    Auditory Spectrum™,
    Auditory Spectrogram™,
    Auditory Spectrum Waterfall™,
    Auditory Loudness Spectrum™,
    Auditory Loudness Curve™,
    Auditory Chance in Loudness Curve™,
    Auditory Timbre Spectrum™,
    1996−2018:
    Crime Voice Statement™,
    1985−2018:
    Intelligent Speech Analyser™ (ISA) program,
    Intelligent Speech Analyser™ (ISA) methods.

    a

    All Intelligent Speech Analyser™ (ISA) ownerships and copyrights belong to Raimo Olavi Toivonen, MSc, who has 33 years 1985−2018 developed unique Intelligent Speech Analyser™ (ISA) software and unique speech, sound and signal analysis Intelligent Speech Analyser™ (ISA) methods. My company name is Pitchsystems Oy.

    home