Microsoft Azure-gjennomgang: Banebrytende talebehandling

Microsoft Azure Speech to Text er en av de mest avanserte plattformene for stemmegjenkjenning. Som en del av Microsofts Cognitive Speech Services-produktsortiment, bruker den dybdelæringsalgoritmer for å overvinne dårlig lydkvalitet og kan tilpasse seg forskjellige talestiler for nøyaktige lydkripsjoner. I denne Microsoft Azure Speech to Text-gjennomgangen vil vi se nærmere på denne tjenesten.

Det er verdt å merke seg at Microsoft Azure Speech to Text ikke er et tradisjonelt stykke brukervennlig dikteringsprogramvare. I stedet er dette en utviklerorientert plattform designet for å hjelpe bedrifter med å lage, teste og administrere sine egne produkter. Hvis du bare vil transkribere en mengde lydfiler, kan alternative tale-til-tekst-apper være et bedre alternativ. Ta en titt i vår beste tale-til-tekst programvareveiledning for de beste alternativene.

Microsoft Azure tale til tekst: planer og priser

Ved å bruke Microsoft Azure Speech to Text kan du transkribere opptil fem timer med lyd gratis og opprette en tilpasset stemmemodell per måned. Imidlertid, med den gratis planen, er bare en enkelt samtidig lydforespørsel tilgjengelig om gangen, noe som betyr at dette alternativet ikke er levedyktig for de fleste bedrifter.

Fakturering av Azure taletjeneste er delt inn i trinn på ett sekund.

Hvis du vil transkribere mer enn ett taleklipp på en gang, må du oppgradere til det vanlige Azure-prissystemet. Dette koster $ 1 per time med lyd og støtter opptil 20 samtidige forespørsler. Ekstra kostnader er involvert hvis du trenger å bruke en tilpasset lydmodell eller transkribere lydkanaler på flere kanaler. Disse ekstra tjenestene koster henholdsvis $ 1,40 og $ 2,10 per lydtime.

Selv om Microsoft lister opp prisene i formatet "per lydtid", og det samme er bransjestandarden, er fakturering faktisk delt inn i trinn på ett sekund, slik at du ikke betaler for mer behandlingstid enn nødvendig.

Microsoft Azure tale til tekst: Funksjoner

Nøkkelen til Azure Speech to Text-funksjonen er tilgangen den gir til Microsofts kraftige naturlige språkbehandlingssystem. I løpet av de siste årene har Microsofts tale AI nådd flere viktige milepæler. Dette betyr at den nå kan fullføre oppgaver som tidligere var umulige for en talegjenkjenningstjeneste, for eksempel nøyaktig transkribering av krysspråk under små gruppesamtaler.

Microsoft Azure tale til tekst-tjenesten kan integreres med Office 365 for optimal nøyaktighet.

Azure fungerer med dusinvis av språk og dialekter og kan trenes - ved hjelp av tilpassede talegjenkjenningsmodeller - for å bedre tilpasse seg brukerens talestil, bakgrunnsstøy og ordforråd. Hvis organisasjonen din allerede er forpliktet til Microsofts produktøkosystem, kan du utnytte brukerens Office 365-data for å bedre nøyaktigheten av talegjenkjenning for organisasjonsspesifikke vilkår. Og, viktigere, dette kan gjøres uten å gå på bekostning av datasikkerheten din fordi tale til tekst kan kjøres lokalt.

Microsoft Azure tale til tekst: Oppsett

Microsoft Azure er designet for utviklere i stedet for forbrukere. Dette betyr at oppsett er en involvert og litt utfordrende prosedyre som er best å overlate til noen med mye teknisk kunnskap.

Å konfigurere Azure er ikke akkurat greit med mindre du har kodingserfaring.

Den raskeste måten å konfigurere Azure på er å bruke Azure Speech SDK på et programmeringsspråk som Java eller C ++. For dette må du registrere deg for en gratis Azure-konto og opprette et tomt prosjekt i utviklingsmiljøet ditt. Du må da bruke Microsoft Visual Studio og skrive et kort program for å initialisere Microsofts SpeechRecognizer-objekt.

Microsoft Azure tale til tekst: grensesnitt

I likhet med andre bulk-transkripsjonsplattformer, er Microsoft Azure Speech to Text ment å kjøres som et applikasjonsprogrammeringsgrensesnitt (API), lagt til Office 365-programmer eller integreres i nye plattformer og tjenester. På grunn av dette er det ikke noe enkelt Azure Speech to Text-grensesnitt. Hva sluttbrukeren vil se, avhenger av hvordan Azure Speech to Text er integrert.

Azure online-portalen er intuitiv og enkel å bruke.

I mellomtiden vil utvikleren som administrerer Azure gjøre det gjennom Microsofts online Azure Portal, som føles moderne og er enkel å navigere. Det tar bare noen få minutter å finne ressurssiden for taletjenester, og når en forekomst er lagt til kontoen din, kan overvåkingsvarsler og bruk vises i et enkelt vindu.

Microsoft Azure tale til tekst: ytelse

Som en del av vår Microsoft Azure Speech to Text-gjennomgang var vi opptatt av å se hvordan denne plattformen taklet utfordringen med å behandle rå stemmeopptak, så når Azure-kontoen vår var klar til bruk, lastet vi opp en serie klipp med varierende nivåer av bakgrunnsstøy . Over hele linjen gjorde Azure en god jobb med å behandle prøvene våre, da vi ikke så mer enn en håndfull feil i løpet av evalueringen.

Aktivering av Azures tilpassede talemodell forbedret transkripsjonsnøyaktigheten.

Azure slet litt med å behandle uvanlige eller spesialuttrykk som navn på idrettslag og vitenskapelige termer i begynnelsen, men dette ble raskt løst ved å aktivere alternativet for tilpasset modellutdata. Når vi hadde aktivert dette alternativet, kunne Azure tilpasse seg den unike ordforrådet og talestilen vi brukte.

Microsoft Azure tale til tekst: Støtte

For å lære hvordan du kan samhandle med Azure Speech Services SDK gjennom forskjellige programmeringsspråk og integrere Azure Speech to Text-funksjonene i din egen plattform, trenger du definitivt litt hjelp. Heldigvis har Microsoft laget en omfattende katalog med opplæringsmateriell for Azure-plattformen, der du finner kodeeksempler og nyttige tips.

Opplæringsdelen av Azure-nettstedet inneholder mange nyttige ressurser.

I tillegg får alle Azure-kunder gratis fakturering og abonnementsadministrasjonsstøtte som er tilgjengelig via et billettsystem. Mer inngående støtte kan legges til kontoen din mot en gjentakende avgift, fra $ 29 per måned.

Microsoft Azure tale til tekst: Endelig dom

Azure Speech to Text-plattformen bruker banebrytende teknologi for å tilby en nesten perfekt transkripsjonstjeneste. Det er best egnet for bedrifter som allerede er investert i Microsoft Office 365-økosystemet, fordi tilpassede tale- og ordforrådsmodeller kan genereres sikkert fra det eksisterende dokumentarkivet ditt. Noen små bedrifter kan slite med Azure, da det krever oppmerksomhet fra en kvalifisert Microsoft skyutvikler å sette den opp riktig.

Konkurransen

Amazon Transcribe, Google Cloud Speech-to-Text og Watson Speech to Text er direkte konkurrenter til Microsoft Azure. Disse tre plattformene er også i stand til å utføre batch-transkripsjoner med høyt volum nøyaktig. Google Cloud er den eneste nære konkurrenten som kan jobbe med flere språk enn Azure, men det er dyrere, med en starthastighet på bare 0,006 dollar per 15 sekunder, sammenlignet med Azures 0,017 dollar per minutt (0,00425 dollar per 15 sekunder).

For å finne andre alternativer til Microsoft Azure tale til tekst, sjekk ut vår beste tale-til-tekst programvareveiledning.

Interessante artikler...