Watson tale til tekstanmeldelse: Den beste transkripsjonstjenesten med høyt volum?

Innholdsfortegnelse:

Anonim

Watson er IBMs datasystem for behandling av naturlige språk. Den driver den berømte spørsmålssvarende superdatamaskinen i tillegg til en serie AI-baserte bedriftsprodukter, inkludert Watson Speech to Text. I Watson Speech to Text-gjennomgangen tar vi en titt på en av de beste tale-til-tekst-appene rundt, ideell for alle som ønsker å konvertere lyd til tekst i stor skala.

Watson talebehandlingsplattform er tilgjengelig på IBM Cloud. Det er et allsidig verktøy og kan brukes i mange sammenhenger, inkludert diktering og transkripsjon av konferansesamtaler. I tillegg til, i motsetning til de fleste andre tale-til-tekst-apper, er den tilgjengelig som API, slik at utviklere blant annet kan legge den inn i stemmekontrollsystemer.

Watson tale til tekst: planer og priser

Du kan bruke Watson Speech to Text til å behandle opptil 500 minutter med lyd gratis per måned. Hvis du vil konvertere mer enn det, må du betale for hvert lydminutt, og hastigheten endres basert på lydbehandlingen. Kostnadene varierer fra $ 0,01 til $ 0,02 per minutt, og det er en tilleggsavgift på $ 0,03 per minutt hvis du trenger IBMs tilpassede språkmodell. Premium-tilbud bare Watson-planer er også tilgjengelige, og disse gir tilgang til forbedrede personvernfunksjoner og oppetidsgarantier.

Watsons tale-til-tekst-tjeneste er priset basert på volumet av innhold du trenger å transkribere.

Du kan også få tilgang til Watson tale til tekst-systemet gjennom et generelt IBM Cloud-abonnement. Naturlig språkbehandling er bare en app i et bredt spekter av AI-tjenester du kan få gjennom IBM Cloud, så dette er et godt alternativ for enhver organisasjon som trenger tilgang til høyhastighets dataoverføring, chatbots eller tekst-til-tale-verktøy.

Watson tale til tekst: funksjoner

Takket være fleksibel API-integrasjon og andre forhåndsbygde IBM-verktøy, går Watson talegjenkjenningstjeneste langt utover grunnleggende transkripsjon. Hvis du for eksempel vil bruke den i en kundeservicekontekst, kan Watson Assistant settes opp til å behandle spørsmål om naturlige språk direkte eller svare på spørsmål over telefon.

I Watson har IBM satt sammen en funksjonsrik prosesseringsplattform for naturlig språk.

Watson jobber med live lyd på 11 språk og kan importere lyder i en rekke forhåndsinnspilte formater. I sanntid betyr diagnostisk støtte i sanntid at Watson kan be brukere om å komme nærmere mikrofonen eller endre miljøet. Imponerende er også det faktum at Watson kan skille mellom forskjellige høyttalere i en delt samtale takket være Speaker Diarization, en funksjon som fortsatt er i beta-testing.

Watson tale til tekst: Oppsett

For å bruke Watson er det første du må gjøre å opprette en IBM Bluemix-konto. Registreringen er gratis og smertefri, og krever bare en e-postadresse og passord. Når du er logget inn, må du legge til en avtale på kontoen din for Tale til tekst-tjenesten. Du vil få et par legitimasjoner på dette stadiet som du bør lagre i dine egne poster.

Det er nødvendig å registrere seg for en IBM Bluemix-konto for å få tilgang til Watsons komplette funksjonssett.

Etter at du har gjort det, blir ting betydelig mer komplekse. For å få tilgang til Watson, må du legge til påloggingsinformasjonen til en gruppe med klientuniform ressurssøkerkode (cURL) og deretter kjøre den på maskinen din. For å finne ut nøyaktig hvilken kommando du skal ringe, sjekk ut denne praktiske guiden. Alternativt, hvis du bare vil se hvor godt Watson-systemet fungerer uten å måtte hoppe gjennom alle bøylene, kan du prøve det på IBMs demoside i stedet.

Watson tale til tekst: grensesnitt

I motsetning til tale-til-tekst-apper som vender seg mot forbrukerne, er Watsons tjenester designet for å være tilgjengelig via APIer og kode innebygd i andre systemer. Av denne grunn er det ikke noe ekte Watson-grensesnitt. I stedet kan du få tilgang til Watson gjennom tre forskjellige internettprotokoller. Dette er WebSockets, REST API og Watson Developer Cloud.

Watson tale til tekst kan administreres gjennom Watson Developer Cloud-systemet.

For å kontrollere Watson, må du bruke et kommandolinjeverktøy som kobles til IBMs sky via en av disse tre rutene. Grensesnittet som sluttbrukeren som samhandler med Watson ser, må bygges av noen på utviklingsteamet ditt separat.

Watson tale til tekst: ytelse

Samlet sett var vi imponert over måten denne naturlige språkbehandlingsplattformen håndterte ekte tale på. Vi brukte Watson til å transkribere klipp vi spilte inn i en rekke utfordrende miljøer, så vel som lydbiter av berømte taler gitt på flere av Watsons 11 støttede språk.

Vi fant ut at Watson presterte bra med forhåndsinnspilt tale.

Selv om feil vokste oftere for klipp med mye bakgrunnsstøy, genererte Watson generelt utrolig nøyaktige resultater. Vi vil anslå ut fra testene våre at uoppfordrede feil bare skjedde en gang hvert 150 ord i gjennomsnitt. Imidlertid ble det klart hvorfor Watsons Speaker Diarization-funksjon forblir i BETA-testing, da en stemme flere ganger under vår evaluering ble feilmerket som separate høyttalere.

Watson tale til tekst: støtte

IBM ressurssenter tilbyr rikelig med dokumentasjon for å bedre forstå hvordan du bruker Watson på din spesielle brukssak. Det er også verdt å bruke API-integrasjoner og SDKer opprettet av Watson-utviklermiljøet og lagt ut til GitHub.

Watson API GitHub-siden er en god støttekilde for Watson Speech to Text-tjenesten.

Hvis du ikke finner løsningen på problemet ditt der, kan du kontakte IBM direkte ved å åpne en supportbillett eller kontakte dem via telefon. Så lenge du valgte en av premium Watson-pakkene, vil Watson-bruken din bli beskyttet av en servicenivå Uptime-avtale.

Watson tale til tekst: Endelig dom

Hvis organisasjonen din har kunnskapen og ressursene til å integrere IBM Watson Speech to Text-plattformen ordentlig i systemet ditt, vil du dra nytte av avanserte funksjoner som sanntids lydmiljødiagnostikk og midlertidige transkripsjonsresultater. Imidlertid vil små bedrifter og organisasjoner slite med den tekniske utfordringen med å sette Watson ordentlig opp.

Konkurransen

IBM Watson Speech to Text-tjenesten er en direkte konkurrent til bulk-transkripsjonstjenester Google Cloud Speech-to-Text og Amazon Transcribe. Begge disse er betydelig billigere enn Watson, med for eksempel Google Cloud-transkripsjon, fra $ 0,006 per minutt. Alle tre tjenestene deler lignende funksjoner, for eksempel tilpasset ordforråd, men en funksjon som mangler veldig fra IBM Watson, men som er tilgjengelig med begge konkurrentene, er automatisk gjenkjenning av tegnsetting.

Leter du etter en annen tale-til-tekst-løsning? Sjekk ut vår beste tale-til-tekst programvareveiledning.