Slik transkriberer du lyd til tekst: hva du trenger for å få best mulig resultat

Innholdsfortegnelse:

Anonim

I lang tid var tale til tekstteknologi mer en gimmick enn en ekte forretningsteknologi. Imidlertid har tidene endret seg. I dag er den beste tale-til-tekst-programvaren seriøst avansert, og forretningsapplikasjoner utvides raskt. Vi spår en eksponentiell økning i bruken av dikteringsprogramvare de neste årene, både på forbruker- og forretningsnivå.

Denne artikkelen forklarer hvordan du kan få mest mulig ut av disse teknologiene for å oppnå transkripsjoner av høy kvalitet gang på gang.

Trinn 1: Mikrofon

Et av de viktigste trinnene i vellykket lydtranskripsjon er å bruke en kvalitetsmikrofon. En mikrofonoppstilling av høy kvalitet gjør det mulig for dikteringsprogramvaren å høre stemmen din tydeligere. Mikrofonen kan også plasseres på et optimalt sted. Mens mange innebygde datamikrofoner er akseptable og absolutt har forbedret seg de siste årene, anbefaler vi en ekstern mikrofon hvis du vil ha de beste lydtranskripsjonsresultatene.

Uten å gå for dypt inn i detaljene, fungerer programvare for tale til tekst ved å oppdage fonemer i tale, hvorav det er 44 på engelsk. Fonemer er de grunnleggende lydene som utgjør ordene vi snakker, og det er disse lydene dikteringsprogramvaren er designet for å lytte etter. En mikrofon av dårlig kvalitet vil gjøre det vanskeligere for programvaren å skille mellom lignende lyder, for eksempel B eller P, noe som fører til mindre nøyaktig lydtranskripsjon.

En ekstern mikrofon kan også plasseres på et optimalt sted for å maksimere taleopptak og klarhet. Mikrofoner av topp kvalitet begrenser også bakgrunnsstøy (akilleshælen med nøyaktig taletranskripsjon). Mens innebygde mikrofoner ofte hindres av andre gjenstander eller ikke vender direkte mot høyttaleren, kan en ekstern mikrofon plasseres rett foran høyttaleren, noe som øker klarheten. Hvis du planlegger å bruke programvare for tale-til-tekst regelmessig, anbefaler vi å investere i en mikrofon av høy kvalitet.

En Yeti-mikrofon er ideell for transkripsjon.

Trinn 2: Invester i topp-ytende tale-til-tekst-programvare

Selvfølgelig vil programvaren du velger å bruke, også ha en betydelig innvirkning på nøyaktigheten til lydtranskripsjonen. Ikke all tale-til-tekst-programvare er lik, og noen vil konsekvent levere bedre resultater enn andre. Det er derfor verdt å nevne noen generelle tips du må huske på når du leter etter en programvareleverandør.

Tidligere stolte de fleste programvareplattformene for tale til tekst på innebygde lokale ordbøker for å konvertere lyd til tekst. Programvaren vil lytte til fonemene i tale og sammenligne disse med oppføringer i ordboken. Selv om denne metoden ikke krever internettforbindelse, er den ofte unøyaktig. Dette er fordi programvaren ville lytte til hvert ord isolert, og forsømme den bredere konteksten der ordet ble brukt. Mangelen på internettforbindelse betyr også at disse dikteringsplattformene bare kan forstå det angitte antall ord som finnes i plattformens ordbok.

Imidlertid er de fleste moderne stemmetypeteknologier avhengige av at eksterne servere og læringsalgoritmer fungerer. Mange bruker også kunstige nevrale nettverk. Denne formen for dyp læring gjør at programvaren kan lytte til både ord og setninger og kryssreferanse talen din med store mengder tidligere data den har samlet inn. Plattformen kan dermed forbedres kontinuerlig, lære hvordan vi bruker språk og gjøre mindre endringer i transkripsjonen din mens du fortsetter å snakke og legge til detaljer.

Dermed anbefaler vi å investere i en plattform som krever internettforbindelse og benytter kunstige nevrale nettverk som en del av back-end-infrastrukturen.

Kunstige nevrale nettverk er stadig vanligere i dikteringsprogramvare.

Inkluderer den valgte lydtranskripsjonstjenesten støtte for flere språk? For noen virksomheter er dette ikke et stort problem. For andre er det ikke omsettelig. Hvis organisasjonen din samhandler med andre språk enn engelsk, kan tale-til-tekst-programvare være nyttig, slik at du kan føre oversikt over diskusjoner eller forhandlinger på flere språk.

Kombinert med oversettelsesprogramvare (som for det meste bruker den samme teknologien), kan en avansert lydtranskripsjonsløsning gjøre det mulig for bedriften din å tilby virkelig flerspråklige tjenester til kunder og kunder.

Microsoft Word er ledende innen flerspråklig tale-til-tekst-programvare.

Trinn 3: Et rolig sted

Selv om du har investert i en mikrofon med bakgrunnsstøyreduksjon, hjelper det å finne et rolig sted for å overføre lyd til tekst. I et stille rom vil programvaren ikke ha noe problem med å dechiffrere finessene til stemmen din, noe som blir eksponentielt vanskeligere i et overfylt kontor eller en travel gate.

Hvis organisasjonen sannsynligvis regelmessig bruker tale-til-tekst-programvare, kan det være lurt å vurdere å sette opp et rom spesielt for lydtranskripsjon. Å bruke et møterom eller annen sjelden brukt plass vil også være et passende valg.

Hvis du ikke tror oss, kan du prøve å bruke transkripsjonsprogramvaren i både et stille rom og et høyt rom. Du vil raskt se forskjellen i transkripsjonsnøyaktighet.

Trinn 4: En liste over talekommandoer

Mest tale-til-tekst programvare kommer med en liste over talekommandoer. Disse kommandoene lar deg kontrollere skrift, tegnsetting og farger som brukes i teksten, samt formateringen av dokumentet. Å ha en utskrevet liste over disse kommandoene foran deg vil gjøre lydtranskripsjon til en mye mer sømløs prosess. Det vil spare deg for betydelig tid, i hvert fall når du starter.

Talekommandoer for Microsoft Words tale-til-tekst-programvare.

Konklusjon

Litt forberedelse og planlegging kan gjøre lydtranskripsjon fra irriterende og frustrerende til effektiv og tilfredsstillende. Teknologien har avansert raskt de siste årene. Vi tror at vi nå går inn i en tid der bedrifter over hele verden bruker stemmeskriving og transkripsjonsteknologi for mange av deres daglige forretningsaktiviteter.

Ikke gå glipp av bølgen, og vurder om tale-til-tekst-programvare passer for din organisasjon.

  • Vi har omtalt den beste tekst-til-tale-programvaren.