Gjennomgang av Google Voice Typing

Det blir stadig mer vanlig å bruke tale til å kontrollere hjemmene og datamaskinene våre. Der det bare for ti år siden ba Alexa eller Google Home om å kontrollere lysene, eller bestille et produkt fra internett, kunne ha virket uvanlig, men det er nå normen.

Et av selskapene som har investert mest i denne typen teknologi er Google, som gjør det mulig for Google Home-enheter og Android-systemer å godta verbale kommandoer, og til og med gjenkjenne høyttaleren.

I dag skal vi se på hvordan de har koblet denne teknologien til Google Docs-plattformen, og vurdere om dette er et levedyktig alternativ til andre kommersielle tale-til-tekst-løsninger.

Priser

Programvaren er inkludert i Google Docs, og er iboende gratis. Alt du trenger for å bruke den er en Google-konto og enten en mobilenhet eller datamaskin med mikrofon. Det er en annen datakilde for Google å høste, men det er en del av prisen på "gratis" i disse dager.

Design

Det er mulig å bruke tale til inndata på Google Docs, funksjonen kalles ‘Voice Typing’, og finnes på Verktøy-menyen på et Google Doc eller i Google Slides. Den kan også aktiveres på begge steder ved hjelp av hurtigtasten Ctrl-Shift-S.

Når du aktiverte den for første gang, blir du bedt om å sanksjonere tilgang til mikrofonen for docs.google.com.

Når du har godtatt at det vises en liten boks med mikrofonlogo på, kan du klikke for å aktivere taleinngang. Dette blir deretter erstattet med et rødt mikrofonsymbol ved siden av dokumentet for å indikere at systemet er i lyttemodus.

Før du aktiverer stemmeskriving av kontrollpanelet, kan du velge et språk fra en meny, og siden dette er Google, er det mange valg. Og du kan også klikke på et spørsmålstegn og få litt hjelp om hvordan du bruker systemet.

Når disse systemene går, er dette en svært kondensert løsning.

Google vil behandle det du sier etter beste evne, og hvis systemet er usikkert nøyaktig om et ord, vil det understreke det i grått. Disse 'mistenkte' ordene kan deretter klikkes på og noen alternativer tilbys av systemet.

Men du kan raskt bevege deg rundt i et dokument og fikse problemer manuelt eller plassere markøren og gi Voice Typing en ny stikk mot det.

Hvis du trenger å snakke med en annen person mens du jobber, kan du be Google om å slutte å lytte, og deretter fortsette etterpå.

Men for å få full mulighet til denne løsningen er det en lang liste med kommandoer som må huskes, som kan kopiere, lime inn, flytte rundt i dokumentet, sette inn tabeller og et utall andre funksjoner.

Og du kan sette inn tegnsetting, formatere dokumentet og til og med sette inn hyperkoblinger.

Men å få mest mulig ut av det forutsetter at du kan huske kommandoene, eller ha hjelpen åpen for å jogge minnet ditt.

En liste er raskt tilgjengelig ved å si 'Stemmekommandoliste', praktisk.

Språk

Der mange tale-til-tekst-løsninger bare dekker et lite antall språk, har Googles et betydelig beløp. Den nåværende definitive listen er:

Afrikaans, amharisk, arabisk, arabisk (Algerie), arabisk (Bahrain), arabisk (Egypt), arabisk (Israel), arabisk (Jordan), arabisk (Kuwait), arabisk (Libanon), arabisk (Marokko), arabisk (oman) , Arabisk (Palestina), Arabisk (Qatar), Arabisk (Saudi-Arabia), Arabisk (Tunisia), Arabisk (De forente arabiske emirater), Armensk, Aserbajdsjansk, Bahasa Indonesia, Baskisk, Bengali (Bangladesh), Bengali (India), Bulgarsk, Katalansk, Kinesisk (forenklet), Kinesisk (tradisjonell), Kinesisk (Hong Kong), Kroatisk, Tsjekkisk, Dansk, Nederlandsk, Engelsk (Australia), Engelsk (Canada), Engelsk (Ghana), Engelsk (India), Engelsk (Irland) , Engelsk (Kenya), Engelsk (New Zealand), Engelsk (Nigeria), Engelsk (Filippinene), Engelsk (Sør-Afrika), Engelsk (Tanzania), Engelsk (Storbritannia), Engelsk (USA), Farsi, Filippinsk, Finsk, Fransk , Galisisk, georgisk, tysk, gresk, gujarati, hebraisk, hindi, ungarsk, islandsk, italiensk, italiensk (Italia), italiensk (Sveits), japansk, javanesisk, kannada, khmer, koreansk, laotisk, lettisk, litauisk, malayalam, Malaysia n, marathi, nepalesisk, norsk, polsk, portugisisk (Brasil), portugisisk (Portugal), rumensk, russisk, slovakisk, slovensk, serbisk, singalesisk, spansk, spansk (Argentina), spansk (Bolivia), spansk (Chile), spansk (Colombia), Spansk (Costa Rica), Spansk (Ecuador), Spansk (El Salvador), Spansk (Spania), Spansk (USA), Spansk (Guatemala), Spansk (Honduras), Spansk (Latin-Amerika), Spansk (Mexico ), Spansk (Nicaragua), spansk (Panama), spansk (Paraguay), spansk (Peru), spansk (Puerto Rico), spansk (Uruguay), spansk (Venezuela), sundanesisk, swahili (Kenya), swahili (Tanzania), Svensk, tamil (India), tamil (Malaysia), tamil (Singapore), tamil (Sri Lanka), thai, tyrkisk, ukrainsk, urdu (india), urdu (Pakistan), vietnamesisk og zulu.

Det er 119 språk, inkludert 13 arabiske former, 19 spanske varianter, 13 engelske dialekter og til og med fire smaker av tamil.

Det er inkludert språk som sjelden støttes av dikteringsprogramvare, som zulu og islandsk, på grunn av det relativt få antallet høyttalere.

Språkdekning er trolig Google Voice Typing største styrke.

Opptak

Hvis denne løsningen har en svakhet, er det at den ikke enkelt kan behandle opptak.

Selv om det ikke er umulig å få det til å gjøre dette, men det krever å lappe lydsystemet på datamaskinen slik at den tar utdata bestemt til høyttalerne og styrer det som om det kommer fra mikrofonen. Men å gjøre dette lar deg ikke skille mellom forskjellige personer på opptakene, og det kan forstyrre AI som Google bruker for å gjøre verbal nøyaktighet bedre ved å lære hvordan du snakker.

Hvis du ønsker å transkribere podcaster eller innspilte intervjuer, anbefaler vi at du bruker noe annet, ettersom dette verktøyet ikke er laget for det formålet.

Nøyaktighet

Det er vanskelig å bedømme nøyaktigheten til et stemmebehandlingssystem når du ikke kan sende det de samme opptakene som andre produkter har konvertert. Og alle som bruker Alexa eller Google Home med jevne mellomrom, vil vite at det av og til ikke vil forstå oss, hovedsakelig på grunn av fremmede lyder eller inkonsekvent snakk.

Når det er sagt, i den aktive testen vi gjorde, fikk dette verktøyet vanligvis de fleste ordene riktige, eller det riktige ordet var raskt tilgjengelig på menyen for mistenkte ord.

For å oppnå de beste resultatene trenger du litt kontroll for å bli vist i hastighet, volum og tonetone, noe som utvilsomt følger med øvelsen. Å kunne huske alle spesialkommandoene kan også redusere mengden redigeringer som kreves etter innspilling.

Avhengig av forventningene dine, er nøyaktigheten her akseptabel. Det er en konsistens i tolkningene som den opprettholdt under testene våre. Hvor godt det fungerer for deg, kan vi ikke forutsi. Men siden det er gratis, vil det ikke koste noe annet enn din tid å bestemme det.

Sikkerhet

Siden dette er Google, er sikkerhetsmodellen den samme som kontrollerer tilgang til alle Google-kontoer. Det spenner fra enkel passordbeskyttelse opp til en mer rimelig til to-faktor autentisering (TFA) metode.

Gitt antall identitetstyver rundt, løper de som bruker Google uten TFA en betydelig risiko for å få kompromittert kontoene sine.

Selv dette sikkerhetsalternativet har sine grenser, men det er bedre enn bare et passord.

For de som ikke er tilstrekkelig paranoide, anbefaler vi på det sterkeste at du går til https://myactivity.google.com/myactivity

Og du vil se hva Google samler på deg daglig, og det kan omfatte opptak av talekommandoer.

Endelig dom

Dette kan være en lengre gjennomgang hvis denne programvaren tilbyr mer funksjonalitet, men det gjør det ikke.

Når det gjelder tale-til-tekst-løsninger, er denne ikke komplisert, men den har nok funksjonalitet til å være virkelig nyttig.

Andre løsninger er bygget for å håndtere transkribering av samtaler mellom flere mennesker, hvor dette ble designet for å håndtere en enkelt person som snakker på en kontrollert og presis måte.

Det som antas, er at du er glad for å bruke Google og Google Docs, selv om det ikke er det endelige målet for teksten du skriver inn.

Det er ingen oppgave å kopiere en limdiktat fra Google Docs til en annen applikasjon, og du vil ha en skykopi som referanse hvis du ender opp med å trenge en.

Noen brukere har forståelig nok problemer med å mate Googles umettelige appetitt på brukerdata, og denne mekanismen er enda en datakilde for at den skal snackes.

Hvis du føler for det, vil du ikke bruke Google Voice Typing eller noe fra Google.

For de som er villige til å akseptere hvor mye Google kanskje vet om dem, er stemmediktatløsningen i Google Dokumenter i stand til å brukes generelt, spesielt hvis du bare trenger denne funksjonaliteten av og til.

Interessante artikler...