Hvordan visualisere komplekse data på Linux

Du har sikkert hørt om Elasticsearch - søkemotoren som lar deg indeksere og deretter raskt søke gjennom dataene dine. Du har kanskje laget noen visualiseringer i Kibana, GUI for Elasticsearch, som peker og klikker deg gjennom det elegante grensesnittet.

Det du kanskje ikke har brukt, er et mindre kjent visualiserings-plugin som heter Timelion.

Timelion er et fantastisk visualiseringsverktøy som gjør det mulig å skrive ut spørsmålene sine på det enkle og kraftige ekspreskspråket for å vise grafer. Den brukes til å vise tidsseriedata som befolkningsvekst eller treff på nettstedet ditt.

Her er en liste over de beste bærbare datamaskinene for utviklere
Sjekk disse beste distroene for utviklere
Knus tallene enkelt på disse beste arbeidsstasjonene

Om denne artikkelen

Denne artikkelen dukket opp først i Linux Format Magazine, utgave # 269, publisert i november 2022-2023.

Med Timelion kan vi beregne glidende gjennomsnitt, vise forskjellen mellom dataene for forrige uke og i dag, og gjøre noen grunnleggende avviksdeteksjoner. Det er et nyttig verktøy for å vite hvordan du kan jobbe med. La oss komme i gang.

Installasjon

Hvis du er en vanlig Linux Format-leser, er det dockereksempler for å sette opp en klynge i LXF261.

Ellers er det enkelt å installere Elasticsearch og Kibana. Det eneste kravet er Java, som du kanskje allerede har installert.

Hvis ikke en enkel sudo apt installere standard-jre installerer den på Debian-baserte distroer eller en sudo dnf install java bør gjøre det samme for Red Hat-familien av distroer.

Da trenger du bare å laste ned den nyeste versjonen av Elasticsearch og Kibana for ønsket operativsystemsmak.

I skrivende stund er den siste versjonen kibana-7.8.1-linux-x86_64.tar.gz.

Du kan trekke den ut med tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, endre til den ekstraherte katalogen og kjøre ./bin/kibana & for å fyre opp Kibana-forekomsten.

Når du har gjort nøyaktig de samme trinnene for å konfigurere Elasticsearch, og erstatte 'kibana' for 'elasticsearch', bør du kunne navigere til http: // localhost: 5601 i favorittleseren din og se et skinnende nytt Kibana-grensesnitt å spille rundt med.

Hvis du foretrekker å installere pakker med en pakkebehandling, har den samme lenken som før informasjon om hvordan du legger til Elastic repo i systemet ditt og installerer Kibana og Elasticsearch-pakkene på den måten.

Du kan legge grafer oppå hverandre og bruke formatering for å få grafene dine til å se best mulig ut.

Få litt data

Nyere versjoner av Kibana gjør det mulig å innta datasett i klyngen vår automatisk med Data Visualizer i stedet for å måtte lage et skript eller Logstash-konfigurasjon. Det kan håndtere datasett i JSON- eller CSV-format, samt noen standard loggfiler som Apache-logger. Den eneste begrensningen er at de er mindre enn 100 MB i størrelse. Dette er mer enn nok for våre formål.

Vi bruker Covid-19 cases verdensomspennende datasett fra EUs Open Data Portal. Vi lastet ned CSV-filen fra Ressursdelen på siden.

Hvis du har problemer, kan du velge å laste ned Excel .xlsx-versjonen i stedet, åpne med LibreOffice Calc og lagre den som tekst CSV (.csv) -format. Det er også en JSON-versjon tilgjengelig for nedlasting som du kan bruke som et alternativ.

For å komme til Data Visualizer i Kibana, klikk på hamburgerikonet øverst til venstre, deretter Machine Learning og til slutt Data Visualizer. Når du har klikket Last opp fil i Importer data-boksen, velg eller dra og slipp en fil og velg csv-filen du vil innta.

Etter en kort analyse vil den vise noen statistikk om at den er oppdaget fra de første 1000 linjene i CSV-filen. Dette vil være hvilket format det mener hvert av feltene er i, for eksempel tekst, dato eller nummer, og markere de øverste verdiene som finnes i feltene.

Det gjør vanligvis en god jobb å finne ut av dette for oss. Hvis du trengte å gjøre noen justeringer, kan du klikke Overstyr innstillinger for å endre - for eksempel navnet på feltet slik det blir angitt i Elasticsearch.

Et feltnavn som vi bør overstyre er datoRep, som representerer datoen for det beregnede tallet i datasettet vårt. Timelion vet ikke hvordan man bruker dette som tidsfelt som standard, så vi kan forenkle livet vårt senere ved å gi nytt navn til dette feltet til noe det vil gjenkjenne.

En god kandidat er tidsstempel. Klikk Bruk for å angi det. Når du er fornøyd med hvordan resten av den ser ut, klikker du Importer nederst, gir indeksen et navn - vi valgte covid - og klikk deretter Importer igjen for å få dataene inn i klyngen din.