Hvordan visualisere komplekse data på Linux

Innholdsfortegnelse:

Anonim

Du har sikkert hørt om Elasticsearch - søkemotoren som lar deg indeksere og deretter raskt søke gjennom dataene dine. Du har kanskje laget noen visualiseringer i Kibana, GUI for Elasticsearch, som peker og klikker deg gjennom det elegante grensesnittet.

Det du kanskje ikke har brukt, er et mindre kjent visualiserings-plugin som heter Timelion.

Timelion er et fantastisk visualiseringsverktøy som gjør det mulig å skrive ut spørsmålene sine på det enkle og kraftige ekspreskspråket for å vise grafer. Den brukes til å vise tidsseriedata som befolkningsvekst eller treff på nettstedet ditt.

  • Her er en liste over de beste bærbare datamaskinene for utviklere
  • Sjekk disse beste distroene for utviklere
  • Knus tallene enkelt på disse beste arbeidsstasjonene
Om denne artikkelen

Denne artikkelen dukket opp først i Linux Format Magazine, utgave # 269, publisert i november 2022-2023.

Med Timelion kan vi beregne glidende gjennomsnitt, vise forskjellen mellom dataene for forrige uke og i dag, og gjøre noen grunnleggende avviksdeteksjoner. Det er et nyttig verktøy for å vite hvordan du kan jobbe med. La oss komme i gang.

Installasjon

Hvis du er en vanlig Linux Format-leser, er det dockereksempler for å sette opp en klynge i LXF261.

Ellers er det enkelt å installere Elasticsearch og Kibana. Det eneste kravet er Java, som du kanskje allerede har installert.

Hvis ikke en enkel sudo apt installere standard-jre installerer den på Debian-baserte distroer eller en sudo dnf install java bør gjøre det samme for Red Hat-familien av distroer.

Da trenger du bare å laste ned den nyeste versjonen av Elasticsearch og Kibana for ønsket operativsystemsmak.

I skrivende stund er den siste versjonen kibana-7.8.1-linux-x86_64.tar.gz.

Du kan trekke den ut med tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, endre til den ekstraherte katalogen og kjøre ./bin/kibana & for å fyre opp Kibana-forekomsten.

Når du har gjort nøyaktig de samme trinnene for å konfigurere Elasticsearch, og erstatte 'kibana' for 'elasticsearch', bør du kunne navigere til http: // localhost: 5601 i favorittleseren din og se et skinnende nytt Kibana-grensesnitt å spille rundt med.

Hvis du foretrekker å installere pakker med en pakkebehandling, har den samme lenken som før informasjon om hvordan du legger til Elastic repo i systemet ditt og installerer Kibana og Elasticsearch-pakkene på den måten.

Du kan legge grafer oppå hverandre og bruke formatering for å få grafene dine til å se best mulig ut.

Få litt data

Nyere versjoner av Kibana gjør det mulig å innta datasett i klyngen vår automatisk med Data Visualizer i stedet for å måtte lage et skript eller Logstash-konfigurasjon. Det kan håndtere datasett i JSON- eller CSV-format, samt noen standard loggfiler som Apache-logger. Den eneste begrensningen er at de er mindre enn 100 MB i størrelse. Dette er mer enn nok for våre formål.

Vi bruker Covid-19 cases verdensomspennende datasett fra EUs Open Data Portal. Vi lastet ned CSV-filen fra Ressursdelen på siden.

Hvis du har problemer, kan du velge å laste ned Excel .xlsx-versjonen i stedet, åpne med LibreOffice Calc og lagre den som tekst CSV (.csv) -format. Det er også en JSON-versjon tilgjengelig for nedlasting som du kan bruke som et alternativ.

For å komme til Data Visualizer i Kibana, klikk på hamburgerikonet øverst til venstre, deretter Machine Learning og til slutt Data Visualizer. Når du har klikket Last opp fil i Importer data-boksen, velg eller dra og slipp en fil og velg csv-filen du vil innta.

Etter en kort analyse vil den vise noen statistikk om at den er oppdaget fra de første 1000 linjene i CSV-filen. Dette vil være hvilket format det mener hvert av feltene er i, for eksempel tekst, dato eller nummer, og markere de øverste verdiene som finnes i feltene.

Det gjør vanligvis en god jobb å finne ut av dette for oss. Hvis du trengte å gjøre noen justeringer, kan du klikke Overstyr innstillinger for å endre - for eksempel navnet på feltet slik det blir angitt i Elasticsearch.

Et feltnavn som vi bør overstyre er datoRep, som representerer datoen for det beregnede tallet i datasettet vårt. Timelion vet ikke hvordan man bruker dette som tidsfelt som standard, så vi kan forenkle livet vårt senere ved å gi nytt navn til dette feltet til noe det vil gjenkjenne.

En god kandidat er tidsstempel. Klikk Bruk for å angi det. Når du er fornøyd med hvordan resten av den ser ut, klikker du Importer nederst, gir indeksen et navn - vi valgte covid - og klikk deretter Importer igjen for å få dataene inn i klyngen din.