ASCII, UTF-8, ISO-8859 ... Du kanske har sett dessa konstiga monikrar flytande runt, men vad gör de betyder egentligen? Läs vidare när vi förklarar vilken teckenkodning som är och hur dessa akronymer hänför sig till den vanliga texten vi ser på skärmen.
När vi pratar om skrivspråk talar vi om bokstäver som byggstenar av ord, som sedan bygger meningar, stycken och så vidare. Brev är symboler som representerar ljud. När du pratar om språk, pratar du om grupper av ljud som kommer samman för att bilda någon form av mening. Varje språksystem har en komplex uppsättning regler och definitioner som styr dessa betydelser. Om du har ett ord är det värdelöst om du inte vet vilket språk det är från och du använder det med andra som talar det språket.
(Jämförelse av Grantha, Tulu och Malayalam-skript, Bild från Wikipedia)
I världen av datorer använder vi termen "karaktär". Ett tecken är ett abstrakt begrepp definierat av specifika parametrar, men det är den grundläggande betydelseenheten. Latinet 'A' är inte detsamma som en grekisk 'alfa' eller en arabisk 'alif' eftersom de har olika sammanhang - de är från olika språk och har något annorlunda uttal - så vi kan säga att de är olika karaktärer. Den visuella representationen av ett tecken kallas en "glyph" och olika uppsättningar av glyfer kallas teckensnitt. Grupper av tecken tillhör en "set" eller en "repertoar".
När du skriver ett stycke och ändrar teckensnittet ändrar du inte bokstavens fonetiska värden, du ändrar hur de ser ut. Det är bara kosmetiskt (men inte obetydligt!). Vissa språk, som gamla egyptiska och kinesiska, har ideogram; Dessa representerar hela idéer istället för ljud, och deras uttalanden kan variera över tid och avstånd. Om du ersätter en karaktär för en annan, ersätter du en idé. Det är mer än att bara ändra bokstäver, det ändrar ett ideogram.
(Bild från Wikipedia)
När du skriver något på tangentbordet eller laddar en fil, vet hur datorn ska visas? Det är vad teckenkodning är för. Text på din dator är inte egentligen bokstäver, det är en serie parade alfanumeriska värden. Teckenkodningen fungerar som en nyckel för vilka värden motsvarar vilka tecken, precis som hur ortografi dikterar vilka ljud som motsvarar vilka bokstäver. Morskod är en typ av teckenkodning. Det förklarar hur grupper av långa och korta enheter som piper representerar tecken. I Morse-koden är tecknen bara engelska bokstäver, siffror och fullstopp. Det finns många datorkodkodningar som översätts till bokstäver, siffror, accentmarkeringar, skiljetecken, internationella symboler och så vidare.
Ofta om detta ämne används termen "kodsidor" också. De är i huvudsak teckenkodningar som används av specifika företag, ofta med små förändringar. Exempelvis är koden för Windows 1252-koden (tidigare känd som ANSI 1252) en modifierad form av ISO-8859-1. De används mest som ett internt system för att referera till standard och modifierade teckenkodningar som är specifika för samma system. I början var teckenkodning inte så viktigt eftersom datorer inte kommunicerade med varandra. Med internet som stiger till framträdande och nätverk är ett vanligt förekommande, har det blivit en allt viktigare av våra dagliga liv utan att vi ens inser det.
(Bild från sarah sosiak)
Det finns många olika teckenkodningar där ute, och det finns många skäl till det. Vilken teckenkodning du väljer att använda beror på vad dina behov är. Om du kommunicerar på ryska, är det meningsfullt att använda en teckenkodning som stöder cyrillisk väl. Om du kommunicerar på koreanska, vill du ha något som representerar Hangul och Hanja bra. Om du är matematiker, vill du ha något som har alla de vetenskapliga och matematiska symbolerna representerade bra, liksom de grekiska och latinska glyferna. Om du är en prankster kanske du kan dra nytta av upp och ner text. Och om du vill att alla typer av dokument ska ses av någon person, vill du ha en kodning som är ganska vanlig och lättillgänglig.
Låt oss ta en titt på några av de vanligaste.
(Utdrag av ASCII-tabellen, Bild från asciitable.com)
(Utdrag av tibetanskt skript, Unicode v4, från unicode.org)
Tja, fungerar ASCII för de flesta engelska talare, men inte för mycket annat. Ofta ser du ISO-8859-1, som fungerar för de flesta västeuropeiska språken. De andra versionerna av ISO-8859 arbetar för cyrilliska, arabiska, grekiska eller andra specifika skript. Om du vill visa flera skript i samma dokument eller på samma webbsida kan UTF-8 dock ge mycket bättre kompatibilitet. Det fungerar också riktigt bra för personer som använder ordinarie interpunktion, matte-symboler eller karaktärsfigurer, t.ex. kvadrater och kryssrutor.
(Flera språk i ett dokument, Skärmdump av gujaratsamachar.com)
Det finns nackdelar med varje uppsättning, dock. ASCII är begränsad i skiljetecken, så det fungerar inte otroligt bra för typografiskt korrekta ändringar. Har du någonsin typ kopiera / klistra in från Word bara för att ha någon konstig kombination av glyfer? Det är nackdelen med ISO-8859, eller mer korrekt, det antas att den är kompatibel med OS-specifika kodsidor (vi tittar på DIG, Microsoft!). UTF-8: s största nackdel är brist på korrekt stöd vid redigering och publicering. Ett annat problem är att webbläsare ofta inte tolkar och bara visar byte-ordningens märke för ett UTF-8-kodat tecken. Detta resulterar i att oönskade glyfer visas. Och självklart är det svårt för webbläsare att göra dem korrekt och för att sökmotorer ska kunna indexera dem på ett korrekt sätt, och deklarerar att en kodning och användning av tecken från en annan utan att de förklarar / hänvisar dem ordentligt på en webbsida.
För egna dokument, manuskript och så vidare kan du använda allt du behöver för att få jobbet gjort. Så långt som webben går, verkar det som om de flesta är överens om att använda en UTF-8-version som inte använder ett byte-ordning, men det är inte helt enhälligt. Som du kan se har varje teckenkodning sin egen användning, sammanhang och styrkor och svagheter. Som slutanvändare behöver du förmodligen inte hantera detta, men nu kan du ta extra steg framåt om du väljer det.
Har din Android-telefon ett antivirusprogram?
Mediet är fullt av rapporter som säger att Android-malware exploderar och att Android-användare är i fara. Betyder det att du bör installera en antivirusapp på din Android-telefon eller -tablet? Medan det kan finnas en hel del Android-malware i det vilda, visar en Android-beskydd och studier från antivirusföretag att du säkert är säker om du följer några grundläggande försiktighetsåtgärder.
Hur man aktiverar (och felsöker) fjärråtkomst till din Plex Media Server
Plex Media Server fjärranslutning är vanligtvis så smidig att den är praktiskt taget magisk. Men om du har problem med att få tillgång till dina filmer långt ifrån, är vi här för att hjälpa. Om du använder Plex Media Server för att titta på innehåll på ditt lokala nätverk (som att visa dina favoritprogram på din HDTV eller smartphone) du kanske inte har gett mycket om fördelarna med fjärråtkomst.