Suomen kielen kirjoittaminen Unicodea käyttäen (Juhapekka Tolvanen)

http://iki.fi/juhtolv/unicode/suomi.html

Viimeksi muutettu 21.8.2016.

”’Vaseliinia, vaseliinia!’, huusivat pilkut tuskissaan.”
Tuntematon

Merkkien näkyvyydestä eri WWW-selaimilla ja fonteilla
- Nopeat ohjeet
- Perusteellisemmat ohjeet
Johdanto
- Mikä tämä sivu on
- Mitä tämä sivu ei ole
Kirjaimet
Kolme pistettä
Lainausmerkit
Viivamerkit
Välilyönti
Euron merkki
Matematiikka
Immateriaalioikeuksiin liittyvät merkit
IPA-merkit ja ääntämisohjeet
Sekalaisia
Teinixmäisyyksiä
Linkit

Tämä WWW-sivu käyttää todella paljon Unicoden erilaisia merkkejä. Riippuen käyttämästäsi WWW‐selaimesta, fonttivalikoimasta ja fonttiasetuksista eri merkkien näkymisessä voi esiintyä ongelmia. Voit yrittää niiden ratkaisemiseen ainakin seuraavia keinoja:

Mitä todennäköisimmin jo nämä kaksi keinoa riittävät ratkaisemaan merkkien näkyvyyteen liittyvät ongelmasi tätä WWW‐sivua katsoessa. Kaupanpäälle kenties muillakin WWW‐sivuilla alkaa Unicoden eri merkit näkyä aiempaa paremmin näiden ohjeiden ansiosta.

Asenna Mozilla Firefox ellet ole asentanut jo ja käytä sitä tämän WWW‐sivun katselemiseeen. Se osaa tarvittaessa hakea käytetystä fontista puuttuvan glyyfin muista fonteista, kunnes se löytyy.
Asenna DejaVu-fontit. Niistä tulee toisinaan uusi versio, jossa on aina vaan laajemmin tuettu Unicoden merkkejä, joten niitä kannattaa myös päivitellä silloin tällöin, mutta kaikki tällä sivulla käytetyt merkit niissä taitaa jo nyt olla mukana. Tosin yleisimmissä GNU/Linux-jakeluissa DejaVu-fontit tulee asennetuksi jo oletuksena. Toisaalta, uusimmissa Androidin versioissa tulee mukana aina Googlen Noto-fontit.

Kokeile tämän WWW-sivun tarjoamia erilaisia vaihtoehtoisia tyylitiedostoja. Ainakin ”indexbwserif” ja ”indexbw” kannattaa kokeilla. Voit vaihtaa ne selaimen menuista tai sivun yläreunan linkkien avulla
Kokeile Microsoft Internet Explorerin lisäksi muita WWW-selaimia, esim. Mozilla Firefox, Konqueror, Safari ja Opera.
Kokeile Jukka K. Korpelan ehdottamia vinkkejä
Asenna DejaVu‐fontit (ja ota tavaksesi päivitellä niitä melko tiuhaan tahtiin).
Asenna muitakin Unicode-fontteja ja -fonttiperheitä mahdollisimman paljon, vaikkapa nämä (Asteriskilla merkittyjä kannattaa päivitellä enemmän tai vähemmän ahkerasti):
- Arial Unicode MS
- Asana Math
- Bitstream Cyberbit
- Charis SIL *
- Doulos SIL *
- Droid
- Everson Mono
- Free UCS Outline Fonts *
- Gentium *
- Junicode *
- Liberation Fonts
- Linux Libertine Open Fonts *
- Lucida Grande
- Lucida Sans Unicode
- Noto Fonts *
- STIX Fonts
- TITUS Cyberbit Basic
- XITS Fonts
Jos käytät jotain Unixia tai (vapaata) unixinkaltaista käyttöjärjestelmää ja sinulta löytyy hakemisto /etc/fonts, se tarkoittaa sitä, että sinulla on koneessasi ns. fontconfig. Asennettuasi mahdollisimman paljon kahdessa edellisessä kohdassa mainittuja fontteja (hakemistoon ~/.fonts tai /usr/local/share/fonts) hae tämä tiedosto: http://iki.fi/juhtolv/configs/fontconfig/99-juhtolv.conf.bz2 . Pura se ja asenna se käyttäen apunasi tiedoston alussa olevia asennusohjeita. Sitten säädä Firefox käyttämään sans serif ‐fonttina (eli pääteviivattomana fonttina) virtuaalifonttia nimeltä ”sans-serif” tms., serif‐fonttina (eli pääteviivallisena fonttina) virtuaalifonttia nimeltä ”serif” ja monospace-fonttina (eli tasavälisenä fonttina) virtuaalifonttia nimeltä ”monospace”.
Jos asiayhteydestä päätellen näyttää siltä, ettei ko. merkki ole kovin tärkeä, jätä se vaille huomiota.

Unicoden ansiosta suomen kielessä käytettäviä erikoisempiakin (väli)merkkejä on vihdoinkin mahdollista kirjoittaa tietokoneella oikein. Kaikki tuollaiset merkit löytyvät Unicodesta. Tämä sivu siis kertoo mahdollisimman kattavasti siitä, mitkä nuo merkit ovat ja miten niitä merkkejä sitten kuuluisi käyttää, jos kerran Unicoden käyttöön on ryhdytty, syystä tai toisesta – ja jos voidaan luottaa siihen, että Unicode todella toimii riittävän luotettavasti ko. käyttökohteessa. Toisinsanoen tämä sivu auttaa ymmärtämään Unicoden suomia monia mahdollisuuksia pelkän suomen kielen kirjoittamisessa, vaikka tokihan vielä enemmän Unicodesta on hyötyä kahden tai useamman eri kielen kirjoittamisessa samassa dokumentissa (esim. suomi ja tšekki) ja varsinkin jos ko. kielten kirjoitusjärjestelmätkin poikkeavat toisistaan (esim. suomi ja japani).

Tämä WWW‐sivu sai alkunsa näin: Minä huomasin, että tästä aiheesta on informaatiota olemassa vaikka kuinka, mutta se oli liian hajallaan ympäri WWW:tä ja varsinkin ympäri Jukka K. Korpelan WWW‐sivuja ja Wikipediaa. Oli siis koottava se kaikki mahdollisimman kattavasti yhteen paikkaan tällaiseksi käteväksi referenssiksi.

Tässä on tosin jonkin verran mukana ISO-LATIN-1:stä ja ISO-LATIN-9:stä löytyviä erikoismerkkejä, joita ei usein tule käytettyä edes silloin kun pitäisi, koska ne eivät löydy niin helposti näppäimistöltä. Enimmäkseen kyse on merkeistä, jotka ovat läheistä sukua merkeille, jotka löytyvät Unicodesta, muttei ISO-LATIN-1:stä ja ISO-LATIN-9:stä.

Eräs merkillepantava ilmiö, mikä tulee tällä sivulla usein esiin, on tämä vastakkainasettelu: ”Oikea merkki” vs. ”Oikean merkin korvike”. Usein on nimittäin käynyt niin, että tietokoneita ja niitten suppeita merkistöjä kehittettäessä kaksi tai useampia lyijykirjasinten aikakaudelta tuttua merkkiä onkin korvattu yhdellä; esim. merkkiä - (U+002D HYPHEN-MINUS) käytetäänkin korvaamaan mm. miinusmerkkiä ja ajatusviivaa. Unicodessa sensijaan on niin monta merkkipaikkaa, ettei moiselle enää ole tarvetta. Miksi siis tyytyä korvikkeisiin, kun on oikeitakin merkkejä käytettävissä?

Unicode‐koodauksista kenties yleisimmässä, eli UTF-8:ssa, ensimmäisen lohkon (Latinalainen perusosa) sisältämät 128 merkkiä osuvat yksiin US-ASCII:n merkkien kanssa kuin myös monien ISO-LATIN-merkistöjen ja jopa Windowsin koodisivujen kanssa. Senpä vuoksi US-ASCII:lla kirjoitettu tekstidokumentti näyttää samalta myös silloin, jos sen tulkitsee UTF-8:ana, ISO-LATIN-1:nä tai ISO-LATIN-9:nä. Ja jos sanon, että jokin tietty merkki löytyy jo US-ASCII:sta, niin se tarkoittaa aina myös sitä, että se merkki löytyy myös ISO-LATIN-1:stä ja ISO-LATIN-9:stä. US-ASCII:n merkkien käyttöä suomen kielessä ei tässä yhteydessä paljoa käsitellä. Sen sijaan tuon lohkon sisältämiä ”korvikemerkkejä” käsitellään kuin myös sitä, mitä merkkejä niitten sijaan tulisi Unicodea käyttävän käyttää.

Ja jos pilkkuunyhtymisestä ei enää saa tarpeeksi kiksejä, niin tämän avulla voi yhtyä vaihteeksi muihin välimerkkeihin ☺. No, leikki sikseen, mutta totta tosiaan, kaikki tämä on myös pilkkuunyhtymistä mutta ei pelkästään pilkkuunyhtymistä, mutta kaikki tämä vaivannäkö omalta osaltaan mahdollistaa sen, että saadaan aikaiseksi virheetöntä ja luettavaa suomen kieltä. Tietenkään pelkkä Unicoden hallitseminen ei auta, jos esim. ei hallita kielioppia ja jatkuvasti syyllistytään kirjoitusvirheisiin ja jos kirjotustyyli on kankeaa ja kaikkea muuta kuin lennokasta ja mukaansatempaavaa.

Tämän sivun ei ole tarkoitus ottaa kantaa siihen, pitäisikö Unicoden käyttöön ryhtyä. Sen sijaan sen on tarkoitus neuvoa ennenkaikkea niitä, jotka haluavat käyttää tai ovat alkaneet käyttää Unicodea syystä tai toisesta.

Tällä sivulla ei ole eritelty millään lailla sitä, miten paljon millekin näistä merkeistä on tai voi olla käyttöä kussakin Unicoden käyttökohteessa, kuten sähköposti, nyyssiryhmät, IRC ja paperille printtaamalla tehty Snail‐Mail. Sensijaan tämän on tarkoitus olla mahdollisimman yleiskäyttöinen ohje.

Joistakin Unicoden merkeistä en pysty kertomaan kovin täsmällisesti sitä, miten sitä ko. merkkiä kuuluisi käyttää eri tilanteissa. Silloin olen yleensä viitannut johonkin spesifisempään aiheesta kirjoitettuun WWW‐sivuun, joten kannattaa perehtyä siihen. Myöskin tämän sivun lopussa oleviin linkkeihin kannattaa perehtyä.

Tällä sivulla ei paljoa neuvota, miten näitä eri merkkejä saa syötettyä tai miten ne löytyvät näppäimistöltä. Se on lähinnä käyttöjärjestelmäkohtainen asia. Mutta yhden apuvälineen siihen tarkoitukseen kyllä tarjoan: Voit ladata itsellesi UTF-8‐merkistöllä kirjoittamani tekstitiedoston myunicode.txt ja tarvittaessa muokata sitä mieleiseksesi. Voit esim. tulostaa sen päätteeseen tai pääte‐emulaattoriin tai avata tekstieditoriin. Sen jälkeen voit kopypasteta sieltä tarvitsemiasi merkkejä haluamaasi kohteeseen. Mukana tuossa tekstifileessä on jonkin verran myös merkkejä, joista ei tällä WWW‐sivulla sanota halaistua sanaakaan; esim. eräitä vieraitten kielten merkkejä saatat tarvita ulkomaisten erisnimien kirjoittamisessa. Lisäksi kannattaa perehtyä Kotoistushankkeen kehittämään uuteen suomalaiseen monikieliseen näppäimistöön ja ottaa se käyttöönsä.

Tämän sivun lähtökohta on se, että jos jollekin asialle on ASCII‐ merkki ja semanttisesti spesifisempi Unicode‐merkki, niin suositaan yleensä jälkimmäistä. Mutta aina niin ei kannata tehdä. Monesti Unicode‐standardi jopa neuvoo toimimaan toisinpäin: Esim. SI‐järjestelmän mittayksikön nimeltä ohmi merkkihän on kreikan kielen iso aakkonen nimeltä oomega. Unicodesta löytyy erikseen varsinainen ohmin merkki Ω (U+2126 OHM SIGN), mutta Unicode‐standardi silti suosittelee käyttämään isoa oomegan merkkiä Ω (U+03A9 GREEK CAPITAL LETTER OMEGA) ohmin merkkinä. Unicoden on tarkoitus olla ”merkistöjen merkistö”, johon kaikkia muita merkistöjä on mahdollisuus konvertoida ja sen vuoksi tuollaisia ”turhia” merkkejä on Unicodessa mukana yhteensopivuussyistä. Monet niistä tulivat Unicodeen mukaan siksi, koska ne olivat ennestään mukana joissain CJK‐kieliä (Kiina, Japani ja Korea) varten luoduissa merkistöissä. Ohmin merkin lisäksi muita vastaavia yhteensopivuussyistä mukaanotettuja, mutta ”turhia” merkkejä ovat esim. ℃ (U+2103 DEGREE CELSIUS), ℉ (U+2109 DEGREE FAHRENHEIT) sekä roomalaisten numeroitten merkit, jotka alkavat merkistä Ⅰ (U+2160 ROMAN NUMERAL ONE) ja päättyvät merkkiin Ↄ (U+2183 ROMAN NUMERAL REVERSED ONE HUNDRED).

On myös käynyt toisinpäin: SI‐järjestelmän etuliitteen ”mikro‐” lyhenne on µ (U+00B5 MICRO SIGN), joka löytyy ISO-LATIN-1:stä ja ISO-LATIN-15:sta, muttei US-ASCII:sta. Se on samannäköinen kuin kreikan kielen aakkonen nimeltä pieni myy eli μ (U+03BC GREEK SMALL LETTER MU). Kuitenkin on käytettävä mikron merkkiä, jos tarkoitetaan SI‐järjestelmän mikro‐etuliitettä.

On myös otettava huomioon sekin seikka, onko jotain tiettyä alunperin Unicode‐merkeillä kirjoitettua tekstiä tarkoitus konvertoida muihin merkistöihin; jos on, niin silloin ei voidakaan käyttää spesifisempiä merkkejä. Toisaalta jos teksti, joka on alunperin kirjoitettu jollain suppeammalla merkistöllä, konvertoidaan johonkin Unicode‐merkistöön (esim. Unix®‐ käyttöjärjestelmien työkaluilla recode tai iconv), niin sen jälkeen ”korvikemerkkien” tilalle joudutaan vaihtamaan ”oikeat” merkit käsin; tällöin täytyy yleensä asiayhteydestä päätellä se oikea merkki.

Vaikka joistakin merkeistä sanotaankin, ettei niitä pidä tietyssä yhteydessä käyttää tai ettei niille olisi tietyssä yhteydessä käyttöä, niin se ei todellakaan tarkoita, etteikö niitä saisi tai pitäisi muussa yhteydessä käyttää. Esim. jäljempänä mainittua kauttaviivaa eli vinoviivaa ei Unicodea käyttäessä enää tarvita murtolukuihin ja jakolaskuihin, mutta muuta käyttöä sille yhä on. Mutta merkille - (U+002D HYPHEN-MINUS) ei enää ole paljoa käyttöä, jos Unicoden käyttöön on ryhdytty. Kuitenkaan tässä sanotuilla asioilla ei ole mitään vaikutusta ko. merkkien käyttöön ohjelmointi‐ ja merkkauskielien syntaksissa tai tietokoneohjelmien komentorivioptioissa; Niissä niille on omat tarkkaanmääritellyt tehtävänsä. Toisaalta Unicoden merkkien nimissä käytetään väliviivana nimenomaan HYPHEN-MINUS ‐merkkiä, jopa sen merkin omassa nimessä. Lisäksi HYPHEN-MINUS ‐merkkiä käytetään merkistöjen nimissä, kuten tälläkin WWW-sivulla mainituissa merkistöissä UTF-8, US-ASCII, ISO-LATIN-1 (eli ISO-8859-1) ja ISO-LATIN-9 (eli ISO-8859-15).

Suomen kielessä käytetään US-ASCII:stakin löytyviä merkkejä A…Z ja a…z sekä numeroita 0…9 ja lisäksi näitä US-ASCII:n ulkopuolisia merkkejä:

Å (U+00C5 LATIN CAPITAL LETTER A WITH RING ABOVE)
Ä (U+00C4 LATIN CAPITAL LETTER A WITH DIAERESIS)
Ö (U+00D6 LATIN CAPITAL LETTER O WITH DIAERESIS)
å (U+00E5 LATIN SMALL LETTER A WITH RING ABOVE)
ä (U+00E4 LATIN SMALL LETTER A WITH DIAERESIS)
ö (U+00F6 LATIN SMALL LETTER O WITH DIAERESIS)
Š (U+0160 LATIN CAPITAL LETTER S WITH CARON)
š (U+0161 LATIN SMALL LETTER S WITH CARON)
Ž (U+017D LATIN CAPITAL LETTER Z WITH CARON)
ž (U+017E LATIN SMALL LETTER Z WITH CARON)

Kuusi ensinmainittua merkkiä ovat mukana myös merkistöissä ISO-LATIN-1 ja ISO-LATIN-9. Neljä viimeksimainittua merkkiä löytyy myös ISO-LATIN-9‐merkistöstä, mutta ISO-LATIN-1‐merkistössä niitä ei ole. Niitten käytöstä ja tarpeellisuudesta suomen kielen kirjoittamisessa kertoo tarkemmin Jukka K. Korpela WWW‐sivullaan nimeltä ”Hattu-s š ja hattu-z ž” Kotimaisten kielten tutkimuskeskus WWW‐sivullaan nimeltä ”Suhuäänteiden š ja ž merkintä vierasnimissä”.

Unicodessa on oma merkkinsä kolmelle pisteelle, nimittäin … (U+2026 HORIZONTAL ELLIPSIS). Kolmea tavallista pistettä (U+002E FULL STOP) ei siis enää tarvita siihen tarkoitukseen. Kolmen pisteen merkki on tosin hieman epäkäytännöllinen silloin, kun kirjotetaan tasavälisellä fontilla tai kun pelkkää tekstiä (engl ”Plain Text”) katsellaan ohjelmilla, jotka käyttävät tekstin näyttämiseen tasavälistä fonttia. Joissakin vaihtuvavälisissäkin fonteissa … on toteutettu pieleen sillä seurauksella että kolmen pisteen merkissä ne pisteet tulevat huomattavasti lähemmäksi toisiaan kuin käyttäessä kolmea tavallista pistettä peräkkäin. Tuonnempana mainittu standardi SFS 4175 esittää merkin U+2026 ensisijaisena ja merkkiyhdistelmän ”...” (kolme tavallista pistettä) korvaavana merkintätapana.

US-ASCII:n merkkejä " (U+0022 QUOTATION MARK) ja ' (U+0027 APOSTROPHE) ei pidä enää käyttää muualla kuin ohjelmointi‐ ja merkkauskielissä, joiden syntaksiin ne kuuluvat. Oikeat Unicoden tarjoamat lainausmerkit suomen kielessä käytettäväksi ovat ” (U+201D RIGHT DOUBLE QUOTATION MARK) ja ’ (U+2019 RIGHT SINGLE QUOTATION MARK). Merkkiä ’ käytetään myös ns. heittomerkkinä: esim. sanan ”vaaka” yksikön genetiivimuoto on ”vaa’an”.

Merkkiä ” (U+201D RIGHT DOUBLE QUOTATION MARK) kuuluu käyttää myös taulukoissa toiston merkkinä. Toisinsanoen, jos taulukon solussa on ” , se tarkoittaa sitä että ko. solun sisältö on sama kuin yläpuolisessa solussa.

Suomen kielessä käytetään lähinnä kaunokirjallisissa kirjoissa usein kulmalainausmerkkiä » (U+00BB RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK). On olemassa myös kulmalainausmerkki › (U+203A SINGLE RIGHT-POINTING ANGLE QUOTATION MARK). Kulmalainausmerkki » löytyy myös ISO-LATIN-1:stä ja ISO-LATIN-9:stä mutta › ei löydy kummastakaan. Suomen kielessä sisempinä lainausmerkkeinä käytetään aina tavallista ’‐merkkiä, vaikka ulompina lainausmerkkeinä olisikin kulmalainausmerkki » .

Viivamerkkien suhteen tilanne oli vielä vähän aikaa sitten epäselvä, mutta tilanteeseen saatiin korjaus alkuvuodesta 2006, kun standardista SFS 4175 ilmestyi uusi versio; Siinä kutakin merkkiä osoitetaan yleensä sen Unicode‐arvolla. Erityisesti tuo standardi selkiytti n‐viivan ja m‐viivan käytön eroja: Tästedes m-viivalla ei ole suomen kielessä kertakaikkiaan yhtään mitään käyttöä.

Huomatkaa, että US-ASCII:n merkillä - (U+002D HYPHEN-MINUS) ei enää ole paljoa käyttöä Unicodea käyttäessä. Toinen esiinnouseva tärkeä seikka on n‐viivan runsas käyttö. Tässä mainituista viivamerkeistä yksikään ei ole mukana US-ASCII:ssa tai ISO-LATIN-1:ssä tai ISO-LATIN-9:ssä. - (U+002D HYPHEN-MINUS) on jo US-ASCII:ssa mukana.

– (U+2013 EN DASH)

Käyttö:

Ellipsiviiva (poisjätön merkki): 50,– euroa (suositeltavampi merkintätapa kuitenkin olisi ”50,00 €” tai ”50,00 euroa”), –kele!
Alkamisen ja loppumisen ääripäät: sivut 10–12, Helsingin–Hämeenlinnan junarata.
Lainatun tekstin sisällä käytetään poisjätettyä kohtaa osoittamaan kahta n‐viivaa, joiden molemmilla puolilla ja välissä on välilyönti.
Luetteloviiva eli ”ranskalainen viiva”.
Repliikkiviiva.
Rajakohtia ja osapuolia osoittavien ilmausten välissä, esim. ”Paasikiven–Kekkosen linja” (Ei siis ole kyse henkilöstä, jonka sukunimi olisi ”Paasikivi‐Kekkonen” vaan Paasikiven ja Kekkosen noudattamasta linjasta), Suomi–Ruotsi‐maaottelu, Suomi–Kiina‐seura.
Osoittamaan tiedon tai muun asian puuttumista esim. taulukossa.
Varsinaisena ajatusviivana.

Varsinaisella ajatusviivalla tarkoitan tällaisia ajatusviivan käyttökohteita:

Ajatusviivaa käytetään erotettaessa suhteellisen irrallinen lisäys muusta tekstistä varsinkin kaunokirjallisessa tyylissä. Muualla käytetään silloin yleensä sulkeita.

”K. oli tuon selonteon aikana – jonka hän muuten paljolti sekoitti vapaaseen puheeseen – vain epäselvästi tajunnut, että sijaisjohtaja oli nyt noussut seisaalleen.”
Franz Kafka: Oikeusjuttu (romaani).

”Aukeavat – kevät on! – Silmujen purjeet.”
P. Mustapää: Kultainen oksa (runo, joka on kirjassa: ”Tuuli Airistolta”)

Kun tulee jotakin odottamatonta tai muuten poikkeavaa, esimerkiksi painotettua, jopa kohtalokasta:

”Mutta olisihan hän toki jaksanut hänen kanssaan, ellei olisi ollut yhtä nimenomaista seikkaa – sukupuolijuttua.”
George Orwell: Vuonna 1984 (romaani).

Ajatusviiva korvaa joskus on-sanan tai muun predikaatin painokkaassa, vaikuttavuuteen pyrkivässä esityksessä.

”Lapsi – unohdettu uhri?” (= Onko lapsi unohdettu uhri?)

Toisinaan ajatusviivalla kuvataan puheessa olevaa selvää taukoa

”Tahdissa – mars!”

Vanhassa kaunokirjallisuudessa ajatusviiva on joskus vain pisteen tai puolipisteen tehtävässä. Tällöin esitys on usein katkelmallista.

”Hänen katseestaan säteili jonkinlainen jalon intohimon lieska – voin sen vieläkin nähdä."

Huomatkaa, että kaikissa edellämainituissa varsinaisen ajatusviivan käyttökohteissa ajatusviivan molemmille puolille tulee välilyönti.

Täsmällisempi ohjeistus ajatusviivan käytöstä muissa kohteissa kuin varsinaisena ajatusviivana löytyy Jukka K. Korpelalta

‐ (U+2010 HYPHEN)

Käyttö:

Yhdysnimissä ja kun yhdyssanan toinen puolisko on erisnimi, lyhenne, kirjain, numero tai vierasperäinen sana:
- Maija‐Liisa Virtanen‐Mäkinen (Väestörekisterissa tosin on tod.näk. käytetty HYPHEN-MINUS -merkkiä)
- SM‐kilpailu
- Tampere‐talo
- A‐vitamiini
- 50‐vuotisjuhlavastaanotto
- squash‐ottelu
Eräissä paikannimissä: Nummi‐Pusula, Länsi‐Suomi, Iso‐Britannia,
Rinnasteiset yhdyssanat, jos osat ovat muodoltaankin rinnasteiset: kanttori‐urkuri, suomalais‐ruotsalainen.
Tällaistenkaltaisissa yhdyssanoissa: ”luuta‐akka”, ”pakastekaapit ja ‐arkut”, ”sydän‐ ja verisuonitaudit”, ”antaa mennä ‐periaate” (tai ”antaa‐mennä‐periaate”).
Rivin lopussa tavuviivana.
Tavuttamiseen yleensä.

Tarkempi ohjeistus yhdysmerkin käytöstä löytyy Jukka K. Korpelalta

‑ (U+2011 NON-BREAKING HYPHEN)

Käyttö: Muuten sama kuin ‐ (U+2010 HYPHEN), mutta käytetään silloin kun ei haluta sallia rivitystä yhdysmerkin perässä, esim. esim. tapauksissa ”‑arkut” ja ”G‑mies”. Toinen vaihtoehto on säädellä rivinvaihtoja muilla protokollatasoilla, kuten merkkauksessa tai tyyliohjeessa, tai käyttää erityisiä rivinvaihtoja kontrolloivia näkymättömiä merkkejä.

− (U+2212 MINUS SIGN)

Tämä ei ole viivamerkki vaan matemaattinen merkki. Sitä käytetään vähennyslaskuihin, sekä negatiivisiin lukuihin, kuten pakkasasteisiin. Aiheesta lisää tuonnempana.

• (U+2022 BULLET).

Tämä ei ole mikään viivamerkki, mutta otin sen tähän mukaan, koska sitä on tapana käyttää luetteloviivana eli ”ranskalaisena viivana”, muttei yhtään mihinkään muihin n‐viivan käyttötarkoituksiin. Luetelmapallo ei kuulu suomalaisen typografian perinteisiin, mutta viime aikoina sen käyttö on alkanut yleistyä.

Unicodessa on muitakin viivamerkkejä, mutta niitä ei suomenkielisessä tekstissä kannattane käyttää:

m-viiva: — (U+2014 EM DASH). Ei enää käytetä suomen kielessä.
Numeroviiva: ‒ (U+2012 FIGURE DASH). On aika kyseenalaista, onko tälle merkille suomen kielessä paljoa käyttöä. Numeroviivan on tarkoitus olla yhtä leveä kuin numeroittenkin ja se on tarkoitettu käytettäväksi lähinnä taulukoissa typografisista syistä.
Vaakapalkki: ― (U+2015 HORIZONTAL BAR). Ei yleensä käytetä suomen kielessä.
Hyphen Bullet: ⁃ (U+2043 HYPHEN BULLET). Ei yleensä käytetä suomen kielessä.
Väliviiva‐miinus: - (U+002D HYPHEN-MINUS). Suomen kielen kirjoituksen normaalina yhdysmerkkinä olisi kyllä loogisinta käyttää HYPHEN‐merkkiä, mutta valitettavasti standardi SFS 4175 ei osoita Unicode‐arvoa käyttäen, mikä merkki olisi se oikea yhdysmerkki. Lienee kuitenkin varminta käyttää yhdysviivana merkkiä HYPHEN eikä HYPHEN-MINUS. Näyttää tosin siltä, että useimmissa fonteissa nuo kaksi merkkiä ovat toisiinsa verrattuna aivan samannäköisiä, mutta miinusmerkki ja n‐viiva ovatkin jo aivan eri näköisiä niihin verrattuna.

Unicodesta löytyy montakin erilaista välilyöntiä ja ns. ”leveydetöntä tyhjettä”, mutta niistä vain kaksi on sen verran varmatoimisia, että uskallan ottaa ne tässä esiin. Ensimmäinen on tavallinen välilyönti eli U+0020 SPACE ja se löytyy jo US-ASCII:sta. Toinen on sitova välilyönti eli U+00A0 NO-BREAK SPACE, joka ei ole mukana US-ASCII:ssa, mutta kylläkin ISO-LATIN-1:ssä ja ISO-LATIN-9:ssä. Se toimii niin, että sen kohdalla on rivinvaihto kielletty. Esim. ilmaus ”Numero 7” näyttäisi tyhmältä, se jos se hajoaisi kahdelle eri riville välilyöntinsä kohdalla. HTML‐kielessä sitovan välilyönnin voi korvata HTML‐entiteetillä   tai  

Joskus voi olla tarpeen korostaa, että tiettyyn kohtaan tulee välilyönti. Sitä tarkoitusta varten Unicodessa on eräänlaisia näkyviä välilyöntejä:

␠ (U+2420 SYMBOL FOR SPACE)
␢ (U+2422 BLANK SYMBOL)
␣ (U+2423 OPEN BOX)

Ensinmainittu on kylläkin siitä huono, että se näyttää helposti lukukelvottomalta kärpäsenkakalta. Toiseksimainittu sekoittuu helposti pieneen b-kirjaimeen. Siispä␣suosittelen␣tuota␣viimeksimainittua␣merkkiä.

Euron merkki € (U+20AC EURO SIGN) on mukana ISO-LATIN-9:ssä muttei ISO-LATIN-1:ssä saatikka US-ASCII:ssa. Euron murto‐osahan on sentti. Sentille on oma merkkinsä eli ¢ (U+00A2 CENT SIGN) ja se löytyy löytyy ISO-LATIN-1:stä ja ISO-LATIN-9:stä, muttei US-ASCII:sta. Sentin merkkiä ei tosin kannata ollenkaan käyttää, kun on kyse eurovaluutan (EUR) murto‐osista: Se on nimittäin alunperin tarkoitettu esittämään Yhdysvaltojen dollarin (USD) murto-osana toimivaa senttiä.

Euron merkin sopivuudesta eri käyttökohteisiin ja eurovaluutan eri ilmaisukeinoista yleensäkin löytyy lisätietoa Jukka K. Korpelan WWW-sivulta nimeltä ”Euron symbolista ja lyhenteistä”.

Matemaattisia merkkejä on Unicodessa tarjolla vaikka kuinka paljon, joten käsittelen niistä tässä vain tärkeimpiä ja varsinkin sellaisia, joita saatetaan käyttää jopa puhekielisen tekstin seassa.

Kauttaviivaa eli vinoviivaa / (U+002F SOLIDUS) ei enää tarvita murtolukuihin. Siihen tarkoitukseen on tarjolla oma merkkinsä ⁄ (U+2044 FRACTION SLASH). Eräille murtoluvuille on olemassa omat merkkinsä:

½ (U+00BD VULGAR FRACTION ONE HALF)
⅓ (U+2153 VULGAR FRACTION ONE THIRD)
⅔ (U+2154 VULGAR FRACTION TWO THIRDS)
¼ (U+00BC VULGAR FRACTION ONE QUARTER)
¾ (U+00BE VULGAR FRACTION THREE QUARTERS)
⅕ (U+2155 VULGAR FRACTION ONE FIFTH)
⅖ (U+2156 VULGAR FRACTION TWO FIFTHS)
⅗ (U+2157 VULGAR FRACTION THREE FIFTHS)
⅘ (U+2158 VULGAR FRACTION FOUR FIFTHS)
⅙ (U+2159 VULGAR FRACTION ONE SIXTH)
⅚ (U+215A VULGAR FRACTION FIVE SIXTHS)
⅛ (U+215B VULGAR FRACTION ONE EIGHTH)
⅜ (U+215C VULGAR FRACTION THREE EIGHTHS)
⅝ (U+215D VULGAR FRACTION FIVE EIGHTHS)
⅞ (U+215E VULGAR FRACTION SEVEN EIGHTHS)

Puolikkaan ja neljäsosien merkit löytyvät ISO-LATIN-1‐merkistöstäkin, mutta muita murtolukuja ei. US-ASCII‐ ja ISO-LATIN-9‐merkistöissä murtolukuja ei ole lainkaan. Varsinaisia murtolukumerkkejä ei kannata käyttää sellaisissa kohteissa, joissa kirjoitetaan kovin pienellä fonttikoolla; sellaisissa kohteissa murtoluvut kannattaa muodostaa numeroita ja ⁄ ‐merkkiä käyttäen, vaikka ko. murtoluvulle olisikin valmis merkki olemassa. Eräs tapa murtolukujen kirjoittamiseen on se, että kirjoitetaan ensin yläindeksimerkkejä käyttäen osoittaja, sitten ⁄ ‐merkkiä käyttäen murtoviiva ja sitten alaindeksimerkkejä käyttäen nimittäjä. Siis näin: ¹⁄₃ . Ylä‐ ja alaindeksimerkeistä lisää tuonnempana. HTML-kielessä ylä- ja alaindeksimerkkejä ei kuitenkaan tarvitse käyttää, vaan voidaan kirjoittaa <sup>‐ ja <sub>‐tägejä käyttäen näin:

Lopputulos näyttää silloin tällaiselta: ¹⁄₃ .

Kauttaviivaa eli vinoviivaa / (U+002F SOLIDUS) ei tarvitse käyttää myöskään jakolaskuihin, koska siihenkin tarkoitukseen on tarjolla oma merkkinsä eli ∕ (U+2215 DIVISION SLASH). Jo US-ASCII:sta löytyvä kaksoispisteen merkki : (U+003A COLON) kyllä kelpaa jakolaskuihin. Jos jossain SI‐järjestelmän mittayksikössä (esim. m∕s) on jakoviiva, niin silloinkin tulee käyttää merkkiä ∕ (U+2215 DIVISION SLASH).

Jo US-ASCII:sta löytyvä * (U+002A ASTERISK) puolestaan ei kelpaa kertomerkiksi vaan siihen on tarjolla kaksikin muuta merkkiä, jotka molemmat löytyvät ISO-LATIN-1:stä ja ISO-LATIN-9:stä: × (U+00D7 MULTIPLICATION SIGN) ja · (U+00B7 MIDDLE DOT). Joskus kertomerkkinä käytetään myös merkkiä ⋅ (U+22C5 DOT OPERATOR), joka ei ole mukana US-ASCII:ssa, ISO-LATIN-1:ssä tai ISO-LATIN-9:ssä. Jos aivan tarkkoja ollaan, niin MIDDLE DOT on välimerkki ja DOT OPERATOR on matemaattinen merkki. Siispä periaatteessa MIDDLE DOT ei ole kelvollinen kertomerkiksi. Sitäpaitsi useissa fonteissa MIDDLE DOT näyttääkin aivan liian pieneltä kertomerkiksi.

Miinusmerkiksi laskutoimituksiin ja negatiivisiin lukuihin ei kelpaa jo US-ASCII:stä löytyvä - (U+002D HYPHEN-MINUS) vaan siihenkin on oma merkkinsä eli − (U+2212 MINUS SIGN).

Mutta plusmerkiksi laskutoimituksiin ja positiivisiin lukuihin kyllä kelpaa se US-ASCII:stakin tuttu + (U+002B PLUS SIGN).

Siispä Unicodea käyttäessä peruslaskutoimitusten merkit ovat:

+ (U+002B PLUS SIGN)
− (U+2212 MINUS SIGN)
× (U+00D7 MULTIPLICATION SIGN) tai ⋅ (U+22C5 DOT OPERATOR)
: (U+003A COLON) tai ∕ (U+2215 DIVISION SLASH)

Lähinnä taskulaskinten näppäimistä tuttu jakolaskun merkki ÷ (U+00F7 DIVISION SIGN) löytyy myös ISO-LATIN-1:stä ja ISO-LATIN-9:stä, mutta sekaannusten välttämiseksi sitä ei pidä käyttää, koska joissakin kulttuureissa se tarkoittaa samaa kuin miinusmerkki.

Kuitenkin ohjelmointi‐ ja merkkauskielissä laskutoimituksiin yhä käytetään kauttaviivaa, asteriskia, plusmerkkiä ja väliviiva‐miinusta. Esim. Unix®‐käyttöjärjestelmistä tuttu ”taskulaskinohjelma” nimeltä bc menee sekaisin, jos yrittää käyttää jotain muita peruslaskutoimitusten merkkejä:

Huomatkaa, että äskeisessä esimerkissä vain yhteenlasku onnistui. Näytetäänpä vielä pieleenmenneet laskutoimitukset korjattuina:

Unicoden tarjoamat yläindeksimerkit ovat nämä:

⁰ (U+2070 SUPERSCRIPT ZERO)
¹ (U+00B9 SUPERSCRIPT ONE)
² (U+00B2 SUPERSCRIPT TWO)
³ (U+00B3 SUPERSCRIPT THREE)
⁴ (U+2074 SUPERSCRIPT FOUR)
⁵ (U+2075 SUPERSCRIPT FIVE)
⁶ (U+2076 SUPERSCRIPT SIX)
⁷ (U+2077 SUPERSCRIPT SEVEN)
⁸ (U+2078 SUPERSCRIPT EIGHT)
⁹ (U+2079 SUPERSCRIPT NINE)
⁺ (U+207A SUPERSCRIPT PLUS SIGN)
⁻ (U+207B SUPERSCRIPT MINUS)
⁼ (U+207C SUPERSCRIPT EQUALS SIGN)
⁽ (U+207D SUPERSCRIPT LEFT PARENTHESIS)
⁾ (U+207E SUPERSCRIPT RIGHT PARENTHESIS)
ⁱ (U+2071 SUPERSCRIPT LATIN SMALL LETTER I)
ⁿ (U+207F SUPERSCRIPT LATIN SMALL LETTER N)

Näistä merkeistä vain ¹, ² ja ³ löytyvät myös ISO-LATIN-1:stä ja ISO-LATIN-9:stä. Näillä merkeillä saadaan aikaiseksi mm. potenssilukuja: 12²⁹ . Siispä tällaista T_EXistä ja L^AT_EXista muuallekin levinnyttä korvaavaa merkintätapaa ei enää tarvita: 12^2 . Yläindeksejä käytetään myös SI‐järjestelmän yksikköissä nimeltä neliömetri (m²) ja kuutiometri (m³) ja niitten kerrannaisissa. Yläindeksiä käytetään usein myös osoittamaan alaviitteeseen. HTML‐kielessä ei kuitenkaan tarvita varsinaisia yläindeksimerkkejä vaan voidaan käyttää <sup> ‐tägejä.

Unicoden tarjoamat alaindeksimerkit ovat nämä:

₀ (U+2080 SUBSCRIPT ZERO)
₁ (U+2081 SUBSCRIPT ONE)
₂ (U+2082 SUBSCRIPT TWO)
₃ (U+2083 SUBSCRIPT THREE)
₄ (U+2084 SUBSCRIPT FOUR)
₅ (U+2085 SUBSCRIPT FIVE)
₆ (U+2086 SUBSCRIPT SIX)
₇ (U+2087 SUBSCRIPT SEVEN)
₈ (U+2088 SUBSCRIPT EIGHT)
₉ (U+2089 SUBSCRIPT NINE)
₊ (U+208A SUBSCRIPT PLUS SIGN)
₋ (U+208B SUBSCRIPT MINUS)
₌ (U+208C SUBSCRIPT EQUALS SIGN)
₍ (U+208D SUBSCRIPT LEFT PARENTHESIS)
₎ (U+208E SUBSCRIPT RIGHT PARENTHESIS)

Mitään näistä merkeistä ei ole mukana US-ASCII:ssa saatikka ISO-LATIN-1:ssä tai ISO-LATIN-9:ssä. Näillä merkeillä saadaan aikaiseksi mm. kemiallisia kaavoja: H₂O (vesi) ja C₂H₅OH (etanoli). HTML‐kielessä ei kuitenkaan tarvita varsinaisia alaindeksimerkkejä vaan voidaan käyttää <sub> ‐tägejä.

Unicodesta löytyy mm. nämä yhtäläisyyden ja epäyhtäläisyyden merkit:

≈ (U+2248 ALMOST EQUAL TO)
= (U+003D EQUALS SIGN)
≠ (U+2260 NOT EQUAL TO)
< (U+003C LESS-THAN SIGN)
≤ (U+2264 LESS-THAN OR EQUAL TO)
> (U+003E GREATER-THAN SIGN)
≥ (U+2265 GREATER-THAN OR EQUAL TO)

Näistä merkeistä =, < ja > ovat jo US-ASCII:ssa mukana, mutta muita näistä merkeistä ei ole edes ISO-LATIN-1:ssä tai ISO-LATIN-9:ssä mukana. Siispä ohjelmointikielistä (esim. C ja C++) muualle levinneet korvaavat merkinnät, kuten ”!=” ja ” >=” ovatkin nyt Unicoden käyttäjälle tarpeettomia.

Kenties yleisin kulman yksikkö on aste ja sen merkki ° (U+00B0 DEGREE SIGN) löytyy ISO-LATIN-1:stä ja ISO-LATIN-9:stä, muttei US-ASCII:sta. Sitä käytetään myös monissa lämpötilaa ilmaisevissa mittayksiköissä. Kulmaa ilmaisevan asteen murto‐osia ovat kaariminuutit. Kaariminuutin murto‐osia puolestaan ovat kaarisekunnit. Yksi tuuma on yhtäkuin 2,54 cm. Ja 12 tuumaa on yhtäkuin yksi jalka.

Lämpöasteitten mittayksikköä lyhentäen kirjoittaessa kirjoitetaan ensin tavallinen asteen merkki ja siihen perään lämpöasteikkoa ilmaiseva kirjain. Me suomalaisethan käytämme celsiusasteita, joten esim. ”miinus kolmetoista celsiusastetta” lyhennetään näin: −13 °C . Huomatkaa, että tässäkään ei saa käyttää sitä merkkiä nimeltä HYPHEN-MINUS ilmaisemaan negatiivisia lukuja vaan on käytettävä merkkiä U+2212 MINUS SIGN. SI‐järjestelmässä lämpötilan yksikkö on kuitenkin Kelvin, jonka lyhenne on pelkkä K. Se ei siis todellakaan ole mikään ”Kelvin‐aste” eikä sitä lyhennetä ”°K”. Kuten jo sanoin, lämpötilojen mittayksiköiden lyhenteinä ei pidä käyttää pelkästään yhteensopivuussyistä mukaanotettuja ”turhia” merkkejä, kuten ℃ (U+2103 DEGREE CELSIUS).

US-ASCII:n merkki " ei kelpaa tuuman eikä kaarisekunnin merkiksi. Oikea merkki niihin tarkoituksiin on ″ (U+2033 DOUBLE PRIME) eli ”kaksinkertainen yläpuolinen indeksointipilkku”. Vastaavasti oikea merkki ilmaisemaan jalka‐nimistä mittayksikköä ja kaarisekuntia on ′ (U+2032 PRIME) eli ”yläpuolinen indeksointipilkku” eikä US-ASCII:n merkki ' .

Tässä vielä eräitä muita varsin yleisiä matemaattisia merkkejä, jotka ovat mukana Unicodessa, muttei ISO-LATIN-1:ssä tai ISO-LATIN-9:ssä:

∶ (U+2236 RATIO)
⇒ (U+21D2 RIGHTWARDS DOUBLE ARROW)
‰ (U+2030 PER MILLE SIGN)
∞ (U+221E INFINITY)
℮ (U+212E ESTIMATED SYMBOL)

Suhdelukuihin, kuten vaikkapa karttojen mittakaavoihin (esim. 1∶10 000), on yleensä käytetty kaksoispistettä : (U+003A COLON) mutta siihen tarkoitukseen on Unicodessa tarjolla myös ∶ (U+2236 RATIO). Kaksoispisteen käyttäminen suhdelukuihin ei kuitenkaan ole kiellettyä. Merkkiä ⇒ käytetään joskus jonkinlaisessa jargonissa ilmaisemaan: ”Siitä seuraa että…”. Unicoden käyttäjän ei siis enää tarvitse tyytyä sen korvikkeeseen ”=>”. Ja todellakin, Unicoden ansiosta ei enää tarvitse joka kerta naputella sanaa ”promille”, vaan on käytössä myös ihkaoikea promillen merkki eli ‰ . Sitä ei kuitenkaan pidä käyttää yleisenä promille‐sanan vastineena; esim. sanaa "promilleraja" tai ilmausta "kaksi promillea" ei pidä kirjoittaa promillemerkkiä käyttäen. Ja äärettömän merkkikin löytyy Unicodesta, kuin myös ns. ESTIMATED SYMBOL, jota käytetään Euroopassa mm. elintarvikepakkauksissa.

Immateriaalioikeuksiin liittyviä merkkejä ovat ainakin nämä:

® (U+00AE REGISTERED SIGN)
℗ (U+2117 SOUND RECORDING COPYRIGHT)
™ (U+2122 TRADE MARK SIGN)
℠ (U+2120 SERVICE MARK)

US-ASCII:ssa ei ole mikään näistä merkeistä mukana. Näistä merkeistä vain kaksi ensinmainittua on mukana ISO-LATIN-1:ssä ja ISO-LATIN-9:ssä.

Melkein aina kun aletaan keskustella tai kirjoittaa erilaisten kielten ääntämisestä, tarvitaan ääntämisohjeisiin ns. IPA-merkkejä. IPA tarkoittaa ”International Phonetic Alphabet”. IPA‐merkkejä löytyy ainakin US-ASCII:sta, ISO-LATIN-1:stä, ISO-LATIN-9:stä ja lisäksi ainakin seuraavista Unicode-lohkoista:

Latinalaisen merkistön laajennusosa A (Merkistä Ā (U+0100 LATIN CAPITAL LETTER A WITH MACRON) merkkiin ſ (U+017F LATIN SMALL LETTER LONG S))
Latinalaisen merkistön laajennusosa B (Merkistä ƀ (U+0180 LATIN SMALL LETTER B WITH STROKE) merkkiin ȶ (U+0236 LATIN SMALL LETTER T WITH CURL))
IPA-täydennys (Merkistä ɐ (U+0250 LATIN SMALL LETTER TURNED A) merkkiin ʯ (U+02AF LATIN SMALL LETTER TURNED H WITH FISHHOOK AND TAIL))
Tarkkeenomaisia erillisiä merkkejä (Merkistä ʰ (U+02B0 MODIFIER LETTER SMALL H) merkkiin ˿ (U+02FF MODIFIER LETTER LOW LEFT ARROW))

Suomen kieltä äännetään niinkuin kirjoitetaan – muutamaa poikkeusta lukuunottamatta. Eräs tärkeimpiä poikkeuksia on ns. äng‐äänne eli velaarinen nasaali. Sen merkki on ŋ (U+014B LATIN SMALL LETTER ENG) ja löytyy em. Unicode‐lohkosta nimeltä ”Latinalaisen merkistön laajennusosa A”. Vokaalien pidentämisen ilmaiseva merkki ei ole tavallinen kaksoispiste vaan ː (U+02D0 MODIFIER LETTER TRIANGULAR COLON) joka löytyy em. Unicode‐lohkosta nimeltä ”Tarkkeenomaisia erillisiä merkkejä”. Muita suomen kielen ääntämisen ilmaisuun tarvittuja merkkejä ovat esim. æ (U+00E6 LATIN SMALL LETTER AE) ja ø (U+00F8 LATIN SMALL LETTER O WITH STROKE), jotka löytyvät ISO-LATIN-1:stä ja ISO-LATIN-9:stä.

Kaikki suomen kielen ääntämisen ilmaisemiseen tarvitut IPA‐merkit on lueteltu Jukka K. Korpelan WWW-sivulla nimeltä ” Pronunciation of Finnish in a nutshell (for linguists)” Heti jos aletaan kirjoittaa muitten kielien kuin suomen kielen ääntämisestä, tarvitaan melkein aina muitakin IPA‐merkkejä. Niihin en tosin tässä yhteydessä halua paneutua, koska se menee jo liiaksi tämän WWW‐sivun aihealueen ulkopuolelle.

Lopuksi vielä muutama merkki, jotka ovat mukana Unicodessa, muttei US-ASCII:ssa, saatikka ISO-LATIN-1:ssä tai ISO-LATIN-9:ssä.

→ (U+2192 RIGHTWARDS ARROW)
♀ (U+2640 FEMALE SIGN )
♂ (U+2642 MALE SIGN)
⚢ (U+26A2 DOUBLED FEMALE SIGN) (Alias: lesbianism)
⚣ (U+26A3 DOUBLED MALE SIGN) (Alias: male homosexuality)
⚤ (U+26A4 INTERLOCKED FEMALE AND MALE SIGN) (Alias: bisexuality)
⚥ (U+26A5 MALE AND FEMALE SIGN) (Aliakset: ”transgendered sexuality” ja ”hermaphrodite (in entomology)”)
⚦ (U+26A6 MALE WITH STROKE SIGN) (Alias: transgendered sexuality)
⚧ (U+26A7 MALE WITH STROKE AND MALE AND FEMALE SIGN) (Alias: transgendered sexuality)

Oikealle osoittavaa nuolta voi käyttää ainakin tähän tapaan: ”Tallentaaksesi tiedoston sinun tulee liikkua hiirellä valikoissa näin: File → Save”. Enää ei siis tarvita mitään tällaista korviketta: -> . Uroksen ja naaraan merkkien luulisi kiinnostavan ainakin biologeja. Nuo seksuaalisen suuntautumisen sekä sukupuolisuuntautumisen merkit ovat varsin uusi juttu koko Unicode‐standardissa, joten niitten tuki fonteissa on vielä varsin surkea. Ne tulivat Unicodeen mukaan versiossa 4.1.

Unicoden erilaisia hyödyllisiä merkkejä esitellessä eräillä on joku kumma tapa kuitata ne kaikki sanomalla: ”Jahas… Taas joku teinix on löytänyt näppäimistöltään uuden hassun merkin…”. Todellisuudessa vasta nämä ovat oikein todenteolla teinixmäisiä merkkejä, jotka Unicodesta löytyy, tai ainakin niitä pystyy käyttämään teinixmäisesti, vaikka alunperin ne onkin johonkin muuhun tarkoitukseen keksitty aivan jokaikinen. Ja nämä löysi teille 30 vuotta täyttänyt penseä ja herttainen setä, eli allekirjoittanut, mm. Wikipediasta ja Gnomen merkkikarttaohjelmasta, eikä näppäimistöltään. Itseasiassa en vielä edes tiedä, miten nämä saisi näppäimistöllä aikaiseksi. Sensijaan minulla on näitten syöttämiseksi muita keinoja. Tosin nuo kaksi viimeksimainittua merkkiä löytyivät näppäimistöltäni yllättävän helposti ☺ .

‽ (U+203D INTERROBANG)
☠ (U+2620 SKULL AND CROSSBONES)
☢ (U+2622 RADIOACTIVE SIGN)
☣ (U+2623 BIOHAZARD SIGN)
☮ (U+262E PEACE SYMBOL)
☹ (U+2639 WHITE FROWNING FACE)
☺ (U+263A WHITE SMILING FACE)
♥ (U+2665 BLACK HEART SUIT )
♫ (U+266B BEAMED EIGHTH NOTES)
❤ (U+2764 HEAVY BLACK HEART)
💩 (U+1F4A9 PILE OF POO)
X (U+0058 LATIN CAPITAL LETTER X)
x (U+0078 LATIN SMALL LETTER X)

Myöskin aiemmin mainittuja uroksen ja naaraan merkkejä voitaneen käyttää hyvinkin teinixmäisesti. Pitäkää hauskaa, mutta sen pitäisi käydä jo tämän WWW‐sivun lisenssiehdoista selville, että en vastaa mistään seurauksista. ☺

Copyleft:
Juhapekka "naula" Tolvanen
http://iki.fi/juhtolv/
This WWW‐page is free; it may be copied, distributed or modified under certain conditions, but comes WITHOUT ANY WARRANTY; see the Design Science License for the precise terms and conditions. (Local copy.)

More copies of DSL are in these places: http://iki.fi/juhtolv/licenses/dsl.txt http://www.gnu.org/licenses/dsl.html

DSL is also available in Finnish: http://iki.fi/juhtolv/licenses/dsl.fi.txt

Valid XHTML 1.0 Transitional

Suomen kielen kirjoittaminen Unicodea käyttäen

Sisältö

Merkkien näkyvyydestä eri WWW-selaimilla ja fonteilla

Nopeat ohjeet

Perusteellisemmat ohjeet

Johdanto

Mikä tämä sivu on

Mitä tämä sivu ei ole

Kirjaimet

Kolme pistettä

Lainausmerkit

Viivamerkit

n‐viiva

Yhdysmerkki

Yhdistävä yhdysmerkki

Miinusmerkki

Luetelmapallo

Suomen kielen ulkopuolisia viivamerkkejä

Välilyönti

Euron merkki

Matematiikka

Murtoluvut

Peruslaskutoimitukset

Yläindeksimerkit

Alaindeksimerkit

Yhtäläisyyden ja epäyhtäläisyyden merkit

Kulmat, lämpötilat, tuumat ja jalat

Muita Unicoden matemaattisia merkkejä

Immateriaalioikeuksiin liittyvät merkit

IPA-merkit ja ääntämisohjeet

Sekalaisia

Teinixmäisyyksiä

Linkit

Tämä WWW‐paikka näyttää paljon paremmalta WWW‐selaimella, joka tukee www‐standardeja, mutta sen sisältämä informaatio on silti saatavilla millä tahansa WWW‐selaimella.