Wikipedia-statistikk og språk

Wikipedia Samfunnshuset presenteres og drøftes nå resultatene av Wikimedia Visitor Log Analysis Report fra fjorårets siste måneder. Resultatene for Norge ses i tabellen nedenfor, og er interessant lesning. Trafikken fra Norge utgjør 0,6 % av den samlede Wikipediatrafikken, og fordeler seg altså slik:

Norge er et av landene i tabellen der det nasjonale wikiprosjektet scorer lavere enn det engelskspråklige. Det kan ha en rekke forklaringer, den mest nærliggende at det engelskspråklige rett og slett er større og bedre. Men en annen trend er også tydelig i Wikimedia-loggen: europeiske land som forbindes med generelt gode engelskkunnskaper (Nederland, Danmark, Sverige, Norge) har en langt høyere engelskandel enn søreuropeiske land, for eksempel. Nordmenn leser mye engelsk, simpelthen.

To andre tall i tabellen er interessante: russisk wikipedia har hele 2,1 % av sidevisningene. Det er langt mer enn antall norsk-russere (under 0,3 % av befolkningen), noe som kan henge sammen med det fascinerende faktum at russisk er det største ikke-norske språket i norske biblioteksstatistikker. Men man skal ikke se bort fra at det er feil i loggføringen (jamfør den høye japanskprosenten i statistikken for Australia).

Nynorskprosenten er kanskje likevel den mest oppsiktsvekkende. OK, så er antall artikler langt lavere enn i bokmålsvarianten, men mange av dem holder høy nok kvalitet til å være mer enn brukbare i f.eks. skolesammenheng. Googlerank kan være en hovedårsak, men det avspeiler sannsynligvis også nynorskens svake stilling. Et lite tall til slutt: ifølge Alexa er Wikipedia nummer 10 på den norske nettrankinglista. Situasjonen er dermed den samme her som internasjonalt: Wikipedia er eneste ikke-kommersielle aktør i toppskiktet.

Share/Bookmark

13 kommentarer

  1. Håkon says:

    Det er interessant at tysk Wikipedia kommer såpass høyt opp. For en del emner er faktisk tysk Wikipedia veldig godt skrevet og jeg bruker å lese en del selv, men trodde ikke at jeg hadde såpass mange likesinnede.

    En del av trafikken mot de fremmedspråklige versjonene skyldes nok at Wikipedia lenker emneord mellom språk. Hadde jeg studert språk ville jeg vært ivrig wikipediabruker i disse språkene.

    Når det gjelder forholdet mellom norsk og engelsk så slår jeg som regel opp i samme språkutgave som teksten jeg arbeider med. Dersom det er en norsk tekst klikker jeg meg gjerne videre til engelsk (og nå og da andre språk) for å se om jeg finner mer informasjon. Jobber jeg med en engelsk tekst klikker jeg meg gjerne tilbake til norsk utgave av wikipedia, men det er ikke alltid det finnes noen slik lenke.

    På grunn av at det er mer informasjon og flere lenker til andre Wikipedia-artikler på engelsk skaper nok dette mer trafikk på den engelskpråklige utgaven.

  2. Det er mye jevnere mellom engelsk og bokmål hvis man ser på fjerde kvartal. Der ligger engelsk på 44% og bokmål på 43,1%.

    Nynorsktallet må sies å være skuffende, for det er ganske riktig en del emner hvor det er meget dyktige skribenter på den nynorske Wikipediaen. Rekrutteringen som skribent må nødvendigvis komme fra lesergruppen, og hvis antall lesere blir for lite vil det før eller senere gå ut over antallet skribenter.

    Jeg tror at hvis et språk skal kunne klare seg i konkurransen på Internett trenger det at informasjonskilder finnes på det språket også slik at vi ikke alltid må ty til engelsk. Derfor er ikke 1% nok for nynorsk i det lange løp, men heller ikke hele årets snaue 40% for bokmål er bra nok.

  3. wiggo says:

    Jeg tror heller det er slik at det er for få norske oversettelser. Har ved fler anledninger brukt wp. og må bruke svensk som språk.

  4. Eirik says:

    @Håkon: Den enkle tilgangen til artikler på andre språk er en av Wikipedias “killer apps”. Har ikke tall på hvor mange ganger jeg har lurt på f.eks. en tysk oversettelse og har gått via Wikipedia.

    @Hans: Takk for oppdatering, det er jo en trend i riktig retning. :-)

  5. Ulf Larsen says:

    Den større trenden i tallene virker riktig; mens land med større nasjonale språkutgaver av Wikipedia og dårligere engelskkunnskaper har mest bruk av utgaven på det nasjonale språket (tysk, fransk, spansk, japansk), så er bruken av engelsk tilsvarende større for mindre språkutgaver hvor brukerne står i en posisjon for å velge.

    For Norge så viser det klart at største (eneste reelle?) konkurrent for Wikipedia på bokmål/riksmål er utgaven på engelsk, Store norske leksikon er totalt akterutseilt.

    Jeg mener dette nok en gang synliggjør det jeg kaller “Wikipedias digitale gap” – dvs en vridning i innhold, brukere og språk mot “vesten” og vesteuropeiske språk.

    Dette burde ha stor interesse for norske politikere – en generasjon som vokser opp fornøyd med å hente sin leksikale informasjon på engelskspråklig Wikipedia betyr nok en spiker i kisten for norske språk som samisk, nynorsk og bokmål/riksmål.

    Ulf Larsen
    Frivillig bidragsyter
    Wikipedia/Wikimedia

  6. Eirik says:

    @Ulf: Ja, det kan virke som om markedet har talt. For øyeblikket er dessverre motstanderne av alle former for åpent innhold, blant annet representert ved blant annet William Nygaard i Aschehoug, svært sterke. Mulighetene for politisk gjennomslag er derfor begrensede.

  7. [...] This post was mentioned on Twitter by astronewth and BTHansen, Håkon Styri. Håkon Styri said: RT @astronewth: Har reflektert litt rundt Wikipedia-statistikk og språk: http://newth.net/eirik/2010/01/15/wikipedia-statistikk-og-sprak/ [...]

  8. Karl Olsen says:

    Jeg skulle gjerne sett at bokmåls-Wikipedia hadde langt høyere tall enn engelsk Wikipedia, men jeg blir ikke søvnløs eller så veldig overrasket av de tallene. Forskjellen er ikke enorm, og tatt i betraktning at vi bor i et land der mange kan engelsk, pluss at bokmåls-Wikipedia nødvendigvis har langt færre artikler enn engelsk Wikipedia, så synes jeg tallene er akseptable.

    Synd med nynorsk, men de lider nok mye under dårlig Google-rank. En språkvariant (målform) med relativt få artikler (all ære til de som skriver på nynorsk Wikipedia!) som må slåss ikke bare med engelsk, men med en annen, dominerende språkvariant i sitt eget land… Da blir det vanskelig.

    Det som overrasker meg mest, er det høye tallet for russisk. Jeg tenker kanskje for vanskelig, men… kan det skyldes at internett-trafikk fra Nordvest-Russland går via Norge (Telenor) og dermed regnes som “norsk”? Jeg fant denne med et søk på nett, den er fra 1995, og jeg vet ikke om situasjonen har endret seg siden da: http://www.telenor.no/rapporter/arsrapport94/TelenorInternasjonal.html

  9. Eirik says:

    @Karl: Tror du har rett. Hvis tallene avspeilet reelle fremmedspråklige søk, ville vel http://pl.wikipedia.org/ ligge langt høyere på statistikken enn det russiske motstykket… ;-)

  10. Karl Olsen says:

    Jeg ser forresten en interessant utvikling, hvis en kan trekke konklusjoner basert på endring fra kvartal 3 til kvartal 4 i fjor. Engelsk er på første eller andre plass for de aller fleste landene, men i mange av landene (inkludert Norge) taper engelsk andeler til det andre språket i toppen. Tendensen er klar blant de største nett-landene, dog mindre tydelig når en kommer lenger nedover på lista. En annen ting: I de arabisktalende landene er arabisk klart slått av engelsk, men arabisk tar innpå.

    http://stats.wikimedia.org/wikimedia/squids/SquidReportPageViewsPerCountryTrends.htm

  11. Veldig interessant! Jeg var akkurat i Bangalore på en kritisk Wikipedia konferanse kalt WikiWars (http://reganmian.net/blog/2010/01/14/tweets-from-critical-point-of-view-wikiwars-conference-in-bangalore/), og presenterte om nødvendigheten av å gi folk som bidrar til Wikipedia i sine språk og ikke kan engelsk bra (ikke stort problem for Norge, men for Kina, Japan og sikkert mange andre land) flere muligheter til å delta i beslutninger på det høyeste nivå (http://www.slideshare.net/houshuang/equitable-governance-in-multilingual-wikipedia).

    Der nevnte jeg også at det ville være flott å vite mer om demografien til de som deltar, og at det ville vært fint å vite mer om hvor behovet er størst, i forskjellige språkversjoner etc. Var nysgjerrig på hvor mange nordmenn som gikk rett på engelske WP når de ville finne ut noe – jeg gjør det stort sett, om det ikke er et veldig “norsk” emne, men har også bodd utenlands lenge.

    Ble forresten irritert på meg selv, som kan flere språk, men alltid går til engelske – det er jo mulig det er en bedre artikkel på tyske, men jeg kan jo ikke slå opp på fem språk, bare for å sjekke… så jeg laget et lite verktøy, kallt “bigger”.

    Hvis man for eksempel kan norsk, nynorsk, svensk, dansk, tysk og fransk, så kan man konstruere dette søket

    http://reganmian.net/bigger/en/no,nn,sv,da,de,fr/Guangzhou

    (slå opp byen Guangzhou i engelske WP, sjekk interwiki lenkene til alle disse WPene, og send meg automatisk videre til den lengste artikkelen).

    Kjører man denne, finner man ut at den lengste artikkelen om Guangzhou – der jeg sitter akkurat nå – er på franske Wikipedia. Hvis dette er språkene man kan, lager man så en Firefox shortcut av det, og kan skrive bigger Democracy , og få lengste side automatisk (desverre vet jeg ikke hvordan jeg kan måle “side med høyest kvalitet”, så det går bare på antall kb).

    Ang interwiki linker, se også konstruksjon av ordbok basert på Wikipedias database: http://reganmian.net/blog/2009/02/16/release-early-release-often-english-chinese-dictionary-based-on-wikipedia/

    Dette ledet så til den første åpne online norsk-kinesiske ordboka, på http://kaifangcidian.com/norsk, som også inkluderer data fra KDE oversettelsesfiler mm. (og den utrolige Ordbanken med bøyningsinformasjon for alle norske ord, f.eks. http://kaifangcidian.com/b%C3%B8yning/spis

    Stian

    Stian

  12. Lars says:

    Den tyske utgaven av Wikipedia er uten tvil den beste (dette sier jeg etter å ha brukt utgaver på syv forskjellige språk), og når tysk kommer så lett for nordmenn er det en tragedie at ikke flere benytter seg av den.

    På engelsk er Wikipedia ujevn og selv om det er god bredde, er det virkelige dybdestoffet stortsett forbeholdt underholdning, teknologi og politiske kampsaker. Skrivekvaliteten er preget av at mange bidrar som ikke har engelsk som førstespråk, og da er spesielt skandinaver med sin krøklete, osmoseinnlærte engelsk ofte å se i redigeringshistorien på flere sider. Her syns jeg at man istedenfor å lage dårlige bidrag til en fremmedordsside, kan skrive noe bra på norsk isteden.

    Og istedenfor å lese den middelmådige engelske versjonen, kan man heller hente frem ordboka fra videregående og bruke den tyske. Jeg lar meg stadig imponere over hvor grundig den er, små emner og kjedelige emner blir dekket like grundig og dypt som de populære og store, med gjennomgående høy saklighet og skrivekvalitet.

  13. Gunnar Tveiten says:

    Det er ikke så rart at folk ikke bruker nynorsk-varianten. Det er nemlig veldig sjelden slik at språket som sådan er viktigere enn kvaliteten på innholdet, så lenge språket er ett du skjønner godt nok til at det ikke blir en barriere.

    Halvparten bruker jo engelsk i stedet for bokmål – trolig fordi kvaliteten og artikkelutvalget er så veldig mye bedre.

    Akkurat samme begrunnelse gjør at folk bruker bokmål, eller engelsk, i stedet for nynorsk. Det er veldig få som bruker nynorsk, men er så dårlige i bokmål at språket blir en barriere.

    Nynorskutgaven har slik sett en utfordring: medmindre de kan greie å være like gode som bokmålsutgaven er det ytterst få som ser noe poeng i å bruke dem – og når få bruker dem, gir det igjen gjerne få bidragsytere som igjen gjør det vanskelig å heve kvaliteten.

    Jeg søker på engelsk først, for så kanskje å kikke på bokmålsvarianten av artikkelen dersom den finnes (det gjør den i kanskje 1/3 av tilfellene, men i 90%+ av tilfellene er den vesentlig dårligere) Nynorskvarianten har jeg klikket meg inn på en håndfull ganger, men konkludert med at den i praksis alltid er ikke-eksisterende eller *svært* mye dårligere. Eneste unntak er temaer av spesiell interesse for nynorsk-brukere ( “Ivar Aasen”)

Legg inn kommentar

Vis folkeskikk, vær relevant. Din ytringsfrihet er ikke min publikasjonsplikt.