Språkförsvaret

Erika Helin skriver i Expressen idag:


”Kära Sverige-svenskar, nu när den största chocken över utfallet i Melodifestivalen 2025 har lagt sig så kanske det är dags att förklara en del saker lite närmare, för just nu råder det en stor förvirring i Sverige om vad svensk innebär.


Den stora majoriteten svenskar har i alla år varit lyckligt omedvetna om att det på andra sidan Östersjön i alla tider funnits ett folk som hängivet följt Melodifestivalen som det vore deras egen. 


Vi har hejat, rasat och gråtit av lycka över att ”rätt låt vann!”. Men, vi har också varit medvetna om att vi liksom lite tittar in genom ett skyltfönster, vi är där och ser glittret, värmen och glamouren, men vi står tillika på utsidan. 

Vi bor inte inom Sveriges gränser, vi får inte rösta! Vid få utvalda tillfällen har en finlandssvensk fått åka över havet och in i värmen, men bara snabbt, utan större framgång, flimrat förbi det rikssvenska medvetandet. ”


Läs vidare här!


(Denna nätdagbok är knuten till nätverket Språkförsvaret)

Det påpekas ofta att spanska borde vara ett språk som talas eller förstås i större utsträckning i forskarvärlden med tanke på antalet talare i världen, en siffra som Instituto Cervantes uppskattar till nästan 600 miljoner.

Men miljontals talare ger inte nödvändigtvis ett språk styrka inom den akademiska världen. Detta måste odlas på vetenskaplig, politisk och kulturell nivå, med ihärdiga insatser från många institutioner och specialister.


Forskarsamhället bör kommunicera på så många språk som möjligt

 

Enligt vissa uppskattningar publiceras så mycket som 98% av världens vetenskapliga forskning på engelska, medan endast cirka 18% av världens befolkning talar detta språk. Därför är det viktigt att publicera sig på andra språk om vi ska kunna föra ut vetenskaplig forskning till samhället i stort.


Värdet av flerspråkighet inom vetenskapen har lyfts fram av många högprofilerade organisationer, med offentliga deklarationer och uttalanden i frågan från European Charter for Researchers, Helsinki Initiative on Multiligualism, Unesco Recommendation on Open Science, OPERAS Multiligualism White Paper, Latin American Forum on Research Assessment, COARA Agreement on Reforming Research Assessment och Declaration of the 5th Meeting of Minsters and Scientific Authorities of Ibero-American Countries. Alla dessa organisationer är överens om en sak: alla språk har ett värde i den vetenskapliga kommunikationen.


Som påpekas i den sista av dessa deklarationer publiceras lokalt, regionalt och nationellt relevant forskning ständigt på andra språk än engelska. Denna forskning har en ekonomisk, social och kulturell inverkan på den omgivande miljön, eftersom när vetenskaplig kunskap sprids filtreras den till icke-akademiska yrkesutövare, vilket skapar en bredare kultur av kunskapsdelning.


Större mångfald möjliggör också en smidig dialog mellan akademiker som talar samma språk, eller som talar och förstår flera språk. I Iberoamerika, till exempel, kan spanska och portugisiska ofta förstås av personer som inte har spanska som modersmål, vilket gör att de kan dela den vetenskapliga scenen. Samma sak gäller i Spanien med de flesta av landets officiella språk.


Inga hierarkier, inga kategorier

 

Alltför ofta betraktas vetenskaplig forskning på andra språk än engelska automatiskt som andra klassens forskning, utan hänsyn till kvaliteten på själva arbetet.


Denna skadliga fördom ignorerar det arbete som utförs av de inblandade, särskilt inom humaniora och samhällsvetenskap. Det undergräver också på ett djupgående sätt den globala akademiska gemenskapens förmåga att dela med sig av kunskap till samhället.


Genom att försvara och bevara flerspråkigheten för forskarsamhället forskningen närmare dem som behöver den. Om man misslyckas med att uppnå detta mål innebär det att den akademiska världen inte kan utveckla eller utöka sin publik. Vi måste arbeta noggrant, systematiskt och konsekvent på alla språk som vi har tillgång till.


Logistiken för att stärka den språkliga mångfalden inom vetenskapen

 

Att göra ett språk starkare inom akademin är en komplex process. Det sker inte spontant, utan kräver noggrann samordning och planering. Insatserna måste komma från offentliga och privata institutioner, medier och andra kulturella kanaler, liksom från politiker, vetenskaplig diplomati och forskarna själva.


Många av dessa delar måste fungera i harmoni, vilket framgår av det spanska nationella forskningsrådets arbete inom ES CIENCIA, ett projekt som syftar till att förena vetenskapliga och politiska insatser.


Akademisk publicering och AI-modeller: en ny utmaning

 

Den globala akademiska miljön håller på att förändras till följd av den digitala övergången och nya modeller för öppen tillgång. Forskning om utgivare av vetenskapligt innehåll på andra språk kommer att vara avgörande för att förstå detta skifte. En sak är dock klar: att göra vetenskapligt innehåll som produceras på ett visst språk synligt och sökbart online är avgörande för att säkerställa dess styrka.


När det gäller akademiska böcker har övergången till öppen tillgång knappt börjat, särskilt inom den kommersiella förlagssektorn, som ger ut cirka 80% av de vetenskapliga böckerna i Spanien. Precis som när det gäller onlinepublicering kommer en tydlig förståelse att göra det möjligt att utforma policyer och modeller som tar hänsyn till de olika sätten att sprida vetenskaplig forskning, inklusive de som kommunicerar lokalt och på andra språk. En större språklig mångfald inom bokutgivningen kan också göra det möjligt för oss att på ett korrekt sätt erkänna det arbete som förlagen gör för att sprida forskning till icke-engelsktalande.


Att göra publikationer, dataset och andra icke-språkliga forskningsresultat lätta att hitta är en annan viktig faktor, som kräver både vetenskapligt och tekniskt stöd. Detsamma gäller för att utöka korpusen av vetenskaplig litteratur på spanska och andra språk, särskilt eftersom denna används i generativa modeller för artificiell intelligens.


Om AI-systemen inte innehåller vetenskapligt innehåll på olika språk kommer de att sprida information som är ofullständig, partisk eller vilseledande: i en färsk rapport från den spanska regeringen om situationen för spanska och andra officiella språk påpekas att 90 procent av den text som för närvarande matas in i AI är skriven på engelska.


Djupstudier av terminologi är avgörande

 

Forskning om terminologi är av yttersta vikt för att förhindra att improviserat, oprecist språk eller obegriplig jargong används. Det kan också ge enorma fördelar för kvaliteten på både mänskliga översättningar och maskinöversättningar, specialiserad språkundervisning samt indexering och organisering av stora mängder dokument.


Terminologiarbete på spanska utförs idag tack vare bearbetning av stora språkkorpusar av AI och forskare i TeresIA-projektet, en gemensam insats som samordnas av Spaniens nationella forskningsråd. Det krävdes dock 15 år av upp- och nedgångar för att få igång ett sådant projekt på spanska.


Baskien, Katalonien och Galicien har å andra sidan arbetat intensivt och systematiskt med sina respektive språk. De har inte bara tagit itu med terminologin som en offentlig språkpolitisk fråga, utan har också under lång tid engagerat sig i etablerade terminologiprojekt.


Flerspråkighet är en global fråga

 

Behovet av en bredare mångfald gäller också Iberoamerika som helhet, där insatser samordnas för att främja spanska och portugisiska inom den akademiska världen, särskilt av Iberoamerikanska Generalsekretariatet och Mexikos nationella råd för humaniora, vetenskap och teknik.


Även om detta verkligen behövs kan vi inte främja regionens två mest talade språk och samtidigt bortse från dess mångfald av inhemska och samofficiella språk. Dessa är också involverade i kunskapsproduktionen och är ett medel för överföring av vetenskaplig information, vilket framgår av insatserna i Spanien.


Varje land har sin egen unika roll att spela när det gäller att främja en större språklig mångfald i den vetenskapliga kommunikationen. Om detta kan uppnås kommer styrkan hos de iberiska språken - och alla språk för den delen - inom den akademiska världen inte att vara beroende av välmenande men sporadiska insatser. Den kommer i stället att vara ett resultat av forskarsamhällets engagemang för en kultur av kunskapsdelning.


Elea Gimenez Toledo

Artikeln har överssatts från den engelska versionen  i The Conversation den 27 mars 2024, men publicerades ursprungligen på spanska.


(Denna nätdagbok är knuten till nätverket Språkförsvaret)


Söndagens svenskspråkiga sång

 

Magnus Lindholm - Vid diktens port


Söndagens svenskspråkiga dikt 

 

När dikten kommer till dig 

 

När dikten 

kommer till dig

var beredd.

 

Den kanske har ett

budskap

vill bli hörd och sedd.

 

Kan hända minner den 

om något ömt.

 

En närhet till nånting

du nästan glömt.

 

När dikten kommer till dig

öppna dina sinnen.

 

För nuet

och för oskattbara 

minnen.

 

Brita af Geijerstam


(Denna nätdagbok är knuten till nätverket Språkförsvaret)

Indien, världens folkrikaste land med 1,45 miljarder invånare, är också ett land med stor språklig mångfald. Antalet språk uppskattas uppgå till minst 30 och högst 122; de olika uppskattningarna beror naturligtvis på hur språk respektive dialekt definieras. 
 
Indoariska är den största språkfamiljen och inkluderar språk som hindi, urdu och bengaliska. Dravidiska språk talas främst i södra Indien och omfattar tamil, telugu, kannada och malayalam. Sino-tibetanska språk är vanliga i nordöstra Indien, med exempel som manipuri och bodo. Austroasiatiska språk är mindre utbredda men inkluderar språk som santali och mundari. 
 
Om man summerar andelarna för de största indoariska språken (hindi, bengali, marathi, urdu, gujarati och punjabi)  och även inkluderar mindre indoariska språk och dialekter, kan den totala andelen av befolkningen som talar indoariska språk uppskattas till över 70 %, eller cirka 1,015 miljarder människor. Hindi står ensamt för 40 procent.
 
Dravidiska språk talas av ungefär 24 procent av Indiens befolkning, vilket motsvarar cirka 348 miljoner människor. Dessa språk är huvudsakligen fördelade i de södra delstaterna som Tamil Nadu, Kerala, Karnataka, Andhra Pradesh och Telangana. De dravidiska språken ingår i en språkfamilj som inte har något känd släktskap med andra språkfamiljer och omfattar omkring 26 språk. 
 
I Indien finns det 22 officiella språk som erkänns av den indiska konstitutionen. Dessa språk inkluderar bland annat hindi, bengaliska, telugu, marathi, tamil, urdu, gujarati, malayalam, kannada och sanskrit. Hindi och engelska är de två huvudsakliga språken som används på nationell nivå för administrativa och officiella ändamål.
 
Detta betyder att varje indisk regering – och även indiska företag och läroanstalter – måste kommunicera med befolkningen på en rad olika språk. Detta har lett till att Indien ligger i framkant vad gäller utvecklingen av maskinöversättningsverktyg. Eftersom jag ville veta mer om vilka neurala maskinöversättningsverktyg Indien utvecklat, ställde jag den frågan till Perplexity, som gav följande svar:
 
”Ja, Indien har utvecklat verktyg för neural maskinöversättning (NMT) som utnyttjar framstegen inom artificiell intelligens och djupinlärning. Här är några viktiga utvecklingar:
 
- Den indiska regeringen har stöttat forskning och utveckling inom maskinöversättning sedan 1980-talet, och institutioner som C-DAC, IIT Kanpur och Jawaharlal Nehru University har lett projekt. C-DAC Pune utvecklade till exempel MANTRA, ett system för att översätta engelska till hindi, som används i specifika regeringssammanhang som Rajya Sabha1.
- Anuvadaksh-projektet, som leds av C-DAC Pune, översätter engelska till flera indiska språk (t.ex. bengali, hindi, marathi) med hjälp av tekniker som Tree Adjoining Grammar (TAG) och statistisk maskinöversättning (SMT)1.
- IndoWordNet, en lexikalisk databas för indiska språk, har utvecklats för att stödja maskinöversättning, med hindi som grundspråk.
- Google introducerade Neural Machine Translation (NMT) för nio indiska språk (t.ex. hindi, bengali och tamil) 2017, i syfte att förbättra översättningsnoggrannheten och överbrygga klyftan mellan mänskliga översättningar och datoröversättningar.
- Reverie Inc. utvecklade ett NMT API för översättning mellan engelska och 22 officiella indiska språk, med fokus på lokaliseringsbehov.
- Ny forskning har utforskat transformatorbaserade NMT-system för översättning mellan engelska och indiska språk som hindi, tamil och malayalam, med hjälp av toppmoderna arkitekturer för att förbättra översättningskvaliteten.
 
Dessa insatser visar på Indiens framsteg när det gäller att utveckla NMT-verktyg, även om det fortfarande finns utmaningar när det gäller att hantera språk med få resurser och nyanserade översättningar.”
 
Per-Åke Lindblom
 
(Denna nätdagbok är knuten till nätverket Språkförsvaret)