Wikipedia kommer snart att kunna tala med dig

Photo by Manfred Werner/Tsui, CC BY-SA 3.0.
Photo by Manfred Werner/Tsui, CC BY-SA 3.0.

Utvecklingen av Wikispeech har dragit igång och under 2017 är planen att Wikipedia ska kunna tala med dig.

Wikispeech, en s.k. talsyntes, syftar främst till att göra all den information som finns på Wikipedia tillgänglig för alla de som av någon anledning har svårt att läsa. Exempelvis på grund av att personen har en synnedsättning, har dyslexi eller aldrig fått gå i skolan och lära sig att läsa.

Alla ska kunna ta del av informationen på Wikipedia. Att endast erbjuda skriven text begränsar användningen för alltför många människor. Åtskilliga miljoner människor. Det här projektet är tänkt att vara en del av lösningen att förverkliga visionen om att nå ut med fri kunskap till alla världens människor.

Utvecklingen av ett talsyntes-tillägg för MediaWiki har noggrant utretts under en förstudie hösten 2015. Då identifierades vilka existerande delar som fanns och kunde integreras såväl som det som ännu saknades och behöver utvecklas.

Precis som allt annat som Wikimedia-rörelsen skapar kommer all mjukvara att vara fritt licensierad och likaså all taldata och dokumentation. Wikispeech kommer därmed även att kunna användas på andra wikis som drivs andra organisationer. Delar av talsyntesen kan även enkelt komma att användas av andra talsyntes-projekt så att ännu fler personer som inte kan läsa får ett enklare liv.

Vi hoppas att Wikispeech ska användas i många olika tjänster och att den gemenskap som utvecklar mjukvara och lexikonet kommer att ha en stor bredd.

Wikispeech logo. Photo by ElioQoshi, public domain/CC0.
Photo by ElioQoshi, public domain/CC0.

Många av de som har störst behov av information har inte tillgång till en egen dator (utan använder ex. internetcaféer) och/eller har begränsad kunskap hur datorer och smartphones fungerar. Inte heller har de tillgång till de välfungerande kommersiella verktyg som finns, på grund av kostnaderna. Även om ett MediaWiki-tillägg är mycket svårare att utveckla än ett fristående externt verktyg är det lättare att hitta igen för Wikipedias användare och ingen nedladdning krävs då det är en internetbaserad lösning. Ett MediaWiki-tillägg kan dock även enklare komma att inkluderas i tillägg utvecklade av andra grupper, exempelvis för uppläsning av undertexter i videos som används på Wikipedia, i Kiwix (offlineversionen av Wikipedia) m.m.

I slutet av projektet är målet att Wikispeech skall fungera på svenska och engelska, samt ha en fungerande prototyp på arabiska (för att visa att det fungerar på ett höger-till-vänster-språk). Kommersiella talsynteser fungerar endast på en fåtal av Wikipedias 294 språkversioner. Målet med Wikispeech är att det med tiden skall finnas på alla språk. Som allt annat Wikimedia-relaterat kommer det att vara möjligt att genom crowdsourcing förbättra Wikispeech. Den intresserade kan exempelvis utveckla det lexikon som programmet använder för att uttala orden så att det låter rätt (uttalet för varje ord beskrivs genom Internationella fonetiska alfabetet). På så sätt blir talsyntesen hela tiden bättre och irriterande fel kan åtgärdas av användaren. Projektgruppen känner inte till någon liknande lösning och tror att detta är första gången det görs. Wikispeech kommer även att ha en väldigt flexibel struktur där olika delar av talsyntesen (lexikon, röst m.m.) enkelt kan kopplas samman. När exempelvis en forskargrupp utvecklat en del som saknats för ett språk så kan det enkelt kopplas in.

Förhoppningen är att Wikipedia skall få ett ökat värde bland de personer som har minst resurser och är mest utsatta. En talsyntes har ett väldigt stort värde i många av världens fattiga länder där utbildningsgraden är låg. För kommersiella aktörer är det dock inte prioriterade marknader och här kan Wikispeech hjälpa till att täppa igen luckorna.

Post- och telestyrelsen finansierar det arbete som Wikimedia Sverige (projektägare) och projektparterna Södermalms Talteknologiservice AB (STTS) och Kungliga Tekniska Högskolan (KTH) gör i projektet. Totalt har projektet en budget på ca. 300 000 USD. Därtill har flera olika organisationer och forskargrupper (inte minst efter att projektet blivit omskrivet i över sextio stycken tidningsartiklar) erbjudit sig att på olika sätt hjälpa till med att förbättra mjukvaran.

För att göra det hela så transparent som möjligt och underlätta för volontärer att hjälpa till, komma med glada tillrop eller höja ett varningens finger så finns all planerad utveckling inlagd på Phabricator. Vi hoppas att du vill engagera dig, och stöd gärna projektet!

John Andersson, Wikimedia Sverige

Archive notice: This is an archived post from blog.wikimedia.org, which operated under different editorial and content guidelines than Diff.