Taaltechnologen voorspellen Time-persoon van het jaar (fout)

Barrack Obama, man van 2013

Obama: man van het jaar (volgens taaltechnologen)

Ik vond net een al wat ouder berichtje van Alpha Galileo of eigenlijk de Radbouduniversiteit: Taaltechnologen voorspellen TIME’s persoon van het jaar met een computermodel. Het lijstje ziet er als volgt uit:
1: Barack Obama
2: Vladimir Putin
3: Miley Cyrus
4: George W. Bush
5: Angelina Jolie
6: Katie Couric
7: David Bowie
8: Rush Limbaugh
9: John Kerry
10: Hamid Karzai

Van Paus Frans, de echte winnaar, geen spoor. Trots vertellen de taaltechnologen dat ze met hun programma de uiteindelijke winnaars uit het verleden hadden voorspeld (achterspeld zou beter zijn). 78% van de door de computer gekozen winnaars zouden in de top 10 hebben gestaan. In 29% werd voor de echte winnaar gekozen. Dit zijn uitmuntende scores omdat het magazine in elke jaargang vaak meer dan 5000 verschillende personen vermeldt, vermeldt het persbericht van de Radbouduniversiteit trots. Ik zou zeggen: hou er maar mee op. De kans dat je op je bek gaat is een ietsje te groot en dan heb je het gevaar dat mensen zeggen: goh, als dat wetenschap is, wat heb ik daar dan aan? Je zou zelfs nog kunnen volhouden dat die voorspelling wetenschappelijk nog best een aardige (geen uitmuntende) prestatie, maar wat moet je er mee? O ja, voor dat Radboud al blaam treft: ook de universiteit van Antwerpen (???), het Meertens-instituut en de universiteit van Illinois, of althans onderzoekers aldaar werkzaam, hebben aan het voorspellende programma meegewerkt.

Bron: Alpha Galileo

Slimtels bedreigen Zweeds gezinsleven

Peuterhersens veranderen niet door taalverwerving

Myeline De hersenstructuur van jonge kinderen verandert niet of nauwelijks door taalverwerving. Dat is de conclusie van onderzoekers van de Amerikaanse Brown-universiteit en het Engelse King’s College. Ze publiceerden hun bevindingen in de Journal for Neuroscience. Als peuters beginnen met praten leidt dat in hersengebieden voor taal niet tot het ontstaan van nieuwe hersenstructuren. Lees verder

Kunstmatige intelligentie op niveau 4-jarige

We zijn altijd danig onder de indruk van de kunsten waartoe computers in staat zijn. Op sommige domeinen is dat terecht: computers, zoals de naam al suggereert, kunnen rekenen als de beste. Op andere terreinen zijn computers klunzen. Je hoeft maar twee seconden met digitale robot gesproken te hebben om er achter te komen dat die te dom is voor woorden. Er zit vooruitgang in, laat het Britse blad New Scientist ons weten. Met woorden heeft kunstmatige intelligentiehet nu geschopt tot het niveau van een 4-jarige. Op deelterreinen scoren computers goed, maar dat gebeurt meestal door toepassing van trucs, zoals Google Translate, dat gebruik maakt van een gigantische databank van uitdrukkingen, maar dat niet in staat is om een ‘menselijke manier’ te vertalen. Een soortgelijk databanksysteem hebben onderzoekers op zijn ‘intelligentie’ getest. De onderzoekers, Robert Sloan en Stellan Ohlsson, gebruikten als toetssteen de databank ConceptNet die gevuld is met ’triviale’ weetjes als “een ijsje kan smelten”, ontwikkeld door Catherine Havasi van het medialab van het befaamde MIT in Boston. Denkende robot
Er waren vragen in vijf categorieën variërend van “Wat is een huis?” tot de wat lastiger “Je kunt er doorheen kijken, het is vierkant en het kan geopend worden. Wat is het?”. In zo’n geval gaat het systeem op zoek naar trefwoorden. Voor de drie belangrijkste categorieën (informatie, woordenschat en redeneren) vonden Sloan en Ohlsson dat ConceptNet het niveau van een 4-jarige haalde. Havasi benadrukt dat de onderzoekers alleen hebben gekeken naar de verbale vermogens en niet naar ruimtelijk en symbolisch redeneren. Op dat terrein zou de computer een stuk beter scoren. Volgens haar kom je met de jongste versie van ConceptNet, met zo’n 17 miljoen uitspraken, veel verder dan met de versie die de onderzoekers gebruikten. Sloane verwacht dat met een verbeterd algoritme ConceptNet even hoog zou scoren als een 5- of 6-jarige.

Bron: New Scientist

Pratend programmeren

Het was een kwestie van tijd. Computers kunnen praten en begrijpen gesproken opdrachten, dus moet het mogelijk zijn dat ze programma’s maken op basis van gesproken taal. Onderzoekers rond Regina Barzilay van het MIT in Boston hebben een programma gemaakt, waarmee je pratend de computer kunt laten programmeren. Dat betekent dat iemand die weinig kaas heeft gegeten van het maken van coderegels voor computerprogramma’s nu zelf kan ‘programmeren’. Dat betekent niet dat programmeurs niet verder overbodig zijn. Op de eerste plaats is het programma nog (?) lang niet foutloos (het programma scoorde 70% goed bij 106 testopgaven in gesproken tekst. Bovendien snapt een computer lang niet altijd wat de tekst betekent en het is de vraag of dat ooit zal gebeuren.
Voor programmeurs kan zo’n programma ook handig zijn , want dan kunnen zij zich concentreren op de stukken die creativiteit vereisen. Je kunt veel van de computer zeggen, maar creatief is dat ding niet: het blaft zoals zijn baasje hem heeft leren blaffen.

Bron: New Scientist

Neanderthalers konden praten

Konden Neanderthalers meer dan grommen?Konden Neanderthalers meer dan grommen?

Dat beweren althans twee onderzoekers van het Max Planck-instituut voor Psycholinguistiek in Nijmegen. Niet allleen Neanderthalers konden praten, maar ook onze gemeenschappelijke voorouders (waarschijnlijk de Homo heidelbergenis). Dat zou dan betekenen dat er niet, zoals nu wordt aangenomen, er op aarde zo’n 50 tot 100 000 jaar gesproken wordt, maar zo’n 500 000 tot een miljoen jaar.
Door recente ontdekkingen, door herbeoordeling van oudere gegevens, maar vooral door de beschikbaarheid van oud DNA, is het besef gegroeid dat de Homo sapiens veel meer gemeen had met zijn, wat altijd beschouwd werd als, debiele broertje de Neanderthaler, die zich, naar onze overtuiging, slechts grommend verstaanbaar had kunnen maken. De onderzoekers, Dan Dediu and Stephen C. Levinson, hebben al die informatie doorgevlooid en zijn tot de conclusie gekomen dat taal en spraak al bestond voor het ontstaan van de moderne mens. Taal en spraak moeten zijn ontstaan na het ‘opduiken’ van de eerste mensachtige, zo’n 1,8 miljoen jaar geleden en het ontstaan van de Homo heidelbergenis, denken de twee linguïsten. Deze veronderstelling is strijdig met de tot nu toe aangehangen theorie dat taal en spraak plotseling zijn ontstaan door een enkele of een paar kleine mutaties in het erfgoed. Taal en spraak zouden zich, als de theorie van de twee waar is, langzaam (evolutionair) hebben ontwikkeld. Omdat de moderne mens DNA heeft ‘overgenomen’ van de Neanderthalers en Denisovanen (een andere uitgestorven mensensoort) – hetgeen betekent dat de soorten zich gemengd hebben- zouden we wel eens sporen van hun talen kunnen hebben overgehouden. Dat zou kunnen betekenen dat tenminste een deel van de taaldiversiteit is terug te voeren op de ontmoetingen tussen de diverse mensensoorten. Dat zou kunnen worden geverifieerd door Afrikaanse en niet-Afrikaanse talen met elkaar te vergelijken. De moderne mens komt immers uit Afrika en de Neanderthalers uit Eurazië.

Bron: Science Daily

Nederlands is een maffe taal, Duits nog maffer

Nederlands is een van de 25 mafste talen van de wereld, zo heeft taalblog/-bedrijf idibon.com uitgevogeld. Het Duits is met zijn tiende plaats zelfs nog een stukje maffer. Zelfs Engels is een behoorlijke geschifte taal: nr. 33 van de in het totaal 239 genoteerde talen. Hindi is de voorbeeldigste taal die er bestaat; van die 239 dan.
Maar er zijn toch veel meer talen? Dat klopt. De Wereldatlas van taalstructuren (WALS) heeft van 2676 talen gegevens, maar van lang niet alle talen waren genoeg gegevens bekend om ze in te kunnen schalen op de mafheidsschaal. Idibon keek naar een aantal zaken zoals woordvolgorde, lidwoorden, vragende zinnen enzovoorts. Vervolgens werd gekeken welke constructie het meest voorkwam. Dat was normaal. De rest was maf (eigenlijk afwijkend). Zo bekeek Idibon 162 contructies (WALS kent er 192). Een taal deed pas mee als van tweederde daarvan gegevens bekend waren in WALS. Vandaar die 239.

De 25 mafste talen van de wereld.

De 25 mafste talen van de wereld.
In Noord-Amerika: Chalcatongo Mixtec, Choctaw, Mesa Grande Diegueño, Kutenai en Zoque;
in Zuid-Amerika: Paumarí en Trumai; in Australië/Oceanië: Pitjantjatjara en Lavukaleve;
in Afrika: Harar Oromo, Iraqw, Kongo, Mumuye, Ju|’hoan en Khoekhoe;
in Azië: Nenets, Oost-Armeens, Abchasisch, Ladakhi en Mandarijn;
in Europa: Duits, Nederlands, Noors, Tjechisch en Spaans.


Dat betekent niet dat er alleen grote, westerse talen meededen. Er staan ook talen in de lijst die maar weinig sprekers hebben (enkele tienduizenden). Ainu, bijvoorbeeld, is een van de normaalste talen (nr. 3), maar deze in Japan (nog) gesproken taal wordt nog maar door een handjevol mensen gesproken en staat op het punt van uitsterven. Hongaars, door velen als gek en onbegrijpelijk gezien, is een van de normaalste talen van de wereld volgens deze maatlat.
Zegt zo’n lijst wat over de bruikbaarheid van een taal? Helemaal niks natuurlijk. Ook het Mandarijn (zeg maar algemeen beschaafd Chinees) is een maffe taal, want staat in de top 25.

Bron: Onze Taal