Parse

Parsing of "syntactische analyse" is het proces van analyseren van een tekst, in natuurlijke- of computertaal, onder een aantal specifieke regels

Dat klinkt misschien wat ingewikkeld maar in de basis betekent het dat een computer een stuk tekst krijgt te zien en moet afleiden wat het stuk tekst inhoudt. Een heel eenvoudig voorbeeld:

(a + b) × 1

Voor een mens is dit redelijk eenvoudig. We lossen het op in enkele seconden: Er is een a en een b . Deze twee tellen we bij elkaar op en we vermenigvuldigen het met 1.

Dus? Wat is daar nou zo belangrijk aan?

In mijn dagelijkse werk…

Oh hallo trouwens.

Ik ben Luuk, digital media developer bij DimCoppen Online

… werk ik elke dag met programmeertalen die parsen.

Hoewel een eenvoudige 'formule' zoals bovenstaande door iedereen met een beetje verstand van wiskunde begrepen kan worden is voor een computer niet meteen duidelijk wat zo'n zin betekent.

De computer moet namelijk afleiden dat a een variabele is, dat b een variabele is en dat het geheel een formule is. Ook heeft de computer geen informatie over wat a of b dan precies zijn. Context is hier heel belangrijk.

Hey Siri!

Echt interessant (voor ons Geeks) wordt het als de formule de volgende is:

Naar welke school gaat de jongste dochter van de president van de verenigde staten en hoe lang al?

In deze 'formule' zitten zóveel variabelen dat een gemiddeld mens het antwoord niet kan geven.

Wat de Verenigde Staten zijn? Geen probleem. Wie de president hiervan is? Geen probleem (toch?). Hoeveel kinderen hij heeft? Hoeveel daarvan meisjes zijn? Wie van deze meisjes de jongste is? Wat haar naam is? Wat haar leeftijd is? Naar welke school ze gaat? Sinds wanneer ze hier naartoe gaat? Wat de huidige datum is? Het aantal dagen, weken, maanden, jaren van de huidige datum tot die begindatum?

Nogal wat vragen die ook nog afgeleid zijn van eerdere of latere vragen in dezelfde zin. Helemaal in stukken gehakt staat er dit:

  1. Verenigde Staten: Land
  2. President van (1): Persoon: Barack Obama
  3. Kinderen van (2): 2 Personen, Natasha & Malia Ann
  4. Filter (3) op vrouwelijk: Gelijk aan (3)
  5. Geboortedata van (4): Natasha: 10 juni 2001, Malia Ann: 4 juli 1998
  6. Jonger Persoon: Geboortedatum dichtst bij huidige datum
  7. Jongste van (5): Natasha
  8. Roepnaam van (5): Sasha (erg belangrijk bij het opzoeken van verdere informatie)
  9. Huidige School van (8): Sidwell Friends School in Washington, D.C.
  10. Start-Datum van (8) bij (9): 5 januari 2009
  11. Huidige Datum (ten tijde van schrijven): 12 juni 2016
  12. Verschil in Dagen tussen (11) en (10): 2715 dagen
  13. (12) in Eenvoudiger Taal, Nederlands: 7 Jaar, 5 Maanden, 7 Dagen

Dus een perfecte (op dit moment nog onbestaande) parser weet wat er gevraagd wordt, én het antwoord: Sidwell Friends School, 2715 dagen. Op het schermpje laten zien of uitspreken met een wat blikkerige stem en klaar is Siri. Toch?

Maar de berekende context is juist heel belangrijk voor het antwoord en vaak ook belangrijk voor degene die de vraag stelt. Daarom geeft Siri (in theorie) dit soort reacties:

Vraag: Naar welke school gaat de jongste dochter van de president van de verenigde staten en hoe lang al?

Antwoord: Barack Obama's jongste dochter, Natasha (bekend als Sasha) Obama, gaat sinds 5 januari 2009 naar Sidwell Friends School in Washington DC. Dat is nu al 7 jaar, 5 maanden en 7 dagen.

De regels voor wat er belangrijk is in de vraag, maar ook wat er verwacht wordt van het antwoord worden allemaal bepaald door parsers. Er bestaan vele verschillende manieren én namen voor het oplossen van dit soort vragen maar in de basis zijn het allemaal Parsers.

"Her" (2013)

Deze processen worden langzaam steeds sneller, beter en intelligenter en de opkomst van Slimme assistenten, Knowledge Navigators, Big Data, AI, Machine Learning en Quantum Computers gaat het zeker geen halt toeroepen.

Interessante ontwikkelingen op dit gebied zijn Facebook's Deeptext en Viv.

In de toekomst zullen we tegen onze telefoon en tegen ons huis kunnen praten. Zal de woonkamer aan de verwarming door kunnen geven dat je thuis bent, voegt de tuin toe dat het winter is en voegt je tablet dáár aan toe dat je het liever wat warmer hebt als je aan je laatste artikel bezig bent. Wánt bij eerdere artikelen vond je 21°C een fijne werktemperatuur.

Welke positie persoonlijke en bedrijfssites in gaan nemen (en óf ze überhaupt een plek hebben) in deze nieuwe wereld is nog de vraag maar zou het niet te gek zijn als je tegen je lievelingsblog kunt zeggen vat dit artikel voor me samen want ik heb weinig tijd en laat de auteur maar weten dat ik dit een te gek artikel vond? Ik kan in ieder geval niet wachten om met dit soort technologie aan de slag te gaan.