Semantisch landschap

Uit ROSA Wiki
Ga naar: navigatie, zoeken

Deze pagina bevat een concepttekst die momenteel in bewerking is.
Toelichting: Dit is een tweede opzet voor de uitwerking van het thema Semantisch landschap binnen ROSA

Gegevensdefinities en standaardisatie.png

Inleiding

Semantisch landschap

Aanleiding
In ketenprocessen waar meerdere partijen gegevens uitwisselen is een gemeenschappelijke taal essentieel. Waar voorheen processen in het algemeen los van elkaar werden uitgevoerd (‘silo's’), zijn de wensen en zelfs eisen steeds meer gericht op hergebruik van data en verhogen van de kwaliteit. Het thema ‘semantisch landschap’ gaat over de betekenis van die gegevens of data die uitgewisseld worden tussen ketenpartijen.

Scope van het thema
Het semantisch landschap omvat alle begrippensets, gegevenswoordenboeken en informatiemodellen die vallen binnen het domein van ROSA. Om deze semantiek toegankelijk te krijgen zijn voorzieningen en ontwerpkaders nodig en daarom maken ook deze deel uit van dit thema. Wat niet onder het thema valt zijn de data zelf en de (technische) communicatieprotocollen.

Relatie met andere thema's
Dit thema heeft raakvlakken met de andere ROSA-thema’s Identiteiten authenticatie en autorisatie (leerlingidentificatie) en Veilige en betrouwbare onderwijsketen (welke gegevens mogen in welke uitwisselingen worden gebruikt). Semantiek hoeft niet automatisch voor iedereen open toegankelijk te zijn, maar het zal wel meerwaarde bieden als andere partijen de gegevensdefinities kunnen hergebruiken. Dit thema heeft daarmee ook raakvlakken met het thema Open data.

Raakvlakken buiten ROSA
Semantiek in het onderwijs is niet alleen onderling verbonden, maar is ook geënt op semantiek buiten het onderwijs. De NORA beschrijft het Nationaal Semantisch Vlak waar veel raakvlakken mee zijn. Dit is onderdeel van het NORA-thema "Semantiek". In het Amerikaanse onderwijsdomein wordt semantiek beschreven door organisaties als IMS Global, CEDS (Common Education Data Standards) en de Ed-Fi Alliance.

Ontwikkelingen

Ontwikkelingen die nauw met elkaar samenhangen staan op deze pagina bij elkaar in dossiers. De dossiers zijn een hulpmiddel voor de Architectuurraad die aangeeft of een dossier relevant is en verdieping behoeft. Het oppakken van een dossier kan leiden tot adviezen, bijvoorbeeld aan de ontwikkelpartijen.

Gegevenssets naar linked data

Gegevensset Beschrijving
Herziene kwalificatiestructuur SBB is met Kennisnet (technisch partner) een traject gestart om de Herziene Kwalificatiestructuur beschikbaar te stellen als linked data. Dit gebeurde eerst via de onderwijsbegrippen-API en later via een SPARQL-endpoint. De data is vrij beschikbaar en daarmee te bestempelen als Linked Open Data (LOD).
Moderniseren Gegevenswoordenboek DUO In opdracht van het Ministerie van OC&W zet DUO concepten en gegevenstypen uit het gegevenswoordenboek om in linked data. Het gegevenswoordenboek omvat zaken als RIO, BRON, Verzuim en Facet. Het is de bedoeling dat de linked data open beschikbaar komt.
Inventarisatie van metadata over leerlingen Definities van leerlinggegevens worden in veel standaarden van Edustandaard gebruikt, zoals EDEXML, UWLR en de OSO-gegevensset. De onderlinge samenhang tussen deze gegevensdefinities is nog maar beperkt in kaart hetgeen hergebruik beperkt. Kennisnet is gestart met een inventarisatie van deze gegevens en brengt de onderlinge samenhang in kaart. Via browsers kunnen views-op-maat worden verkregen op deze gegevens ter ondersteuning van de werkgroepen bij doorontwikkeling. Ook de ECK-attributenset zoals in ontwikkeling binnen Edu-K is opgenomen in de inventarisatie.
Inventarisatie indicatoren verantwoordingsketen In het verantwoordingsdomein worden van de vele indicatoren de definities opgesteld, aangescherpt en onderling in samenhang gebracht. Het gaat om MBO Transparant, Vensters po, Vensters vo en het Dashboard Passend Onderwijs. Kennisnet is gestart met een inventarisatie van deze indicatoren en verwerkt ze als linked data.

Ontwikkeling van semantiek

Gegevensset Beschrijving
Registratie instellingen en opleidingen (RIO) Binnen het programma Doorontwikkelen BRON wordt gewerkt aan een nieuwe Registratie instellingen en opleidingen (RIO). RIO gaat voor veel processen en toepassingen de plaats van het huidige BRIN innemen. BRIN is in beginsel opgezet en ingericht voor de bekostigingsprocessen. Het doel van RIO is beter aan te sluiten bij andere onderwijsgerelateerde processen zoals toezicht en horizontale verantwoording. De BRIN-systematiek blijft bestaan als toepassing van RIO gericht op het bekostigingsproces. Voor het RIO-informatiemodel is vanuit de Architectuurraad een architectuurscan uitgevoerd.
Redesign OBK/Curriculumdomein Het Onderwijsbegrippenkader (OBK) is in 2012 geïnitieerd door SLO en Kennisnet als de basis voor vocabulaires voor zoeken en vinden in de educatieve contentketen met het oog op duurzaam metadateren. Het OBK was bij aanvang breed ingestoken: niet alleen gericht op leerdoelen en leerinhouden, maar ook op administratieve processen. Inmiddels is er sprake van voortschrijdend inzicht en zijn er knelpunten aan het licht gekomen die een herontwerp noodzakelijk maken. Daarmee wordt ook een stap gezet naar een schets van wat kan heten het Curriculumdomein.
Attributenbeleid ECK-ID Voor het uitwisselen van persoonsgegevens van leerlingen zijn privacy en beveiliging zeer belangrijk. Door een persisterend kenmerk te gebruiken bij de uitwisseling van persoonsgegevens kan de hoeveelheid data van leerlingen dat uitgewisseld wordt, verminderd worden. Het attributenbeleid ECK-ID stelt vast welke data van leerlingen in welke processen uitgewisseld mogen worden. Het attributenbeleid is in ontwikkeling binnen het platform Edu-K.

Ontwikkeling van linked-datavoorzieningen

Proeftuinen Linked Data (PLD’s)

In het curriculumdomein is een aantal proeftuinen ontwikkeld om mogelijke toepassingen voor linked data te laten zien.

Proeftuin Beschrijving
Proeftuin havo-eindexamens (2014-2016) Dit betrof een experimentele examentrainer voor 8 vakken gebaseerd op de CITO-eindexamenopgaves en de achterliggende psychometrische data. Deze opgaves en data zijn via de kernprogramma’s van SLO verbonden met de ca. 35 meest gebruikte methodes in de bovenbouw havo.
Proeftuin Rekenen po Dit betreft een experimentele leeromgeving voor rekenen po groep 7 en 8 waarin leermaterialen van enkele grote rekenmethodes zijn verbonden via de leerjaardoelen Rekenen van SLO en met enkele andere leerdoelenstructuren.
Proeftuin Doorlopende leerlijn vmbo-mbo (‘Leerlijnmatcher’) Door een nauwkeurige relatie te leggen tussen het examenprogramma vmbo en de herziene kwalificatiestructuur wordt inzichtelijk waar de doorstroom vmbo-mbo verbetering behoeft. Waar zitten ‘gevaarlijke’ niveauverschillen tussen het uitstroomniveau van het vmbo en het instroomniveau van het mbo? In de proeftuin ‘Leerlijnenmatcher’ wordt deze experimentele online-applicatie ontwikkeld voor en samen met mbo-docenten en onderwijsexperts.

Viewers op linked data

Binnen Kennisnet loopt er een project (zomer 2018) om eenvoudiger viewers te maken op gegevenssets die in linked data zijn opgeslagen. Eind augustus 2018 wordt naar verwachting de eerste viewer met deze techniek (Generic Viewer Parts) opgeleverd waarna er snel meerdere zullen volgen. Op dit moment zijn onderstaande viewers ontwikkeld. Deze zijn vanwege de ontwikkelstatus nog niet altijd openbaar.

Viewer Beschrijving
Kernprogrammabrowser Een browser die ontwikkeld is voor het raadplegen en doorzoeken van de kernprogramma's van SLO.
HKS-browser Een browser die in samenwerking met SBB is ontwikkeld door Kennisnet om de kwalificatiestructuur van SBB in linked data te kunnen tonen.
KOI-viewer Een viewer op KOI versie 1.1 die direct op de linked data is gemaakt. Het is nog een conceptversie die in afwachting van het project bij Kennisnet overgezet wordt in de nieuwe techniek.
Viewer op de leerlingelementen Veel Edustandaard-standaarden wisselen leerlinggegevens uit. Een aantal van hen zijn in samenhang met elkaar gebracht. In deze proef zijn UWLR 2.1, EDEXML 2.0 en het ECK attributenbeleid 1.0 meegenomen.
Vensters Encyclopedie Dit is de eerste viewer die opgeleverd gaat worden in de nieuwe techniek. Het gaat om de beschrijvingen van de indicatoren van po en vo Vensters en de relevante begrippen.
MBO Informatie-encyclopedie Deze viewer heeft nog geen directe koppeling met de achterliggende linked data en zal daarom nog een update krijgen naar de nieuwe techniek.
  • UWLR-viewer
  • OSO-viewer
  • Indexfunctie
  • Algemene browser op onderwijsbegrippen

PLDN’s open source-stack voor linked data-beheer

Vanuit het Kadaster zijn ze bezig met de ontwikkeling van een open source linked data-tool. De vraag aan partijen uit het onderwijsveld is of zij mee willen ontwikkelen aan deze tooling.

Ontwikkeling van ontwerpkaders voor linked data

Project Beschrijving
DB RIO PoC Linked Open Data De Registratie Instellingen en Opleidingen (RIO) kan mogelijk beter werken als deze als linked data wordt ingericht en open beschikbaar wordt gesteld. Om dit te onderzoeken heeft DUO een Proof of Concept (PoC) opgezet en deze is geëvalueerd begin september 2017. Er zijn adviezen beschreven over diverse ontwerpkaders zoals de keuze in linked data-tooling, synchronisatie, URI-strategie, structuur van de data, versiebeheer en gebruik van bestaande standaarden.
URI-strategie Om de linked data goed te kunnen bevragen, dient deze goed gestructureerd te worden. Elk element in linked data krijgt een unieke identifier, maar de opbouw van deze identifier kan op verschillende manieren. Moeten we voor het hele onderwijsveld dezelfde structuur gebruiken? Hoe gaan we dan om met elementen buiten het onderwijsveld die deze structuur niet hebben? Hoe betekenisloos en daarmee toekomstbestendig moeten de identifiers zijn? Met weinig betekenis zijn de data lastiger te bevragen. DUO en Bureau Edustandaard zijn onder andere met dit vraagstuk bezig.
Workshop architectuurkaders Linked Data Vanuit het Ministerie van OC&W worden een vijftal workshops gehouden met DUO, SBB, SLO, SURFnet en Kennisnet. De centrale vraag is hoe de verschillende partijen hun datasets kunnen linken met elkaar. Eind september 2017 heeft een eerste bijeenkomst plaatsgevonden met OCW, DUO en Kennisnet. De laatste workshop was op 22 februari 2018.
Ervaringen in het curriculum domein voor het beschikbaar stellen van gegevens in Linked Open Data Kennisnet heeft de laatste jaren diverse gegevensverzamelingen omgezet naar LOD. Dit document beschrijft de belangrijkste ervaringen die zijn opgedaan bij het omzetten van onderwijs-gerelateerde gegevens zoals vakkenlijsten, kerndoelen, examenprogramma’s, kernprogramma’s en mbo-kwalificaties naar Linked Open Data (LOD).
Linked Data standaarden voor het definiëren van een structuur voor een eigen datacatalogus Dit document bevat inzichten en ervaringen die zijn opgedaan vanuit het Platform Linked Data. In het acroniem BP4mc2 (Best Practices for meaningful connected computing) komt het delen van 'Best Practices' voor en symboliseert mc2 het nieuwe paradigma van het delen en verbinden van betekenis en informatie. De website http://www.bp4mc2.org is het platform dat dit proces ondersteunt.

Semantisch landschap in kaart

Een schematisch, niet-uitputtend overzicht van dit thema

Kernmodel Onderwijsinformatie (KOI)

Met het Kernmodel Onderwijsinformatie (KOI) kunnen begrippen uit verschillende contexten en ketenprocessen (bijvoorbeeld administratieve processen, toetsen, curriculum) met elkaar worden verbonden. Het KOI bevat de hoog-over linking pin-begrippen om begrippen uit verschillende domeinen met elkaar te verbinden. Dit maakt het een eerste ingang in het semantisch landschap van het onderwijs.

Bronnen met gegevensdefinities

Hieronder een lijst met bronnen met gegevensdefinities die mogelijk relevant zijn voor andere partijen om te gebruiken.

Gegevensset Werkingsgebied Beheer Beschrijving
Informatiemodel Lerarenregister
Standaarden die semantiek bevatten
* UWLR
* OSO
* EDEXML
* OCW Taxonomie
po, vo, mbo Edustandaard
HORA Gegevenswoordenboek ho
Gegevenswoordenboek Triple A mbo saMBO-ICT
Cito Gegevenswoordenboek Toetsen po, vo
DUO canonieke modellen po, vo, mbo, ho DUO schakelpunt Betreft een aantal gemeenschappelijke modellen en/of hun onderlinge relaties.
Begrippenset Kerndoelen vo, vso
Begrippenset Leerlingkenmerken vo, vso

Bestaande voorzieningen

Voorziening Beheer Beschrijving
KOI-tooling: EVN TopQuadrant Beheer gestandaardiseerde begrippen
Onderwijsbegrippen-API (Eduterm) Kennisnet API voor toegang tot gestandaardiseerde begrippen
Browsers op onderwijsbegrippen
* HKS-browser
* Kernprogrammabrowser
Kennisnet
Linked data theater Open source In eerste instantie ontwikkeld bij het Kadaster, in gebruik genomen door o.a. DUO

Vastgestelde ontwerpkaders

Ontwerpkader Beschrijving
Methode KOI
Linked Data (RDF) Technologie voor het verbinden (relateren) van begrippen (al dan niet open data) gebaseerd op RDF
SKOS Het Simple Knowledge Organization System biedt een structuur voor het vastleggen van zgn. 'concept schemes', zoals thesauri, classificatieschema's, taxonomies en andere vormen van controlled vocabularies

Samenwerking

Om een beeld te geven op welke plekken er gesproken wordt over semantiek staat hieronder een greep. Het is een eerste opzet en kan aangevuld worden, aangepast en verder worden onderverdeeld indien nodig.

  • Edu-K
  • Edustandaard
    • Werkgroep UWLR
    • Werkgroep OSO Gegevensset
    • Werkgroep Metadata
  • RIO Analysegroep (onderdeel van Programma Doorontwikkelen BRON)
  • Governance-organisatie OCW Taxonomie

Backlog voor de Architectuurraad

Deze backlog is een thema-brede backlog met acties voor de Architectuurraad. Veelal zullen dit besluiten, adviseringen en te monitoren zaken zijn.

  • Besluiten welke dossiers relevant zijn en verdieping behoeven.
  • Bepalen welke dossiers nog meer relevant kunnen zijn binnen dit thema.
  • Monitoren van de inventarisatie van bestaande begrippensets ed. in het Nederlandse onderwijs.
  • Monitoren van de inventarisatie van methodieken (ontwerpkaders) en voorzieningen voor het semantisch landschap.

Zie ook