Het merendeel van de artikelen in het WNW bestaat uit “gewone artikelen”, d.w.z. artikelen waarin u alle betekenissen van een woord opgesomd vindt, liefst in een zo eenvoudig mogelijke structuur, met twee structuurlagen: kernbetekenissen en subbetekenissen.
Het WNW is een synchroon woordenboek. Dat betekent dat woorden met dezelfde vorm, maar een verschillende etymologische herkomst samen in één artikel behandeld worden, ongeacht of ze etymologisch gezien dezelfde herkomst hebben.
Soms is het vormelijke of semantische verschil tussen de woorden echter zo groot dat de behandelde woorden in één artikel wél onderscheiden worden door zogeheten “koepels”. De redacteur kan een ‘overkoepeling’ aanbrengen, waarbij hij globaal betekenis en/of woordsoort kan aangeven. Onder die ‘koepel’ bevat het formulier bij een koepelartikel verder dezelfde categorieën en subcategorieën als bij het normale artikel.
In het WNW zijn de verschillende onderdelen van een koepelartikel gemarkeerd door hoofdletters: A, B, C enz.
Een artikel in het Woordenboek van Nieuwe Woorden (WNW) bestaat uit de volgende onderdelen:
Als eerste wordt de lemmavorm getoond. Als er meerdere lemmavormen zijn, worden deze door een slash (/) gescheiden. Voorbeeld: ma/MA/Ma/mA.
Het onderdeel betekenis en gebruik vormt het hart van een WNW-artikel. Betekenissen zijn verdeeld in hoofd- en subbetekenissen die genummerd zijn. Per betekenis worden de volgende informatiecategorieën onderscheiden:
Het veld definitie bevat de definitie van het behandelde trefwoord. In afwijking van wat in de lexicografie gebruikelijk was, wordt in het WNW in de definitie van een overgankelijk werkwoord het object meegedefinieerd.
Restricties
Bij de definitie kunnen aanvullende gegevens staan over de betekenis of het gebruik van het trefwoord: restricties als Gezegd van meisjes of Met betrekking tot boeken, opmerkingen over de betekenis die niet in de definitie thuishoren en verwijzingen naar andere woordenboekartikelen. Opgegeven restricties staan direct voor de definitie (tussen haakjes), terwijl opmerkingen en verwijzingen direct onder de definitie staan.
Onder de genummerde betekenissen van het lemma kunnen gegevens over bijzonderheden gebruik vermeld worden, zoals taalvariëteit, stijl, houding, domein, frequentie, tijd en medium van het betreffende woord.
Naast de definitie kan een afbeelding getoond worden en/of is een geluidsbestand of een video beschikbaar.
De betekenisrelaties tussen verschillende betekenissen worden getoond in het veld betekenisbetrekking. De waardes zijn: metafoor; metonymie; specialisering; generalisering; onduidelijk.
Het WNW onderscheidt zich van alle andere woordenboeken door de opname van een semagram. De geestelijke vader van het semagram, oud-hoofdredacteur prof. dr. Fons Moerdijk, heeft het semagram als volgt omschreven:
“Een semagram is de weergave van met een woord te verbinden kennisgegevens in een frame met ‘slots’ en ‘fillers’. ‘Slots’ zijn conceptuele-structuurelementen die kenmerken en relaties noemen die gelden voor de betekenisklasse waartoe een woord behoort (bv. KLEUR, GEUR, SMAAK, SAMENSTELLING, GRONDSTOFFEN, BEREIDING voor de klasse van de drankbenamingen)."
Het semagram bevat dus alle voor de woordklasse relevante (vaak ook encyclopedische) gegevens over het beschreven woord. Het semagram is eigenlijk een uitvoerige biografie van het woord in kwestie en biedt veel meer informatie dan een definitie kan doen.
Bovenin het semagram wordt met een aanloopzinnetje ingevuld tot welke klasse het betreffende woord wordt gerekend.
Onder het semagram kan een link staan naar een gerelateerd semagram. Bij hyperoniemen worden de algemene kenmerken in het semagram van het hyperoniem vermeld en worden alleen de afwijkende kenmerken vermeld bij het hyponiem.
Het belangrijkste onderdeel van het semagram zijn de kenmerken. In het WNW wordt een zeer gedetailleerde set van kenmerken gebruikt, o.a. afmeting, dimensie; geluid; geur; gevoelsindruk; kleur; lichtreflectie; omvang concreet; smaak; transparantie; uiterlijk; vorm; waarneembaarheid.
Semagrammen worden vooral gegeven bij substantieven: vooral woorden met een relatief hoge frequentie en bij voorkeur grondwoorden. Naar bevind van zaken kan van deze richtlijn afgeweken worden.
Naast de hierboven beschreven kenmerken is er voor wetenschappelijke, technische termen en woorden uit de flora en fauna een aparte categorie wetenschap, waarin de volgende kenmerken kunnen worden ingevuld (en waarbij geen “aanloopzinnetjes" worden gebruikt): wetenschappelijke naam; rijk; stam; klasse; orde; familie; geslacht; soort; atoomnummer; formule; geheel; groep; symbool.
In het WNW worden bijna altijd voorbeelden opgenomen van het woord, in vrij gebruik of in combinaties, vaste verbindingen e.d. Dat zijn in de regel voorbeelden uit het ANW-corpus, maar het kunnen ook voorbeelden zijn die op internet of, een heel enkele keer, in niet-digitale bronnen gevonden zijn.
In het WNW worden de oorspronkelijke bronteksten zoveel mogelijk intact gelaten, d.w.z. ook als de spelling niet conform de huidige voorschriften is, wordt dat niet verbeterd. Wel wordt er ingegrepen bij “storende” taalfouten (bv. dt-fouten). Alle voorbeeldzinnen eindigen met een punt, en vraagteken, een uitroepteken of met aanhalingstekens sluiten. Uit een aantal voorbeeldzinnen zijn stukjes weggelaten. De reden daarvoor kan zijn:
Uitgangspunt bij de weglatingen was het intact laten van de voorbeeldfunctie van het citaat. Weglatingen worden weergegeven door vierkante haken met drie puntjes ertussen ([…]) gevolgd door het leesteken dat voor het vervolg van de voorbeeldzin staat.
Krantenkoppen in een voorbeeldzin zijn voorzien van een slotpunt en plaatsnamen (die vaak volgen na de krantenkop) zijn weggelaten zonder […]. De tekstopmaak van de bron is niet gehandhaafd.
De datering van een voorbeeldzin kent drie vormen:
Veel voorbeeldzinnen zijn ongedateerd. Dit betreft dan vooral internetbronnen.
Het WNW onderscheidt zich niet alleen van andere woordenboeken door zijn semagrammen, maar ook door zijn aandacht voor de combinatiemogelijkheden van woorden. Er wordt onderscheid gemaakt tussen combinatiemogelijkheden en vaste verbindingen. Bij combinatiemogelijkheden gaat het erom de patronen vast te leggen en te presenteren, de syntactische combinatiemogelijkheden te tonen die zich bij een woord voordoen. In de praktijk gaat het hier vooral om zeer vertrouwde/conventionele vrije verbindingen en (lexicale en grammaticale) collocaties. Bij verbindingen draait het om twee hoofdgroepen: vaste, idiomatische verbindingen (de betekenis van een gehele combinatie is niet uit zijn bestanddelen te herleiden) of combinatiemogelijkheden die in hun vorm een gevestigd formuleachtig karakter hebben.
Combinatiemogelijkheden worden onderscheiden naar type: substantief; werkwoord; adjectief; bijwoord; voornaamwoord; telwoord; overig.
Bij substantief: als object bij een werkwoord; als subject bij een werkwoord; met adjectief ervoor; met adjectivisch tegenwoordig deelwoord; met adjectivisch voltooid deelwoord; met voorzetselgroep; in voorzetselgroep; in voorzetselgroep met werkwoord; in voorzetselgroep met werkwoord gevolgd door voorzetselgroep; als object bij werkwoord met vast voorzetsel; in voorzetselgroep met werkwoord en vast voorzetsel; met substantief ervoor; met substantief erachter; met telwoord ervoor; met telwoord erachter; met adjectief erachter; met infinitief met te; met infinitief met om te; met dat-zin; met vraagzin; met of-zin; met alsof-zin; met aanwijzend voornaamwoord; met bezittelijk voornaamwoord; met onbepaald voornaamwoord; met persoonlijk voornaamwoord; voorafgegaan door naamvalsgenitief; gevolgd door naamvalsgenitief; met eigennaam; met lidwoord; met ander nevengeschikt substantief; overige.
Bij werkwoord: met subject; met object; met object en substantief; met object en adjectief; met object en bijwoord; met object en substantief indirect object; met object en indirect object met aan; met object en vast voorzetsel; met object en als-bepaling; met indirect object; met indirect object met aan; met voorzetselgroep; met bijwoord; met ondervindend voorwerp; met adjectief; met infinitief; met een infinitief met te; met een infinitief met om te; met een dat-zin; met een vraagzin; met een of-zin; met een alsof-zin; met een als-bepaling; in voorzetselgroep met aan het; in voorzetselgroep met uit; met directe rede; met substantief = inherent object; met ander, nevengeschikt werkwoord; overig.
Bij adjectief: met substantief; met bijwoord; met werkwoord; met voorzetselgroep; met infinitief met te; met infinitief met om te; met dat-zin; met of-zin; met verplicht object; met ander, nevengeschikt adjectief; overig.
Bij bijwoord, voornaamwoord en telwoord: met substantief ervoor: met substantief erachter; met adjectief ervoor; met adjectief erachter; met bijwoord; met werkwoord; met voorzetselgroep; met telwoord; met voornaamwoord; met voltooid deelwoord; met tegenwoordig deelwoord; met infinitief met te; met infinitief met om te; met dat-zin; overig.
Per combinatietype worden een of meerdere voorbeelden gegeven.
Onder vaste verbindingen verstaat het WNW vaste, idiomatische verbindingen (de betekenis van een gehele combinatie is niet uit zijn bestanddelen te herleiden) of combinaties die in hun vorm een gevestigd formuleachtig karakter hebben. Er wordt dus onderscheid gemaakt tussen combinatiemogelijkheden en vaste verbindingen. In tegenstelling tot combinatiemogelijkheden hebben vaste verbindingen wel een betekenisomschrijving.
Bij spreekwoorden gaat het om volledige zinnen in een min of meer vaste vorm die een bepaalde levenswijsheid verkondigen. Net als bij vaste verbindingen wordt bij spreekwoorden een betekenis gegeven.
In het veld Woordfamilie worden de woorden opgesomd die tot de woordfamilie van het trefwoord behoren, waarbij de volgende velden onderscheiden worden:
Daarnaast zijn er de velden ‘Uitheemse woordreeks’ voor woorden met dezelfde wortel en ‘Reekshoofd’, voor het uitgangswoord in zo’n reeks.
Eventueel kunnen ook overige woordfamilieleden worden vermeld.
Alle nieuwe woorden worden voorzien van etymologische informatie omdat we ze bij wijze van spreken onder onze ogen zien ontstaan en de gegevens ervan zo zonder veel moeite zo nauwgezet mogelijk vast zijn te leggen. De categorie etymologie bevat de volgende velden en subvelden:
De volgende woordsoorttypes worden onderscheiden: substantief, werkwoord, adjectief, lidwoord, voornaamwoord, telwoord, bijwoord, voorzetsel, voegwoord, tussenwerpsel. De verschillende types hebben ieder een eigen structuur:
a) bij substantief worden gegevens vermeld over:
b) bij werkwoord worden gegevens vermeld over:
c) bij adjectief worden gegevens vermeld over:
d) bij lidwoord worden gegevens vermeld over:
e) bij voornaamwoord worden gegevens vermeld over:
f) bij telwoord worden gegevens vermeld over:
g) als bijwoord is ingevuld, wordt een structuur zichtbaar met de volgende velden:
h) bij voorzetsel worden gegevens vermeld over:
i) bij voegwoord worden gegevens vermeld over:
* als “nevenschikkend” is ingevuld, kan een keuze worden gemaakt uit de waardes: aaneenschakelend; tegenstellend; causaliteit aanduidend; gevolgaanduidend
* als “onderschikkend” is ingevuld, kan een keuze worden gemaakt uit de waardes: grammatisch verbindend; van tijd; van causaliteit; van gevolg; van graadaanduidend gevolg; van doel; voorwaardelijk; van toegeving; van omstandigheid; beperkend; uitbreidend; van verhouding; van vergelijking; van modaliteit
j) bij tussenwerpsel worden geen aanvullende gegevens vermeld.
Onder spelling worden vermeld: de afbreking van de lemmavorm, de afbreking van de flexievormen (bv. de verbogen vorm van het bijvoeglijk naamwoord, het meervoud van een zelfstandig naamwoord, het voltooid deelwoord van een werkwoord), en, indien van toepassing, de gangbare afkorting of het gangbare grafische symbool en al dan niet erkende varianten.
Het blok woordrelaties bevat de volgende categorieën:
- Een hyperoniem is een woord dat de betekenis van een ander woord insluit, d.w.z. het is het naastgelegen, hogere begrip.
- Een synoniem is een woord dat hetzelfde of vrijwel hetzelfde betekent als een ander woord. Sommige taalkundigen betwijfelen of echte synoniemen wel bestaan. Anderen maken onderscheid tussen volsynoniemen (= woorden die precies hetzelfde betekenen) en halfsynoniemen (= woorden die vrijwel hetzelfde betekenen). In het WNW worden in het veld Synoniem in ieder geval de volsynoniemen opgenomen, maar kunnen ook halfsynoniemen vermeld worden.
- Een antoniem is een woord met een tegengestelde betekenis.
- Een feminiem is de vrouwelijke variant van een woord.
- Een androniem is de mannelijk variant van een woord.
Onder woordvorming wordt aangegeven hoe het lemma gevormd is. De volgende gevallen worden onderscheiden:
Het is mogelijk dat een lemmawoord een meervoudige woordvorming toegekend krijgt, bijvoorbeeld wanneer iets zowel een samenstelling als een samenstellende afleiding kan zijn of wanneer niet uit te maken valt of een woord samengesteld is uit substantief + substantief of werkwoordstam + substantief. Ook als een woord in het Nederlands ongeleed is, maar in de brontaal geleed, kan het lemma een meervoudige woordvorming krijgen, in dit geval zowel het predicaat “ongeleed” als “in brontaal geleed”.
Onder uitspraak wordt aangegeven hoeveel lettergrepen de lemmavorm heeft, waar de hoofdklemtoon ligt, hoe het woord wordt uitgesproken (Engels, Frans, Duits, Italiaans, Spaans, Nederlands en Engels, Nederlands en Frans, Nederlands en Duits, Nederlands en Italiaans, Nederlands en Spaans).
Daarnaast is er een veld voor de fonetische schrijfwijze.
In juni 2015 zijn ruim 94.000 woorden in de WNW-database voorzien van een fonetische transcriptie, waarvan een groot aantal nu al online te zien is. De transcripties zijn automatisch gegenereerd door ReadSpeaker en waar nodig handmatig gecorrigeerd. De gebruikte foneemset is een afleiding van IPA (International Phonetic Alphabet).
Medeklinkers | Klinkers/tweeklanken | Niet-inheems | |||
---|---|---|---|---|---|
Symbool | Voorbeeld | Symbool | Voorbeeld | Symbool | Voorbeeld |
p | pen | ɪ | pit | ɑː | far |
b | biet | i | vier | æ | cat |
t | tak | i: | analyse/creep | θ | think |
d | dak | ʏ | put | ð | these |
k | kat | y | fuut | ɹ | right |
ɡ | goal | ɛ | pet | aɪ | right |
m | mens | eː | beet | ɜː | player |
n | nek | ə | de | u: | you |
ŋ | eng | øː | neus | ɔ̃ | bon |
n j | oranje | ɑ | pat/van | ɑ̃ | vivant |
f | fiets | aː | baad | ɛ̃ | l(i)ngerie |
v | oven | ɔ | rosse | w | water |
s | sok | oː | boot | ɔɪ | boy |
z | zeep | u | hoed | ʁ | tres bien |
ʃ | chef | ɛɪ | bijt | ʌ | nut |
ʒ | jury | œy | buit | eɪ | lay |
x | acht | ɑu | nauw | aʊ | power |
ɣ | gaan | ʏ: | shirt | ||
r | rat | ɛː | barrière | ||
h | hoed | ɔː | roze | ||
w | wang | ɪ | pit | ||
j | ja | ||||
l | land | ||||
t͡ʃ | Tsjechisch | ||||
d͡ʒ | John |
Symbool | Voorbeeld | |
---|---|---|
Hoofdklemtoon | * | [ *d r oː x ] |
Nevenklemtoon | ' | [ *d r oː x - b u . 'k ɛ t ] |
Samenstellingsgrens | - | [ *d r oː x - 'b l u m ] |
Syllabegrens | . | [ *d r oː . m ə n ] |
Woordgrens | | | [ *n ɑ . t j ə | *ɛ n | *d r oː x . j ə ] |
De transcripties geven een voorbeeld van de uitspraak van het woord. Er zijn vaak meerdere varianten mogelijk, bijvoorbeeld [ *ɑu . t oː ] en [ *oː . t oː ]. In het WNW wordt vooralsnog in ieder geval één van de uitspraakmogelijkheden weergegeven.
ReadSpeaker maakt tekst-naar-spraaktoepassingen en werkt daarom pragmatisch: de woorden zijn zo getranscribeerd dat de uitspraak van de tekst-naar-spraaktoepassing goed klinkt. Het kan daarom voorkomen dat uitspraakprocessen zoals assimilatie niet overal consequent zijn weergegeven in de transcripties. Enkele andere opmerkingen: