MWB - Markierung hochdeutscher Entsprechungen: Unterschied zwischen den Versionen

Aus WossiDiA
Zur Navigation springen Zur Suche springen
 
(5 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 132: Zeile 132:
 
[[Datei:S5.png|400px]]
 
[[Datei:S5.png|400px]]
  
<b>Lemma (Korr.) falsch</b>: Lemmakorrektur
+
<b>Fehler in <code>Beschreibung</code></b>: Artikelkorrektur
  
*Wenn das zusammengesetzte Lemma in <i>Lemma (Korr.) falsch zusammengesetzt wurde, z.B. ein kleingeschriebenes Substantiv oder ein großgeschriebenes Adjektiv ist, dann bitte in die Anmerkung <i>Lemmakorrektur</i> eintragen.
+
*Wenn im Artikel ein Fehler auftritt, z. B. ein Leerzeichen zu viel oder zu wenig angezeigt wird oder der gesamte Artikel kursiv geschrieben ist.
  
 
<b>Unsicher mit dem Artikel</b>: ?
 
<b>Unsicher mit dem Artikel</b>: ?
Zeile 154: Zeile 154:
 
#Präposition - Örtliche oder zeitliche Bestimmung (z.B. in, an, nach, hinter, auf)
 
#Präposition - Örtliche oder zeitliche Bestimmung (z.B. in, an, nach, hinter, auf)
 
#Interjektion - Wortähnliche Lautäußerungen (z.B. ach, och, buh, muh). Häufig als "Schallwort" im MWB angegeben
 
#Interjektion - Wortähnliche Lautäußerungen (z.B. ach, och, buh, muh). Häufig als "Schallwort" im MWB angegeben
#Partikel - Nichtänderbare Wörter. Adverbien, Präpositionen und Konjunktionen zählen dazu, aber müssen nicht zusätzlich ausgezeichnet werden
+
#Partikel - Nichtänderbare Wörter. die nicht immer eine syntaktisch feste Position haben und nicht notwendigerweise andere Wörter modifizieren (z.B. auch, eben, halt)
 
#Artikel - Kasusanzeigendes Wort für Substantive
 
#Artikel - Kasusanzeigendes Wort für Substantive
 
#Zahlwort - Eins, Zwei, Drei, Erste, Zweite, Dritte
 
#Zahlwort - Eins, Zwei, Drei, Erste, Zweite, Dritte
 
#Prüffall - Bei unsicheren Fällen bitte zusätzlich verknüpfen
 
#Prüffall - Bei unsicheren Fällen bitte zusätzlich verknüpfen
 +
#Präfix - Erster Wortteil zum Zusammensetzungen (z.B. <i>an-</i>). Es wird erstmal nicht zwischen tatsächlichen Präfixen (als unselbstständige Morpheme) und Bestimmungswörtern von Komposita unterschieden
 +
#Suffix - Hinterster Teil von Zusammensetzungen (z.B. <i>-ing</i>). Es wird erstmal nicht zwischen tatsächlichen Suffixen (als unselbstständige Morpheme) und Grundwörtern von Komposita unterschieden
 +
 +
==Information für den Zugriff über die API==
 +
to be continued

Aktuelle Version vom 18. Juli 2024, 12:59 Uhr

Hier wird der Workflow zur Markierung von hochdeutschen Entsprechungen und der Auszeichnung der Wortarten einzelner Lemmata des Mecklenburgischen Wörterbuchs definiert. Die Überprüfung wird in einem Zug durchgeführt und daher gesammelt hier dargelegt.

Vorbereitung

  1. Erstellung von Makros:
    1. Klicke nach dem Öffnen der WossiDiA-App auf Linker-Makros
    2. Erstelle folgendes Makro unter einem nachvollziehbaren Namen (Achtung: Die Makros werden später noch spezifischer, aber leider muss derzeit noch diese Variante gewählt werden)
    3. Klicke auf Makro erstellen

Makro wortart.PNG

Markierung von Definition und Übersetzung

Markierung des Definitionsbereichs der einzelnen Wörterbuchartikel

Artikel.PNG

In der WossiDiA-App unter Aufnahme-Metadaten finden sich Wörterbuchartikel. Die Artikel sind wir im Screenshot zu sehen aufgebaut:

  1. WBN-ID: Eindeutige Bezeichnung für den vorliegenden Artikel (Gültig in WossiDiA und im Trierer Wörterbuchnetz)
  2. Lemma: Vollständige Lemmaform (Achtung, derzeit noch fehleranfällig und ggf. nicht die letztendliche Form)
  3. Lemma (korr.): Korrigierte Form des Felds Lemma. Ist temporär und wird entfernt, sobald das andere Feld korrigiert wurde
  4. Band: Bandnummer im Mecklenburgischen Wörterbuch
  5. Spalte: Spaltennummer im Band
  6. Zeile: Zeile in der Spalte
  7. DEF: Definition / Hochdeutsche Entsprechung des Lemmas
  8. CIT: deu: Deutsche Übersetzung
  9. CIT: lat: Lateinische Übersetzung
  10. Lemma (Form): Lemma in der Form, wie im Wörterbuch
  11. Grammatik: Ggf. grammatische Angaben wie Genus, aber ist auch noch Work in Progress
  12. Bedeutung: Wörterbuchartikel (im Idealfall von der hochdeutschen Entsprechung / Übersetzung aus)
  13. Anmerkungen: Freies Feld für Anmerkungen der Bearbeiter*innen siehe Hier

Hellblaue Markerierung: Vom Algorithmus vorgeschlagene hochdeutsche Entsprechung / Übersetzung. Achtung! Wird häufig von der realen Stelle abweichen.


Workflow


  1. Überprüfe, ob der blaumarkierte Teil in Bedeutung die tatsächliche Definition des Lemmas ist. Sei dabei auf Zeichen genau (Keine unnötigen Semikolon, Doppelpunkt etc.)
    1. Falls korrekt: Drücke F1
    2. Falls nicht korrekt: Markiere im Feld Bedeutung den richtigen Definitionsteil und drücke F2
  2. Falls eine wortwörtliche hochdeutsche Übersetzung vorhanden ist, markiere diese und drücke F3
    1. Falls eine lateinische Übersetzung vorhanden ist, markiere diese und drücke F4
  3. Bei mehreren Bedeutungsangaben oder Übersetzungen werden diese einzeln markiert und mit der entsprechenden F-Taste ausgewählt. Verschiedene Markierungen werden dann mit || voneinander getrennt.
  4. Überprüfe, ob die verknüpfte Wortart

Achtung: Falls die Definition nur aus einer wortwörtlichen Übersetzung besteht, reicht es mit F3 die Übersetzung zu markieren.

Achtung: Derzeit werden Angaben für Unterteile der Artikel (z.B. 1., 2., 3., I., II., III.) teilweise leider nicht angezeigt, was es schwierig macht mehrere Bedeutungsangaben eines Artikels zu erkennen. Das wird noch behoben und erstmal kann es ignoriert werden.



Beispiele


Nur hochdeutsche Übersetzung

Def4.png

  1. Hochdeutsche Übersetzung CIT: deu wurde markiert]
Hochdeutsche und Lateinische Übersetzung

Def3.PNG

  1. Definitionsbereich DEF stimmt und F1 gedrückt
  2. Hochdeutsche Übersetzung wurde markiert
  3. Lateinische Übersetzung wurde markiert
Mehrere hochdeutsche Übersetzungen

Multi def.PNG

  1. Erste Definition wird markiert und mit F2 bestätigt

Multi1.PNG

2. bleich markieren und als hochdeutsche Übersetzung mit CIT: deu mit F3 einfügen

Multi3.PNG

3. Zweiten Bedeutungsteil markieren und bei DEF mit F2 einfügen

Multi4.PNG

4. weißmachen markieren und als hochdeutsche Übersetzung mit CIT: deu mit F3 einfügen

Multi cit.PNG


5. In Anmerkung auf den Verweis blicken zeigen mit "vgl blicken"

Multi5.PNG

Hochdeutsche Übersetzung eingebettet

Cit5.png

  1. Bedeutung neu markiert und mit F2 bestätigt
  2. Hochdeutsche Übersetzung ist hier mit , vom Lagerkorn zwar näher definiert, aber eingesunken selbst kann als Übersetzung genommen werden.
Definition besteht nur aus niederdeutschem Wort

Ver1.png

  1. Definition bestätigt mit F1
  2. Verweis hinzugefügt in Anmerkung
dass. oder ebenso als Defintion

Ver2.png

  1. dass. als Definitionsbereich
  2. Verweis auf das vorherige Lemma in Vollform
obsc.

Obsc..png

  1. obsc. steht für obscoen bzw. obszön. Es ist eine Angabe zum Register bzw. Stil, keine Bedeutungsangabe.
Nur in Reimen

Reime.png

  1. Wenn solche Angaben zum Gebrauch in Reimen lediglich auf die Benutzung bzw. grammatische Informationen damit gegeben werden, ist es keine Bedeutung.

Anmerkungen


  • Anmerkungen können genutzt werden, wenn die vorliegenden Arbeitsschritte nicht ausreichen, um alle Informationen zu einzutragen. Bei systematischen Problemen, die immer wieder auffallen, bitte Bescheid geben, damit dafür ein einheitliches Vokabular erstellt werden kann.

Vokabular

Vergleich: vgl Vollform des Lemmas z.B. vgl blicken

Mehrere Lemmata mit || voneinander trennen

Beispiele S1.png S2.png S3.png S5.png

Fehler in Beschreibung: Artikelkorrektur

  • Wenn im Artikel ein Fehler auftritt, z. B. ein Leerzeichen zu viel oder zu wenig angezeigt wird oder der gesamte Artikel kursiv geschrieben ist.

Unsicher mit dem Artikel: ?

  • Wenn man sich unsicher ist, wie der Artikel richtig ausgezeichnet werden muss, bitte in die Anmerkung ein einfaches Fragezeichen setzen. Bei den Wortartverknüpfungen gilt weiterhin der Wortartknoten Prüffall

Bestimmung der Wortart

  • Es gibt 15 verschiedene benutzbare Wortartknoten:
  1. Substantiv - Konkrete oder abstrakte Dinge. Haben einen Artikel (Wenn auch nicht unbedingt beim Stichwort)
  2. Personenname - Eigentlich keine Wortart (Work in Progress), aber immer auch ein Substantiv
  3. Ortsname - Eigentlich keine Wortart (Work in Progress), aber immer auch ein Substantiv
  4. Flurname - Eigentlich keine Wortart (Work in Progress), aber immer auch ein Substantiv
  5. Verb - Enden meist auf -en, -ern, -eln, -hn
  6. Adjektiv - Bestimmt Substantive (Notfalls die Beispielsätze im Wörterbuchartikel anschauen)
  7. Adverb - Nicht beugbare Wörter, die Verben, Substantive, Verben oder andere Adverbien näher bestimmen. Umstandswort (z.B. nachts, sobald)
  8. Konjunktion - Verbindungswörter (z.B. und, oder, wenn)
  9. Pronomen - Wort, dass Nomen vertritt
  10. Präposition - Örtliche oder zeitliche Bestimmung (z.B. in, an, nach, hinter, auf)
  11. Interjektion - Wortähnliche Lautäußerungen (z.B. ach, och, buh, muh). Häufig als "Schallwort" im MWB angegeben
  12. Partikel - Nichtänderbare Wörter. die nicht immer eine syntaktisch feste Position haben und nicht notwendigerweise andere Wörter modifizieren (z.B. auch, eben, halt)
  13. Artikel - Kasusanzeigendes Wort für Substantive
  14. Zahlwort - Eins, Zwei, Drei, Erste, Zweite, Dritte
  15. Prüffall - Bei unsicheren Fällen bitte zusätzlich verknüpfen
  16. Präfix - Erster Wortteil zum Zusammensetzungen (z.B. an-). Es wird erstmal nicht zwischen tatsächlichen Präfixen (als unselbstständige Morpheme) und Bestimmungswörtern von Komposita unterschieden
  17. Suffix - Hinterster Teil von Zusammensetzungen (z.B. -ing). Es wird erstmal nicht zwischen tatsächlichen Suffixen (als unselbstständige Morpheme) und Grundwörtern von Komposita unterschieden

Information für den Zugriff über die API

to be continued