0
Renates Seiten! DFÜ-Kürzel - Smilies, Abkürzungen und die Netiquette Inhalt  | KÜRZEL online v2.76

. Inhaltsverzeichnis KÜRZEL .
vorige Seite KÜRZEL Inhaltsverzieichnis nächste Seite
. Seitenende .

  Die Kiste mit den Umlauten
... und andere Kompatibilitätsprobleme  

0
  Seitenanfang
  Seitenende


In der virtuellen Welt müssen sehr unterschiedliche technische Systeme mit oft nationalen Eigenheiten miteinander kommunizieren. Wie schnell da Probleme auftauchen, kann z.B. jeder Windows-Benutzer ausprobieren, der eine auf seinem Rechner unter DOS abgespeicherte TXT-Datei öffnet. Ein großer Teil wird problemlos lesbar sein, aber anstelle der Umlaute stehen kryptische Zeichen.

Es mußten also Regelungen geschaffen werden, um die verschiedenen Systeme zur Darstellung der jeweils richtigen Zeichen zu veranlassen. Viel hängt dabei auch heute noch von der Software und ihrer Einstellung ab. Nachstehende Erläuterungen beschreiben die verschiedenen Systeme und Begriffe. Wie und wo genau Einstellungen vorgenommen werden kommt auf die Software an, aber das für verschiedene Programme zu erklären würde den Rahmen dieser Datei sprengen. Bitte RTFM!

Erläuterung zu Codierungen

7-bit-encoding bedeutet, daß nur 128 Zeichen von (#0 bis #127) erlaubt sind. Alle anderen werden verschluckt oder nicht richtig dargestellt (-> US-ASCII).

8-bit-encoding erlaubt 256 Zeichen (#0 bis #255), einige Zeichencodes sind aber nicht zulässig oder auf Steuerzeichen wie Zeilenvorschübe beschränkt (-> ASCII).

BASE64 ist eine Codierung für binäre Daten. Das macht z.B. der Mail-Client beim Versenden eines binären Nachrichten-Anhangs (Bilder, Programme), wenn beim Versender MIME eingestellt ist. Der Code eines so bearbeiteten Bildes hat ASCII-Format und läßt sich zum Beispiel leicht zweckentfremdet im Quelltext einer Webseite unterbringen, es ist dann direkt in die Seite eingebunden und wird nicht referenziert. Allerdings gibt's Einschränkungen und Nachteile.

HTML ist die Seitenbeschreibungssprache des Internet und basiert auf US-ASCII-Text. Nationale Sonderzeichen und Zeichen, die vom HTML-Code verwendet werden müssen, wenn sie auf dem Bildschirm international richtig angezeigt werden sollen "maskiert" werden, d.h. mit anderen Zeichen umschrieben. WYSIWYG-Editoren machen das zumeist automatisch, ohne daß der Autor etwas davon bemerkt, Quelltext-Editoren haben i.d.R. eine Funktion für eine Umsetzung: Aus Ü wird Ü.
Viele Mail-Programme ermöglichen das Versenden von Nachrichten im HTML-Format. Das sieht dann für den Sender zwar schön aus, ist aber nicht üblich und wird ohne gesonderte Vereinbarung den Empfänger meist ärgern ("Multipart").

MIME (Multipurpose Internet Mail Extension) ist ein allgemein akzeptierter Standard. Dabei wird im Kopf ("Header") einer Nachricht der verwendete Standard (=die verwendete Zeichentabelle) deklariert, das empfangende und anzeigende Programm bekommt Anweisungen zum Umgang mit dem Text. Das erleichtert auch den Austausch von binären Anlagen ("Attachments"). Sende- und Empfangsprogramm müssen diesen Standard unterstützen. Das ist bei den meisten modernen eMail- und Newsreadern der Fall, aber der sehr verbreitete Forté Free Agent, den diese Autorin benutzt kann es z.B. nicht.
Wichtig: Im Header einer MIME-codierten Nachricht sollten nur US-ASCII Zeichen stehen. Das gilt auch für die Betreff-Zeile ("Subject"), also hier unbedingt Sonderzeichen vermeiden!

quoted printable, 7bit-Format (7-bit-encoding), d.h. alle Zeichen oberhalb des Zeichens # 127 werden in das Format "="+Zweistelliger Hexcode vom Originalzeichen überführt und das Gleichheitszeichen ebenfalls kodiert, z.B. wird ü zu =FC.
Programme, die quoted printable nicht darstellen, produzieren einen z.T. kaum lesbaren Text. Bitte im deutschen Sprachraum möglichst vermeiden und statt dessen 8-bit-encoding ("as it is") einstellen! Der derzeit gültige RFC und einige FAQs in Newsgroups sehen das anders, aber so gibt's wirklich weniger Probleme. Wenn Du's nicht glaubst - sieh' Dir mal in einem Newsarchiv wie http://groups.google.com mit quoted printable codierte Nachrichten an! Außerdem können User, die MS Outlook Express verwenden, aus qp-formatierten Nachrichten nicht korrekt zitieren. - Sinn dieses Formates waren ursprünglich Schwierigkeiten beim Transfer von 8-bit-Nachrichten zwischen verschiedenen Datendiensten, aber diese alten, problematischen Gates sind so gut wie ausgestorben.

ROT13 bedeutet, daß jeder Buchstabe um 13 Stellen im Alphabet nach rechts verschoben wird (2xROT13 = lesbarer Text). Sinn ist nicht das Verschlüsseln oder Geheimhalten von Mitteilungen, sondern das Unkenntlich machen bestimmter Informationen. Benutzt wird es z.B. bei Spoilern (d.h. Informationen, die dem User, der vielleicht eine bestimmte Folge einer Fernsehserie noch nicht gesehen hat, den Spaß verderben würden) oder Anzüglichkeiten und dergleichen. Der User, der sich die Mühe macht und den Text decodiert ist selbst schuld, wenn der Inhalt ihm nicht gefällt.

uuencoding / uudecoding wird zum Transport von Binärdaten (z.B. Programmen, Archiven oder Bildern) zwischen 7-Bit und 8-Bit-Systemen verwendet. Dazu wandelt ein Programm (wie z.B. "WINCODE") die 8-Bit-Binärdaten in einen Code um, der mit 7 Bit darstellbar ist. Beim Empfänger müssen solche Dateien, die üblicherweise auf UUE enden, wieder decodiert werden. Es gibt unterschiedliche Systeme dazu, Absprache zwischen Sender und Empfänger ist sinnvoll.

 

0
  Seitenanfang
  Seitenende

Erläuterung zu Zeichensätzen

Der Newsreader eines Lesers muß erkennen können, was er darstellen soll - nur so kann eine Nachricht auch so erscheinen, wie sie verfaßt wurde. Dazu dienen die folgenden Kodierungen:

ANSI bzw. iso-8859 entspricht im wesentlichen dem erweiterten ASCII -Zeichensatz, aber z.T. sind andere Sonderzeichen enthalten und sie sind anders geordnet. Diese Zeichensätze werden z.B. unter Windows verwendet.
iso-8859-1 (Latin-1) ist der von der European Computer Manufacturer's Association (ECMA) festgelegte Zeichensatz für den Westeuropäischen und Nordamerikanischen Raum und ist die sinnvollste Einstellung für die deutschsprachige Korrespondenz. Er enthält alle länderspezifischen Sonderzeichen und entspricht bei den Zeichen #0-#127 dem US-ASCII-Zeichensatz. Zur iso-8859-Familie gehört u.a. noch iso-8859-9 (Latin-5) für den türkischen Sprachraum.

ASCII (American Standard Code for Information Interchange) in erweiterter Form enthält 256 Zeichencodes = 2 hoch 8 Bit (#0 bis #255) mit vielen Sonderzeichen und nationalen Zeichen (8-bit-encoding). Vergleiche auch US-ASCII.

code page 850 ist die Zeichentabelle, die im deutschen Sprachraum unter DOS meist benutzt wird.

Unicode sprengt die Grenzen konventioneller Zeichensätze. Jedes Zeichen wird durch eine zwei Byte lange Zahl ausgedrückt, auf diese Weise lassen sich bis zu 65536 Zeichen unabhängig vom installierten Zeichensatz darstellen. Das System ist relativ neu und bedarf der Unterstützung durch entsprechende Software. Ab dem HTML-Standard 4.0 können auf Homepages Zeichen in Unicode notiert werden. Für Nachrichten aller Art ist es ungeeignet.

US-ASCII (American Standard Code for Information Interchange) hat per Definition 128 Zeichencodes = 2 hoch 7 Bit (#0 bis #127), enthält kleine und große Buchstaben, Zahlen und einige Sonderzeichen (7-bit-encoding). Meistens wird einfach von ASCII gesprochen.

Windows-1252 bzw. Western (ISO)
auch Bill Gates' Privatcodierung genannt - standardkonformer Zeichensatz - Benutzung trotzdem nicht empfohlen, weil für die USA optimiert, einige Zeichen könnten bei einigen Usern in Mitteleuropa nicht richtig dargestellt werden.

Euro - die neue Währung schafft ein besonderes Problem. Sie ist in keinem der bisher üblichen Zeichensätze enthalten. Benutzer von "älteren" Systemen müssen ein Upgrade installieren, z.B. in WIN98 und NT 5.0 gehört es zum Lieferumfang und ist auf den bisher nicht benutzen ANSI-Zeichenwert 128 gelegt. Für weltweite Kompatibilität reicht das noch nicht.
Nach dem HTML-Standard 4.0 kann das Euro-Symbol als € oder € referenziert werden, evtl. auch als €. Aber auch dafür müssen Autor und Leser das Zeichen erst einmal installiert haben. Sicherer ist, eine kleine Grafik einzubinden oder die allgemein anerkannte Zeichenfolge EUR zu benutzen.

 

0
  Seitenanfang
  Seitenende

Konfiguations-Empfehlungen für Mail- und News-Software

... für Header in Mail- und News-Software: Unabhängig von der verwendeten Software am besten keine Sonderzeichen in der Betreffzeile und im Namen verwenden, das kommt je nach Empfänger als unleserliches Zeichenkuddelmuddel an. Beginnt die Betreffzeile einer empfangenen Nachricht z.B. mit =?iso-8859-1?Q?, dann hat der Absender Sonderzeichen benutzt, die beim Senden kodiert wurden und jetzt nicht mehr richtig dargestellt werden. Wenn's geht, die Software auf "keine 8-bit-Codierung im Header zulassen" konfigurieren.
Hinweis: Netscape-Benutzer sollten Ihre eMail-Adresse in Anführungsteichen einschließen oder am Ende ein Leerzeichen eingeben, da sonst die weltweite Identifikationsnummer der Nachricht (MID) nicht richtig kodiert wird.

... für Nachrichtentexte im deutschen Sprachraum: In der Software MIME-Codierung (Mime-Version 1.0) einstellen und auf 8bit setzen, als Zeichensatz iso-8859-1 (Latin-1, Westeuropa/Nordamerika) auswählen. Kann die Software das nicht oder sind beim Empfänger andere Einstellungen üblich, sollten Umlaute umschrieben werden: Für Ü also Ue schreiben oder "U, für ß ss oder sz ... . - Unter Content-Transfer-Encoding sollte "quoted printable" besser deaktiviert werden wenn möglich (Empfehlung dieser Autorin, um Sinn und Unsinn von qp werden erbitterte Diskussionen geführt). Außerdem hindere Deine Software unbedingt am Versenden sog. "Multipart-Artikel", also am Verschicken Deines Textes gleichzeitig im Textformat und in einem anderen, meist HTML. Die richtige Einstellung hierfür (Content-Type) heißt "text/plain" und erscheint wie die anderen Konfigurationsdaten im Header Deiner Nachricht.
BTW ein Programm, das Umlaute automatisch und sehr komfortabel beim Eintippen umsetzt ist KDrive von Martin Austermeier (http://ourworld.compuserve.com/homepages/Martin_Austermeier ).

... allgemein: NETtiquettelesen! Viele Punkte sind Konsens in den Datennetzen und werden dort noch einmal aufgegriffen.

... für die Verwender von AOL-Software (Stand: Frühjahr 2000): AOL-Kunden ist es nicht möglich, entsprechend der NETtiquette zu posten oder andere Software als die mitgelieferte für eMails zu verwenden. Z.B. ist es in der Software nicht vorgesehen, den Realnamen einzutragen - als Absender steht der Screenname bereits fest. Durch die voll funktionsfähigen, nicht kontrollierbaren Test-, bzw. Gratis-Accounts ist dieser Anbieter die natürliche Heimat für jede Art von Netz-Missbrauch (wovon unerwünschter Werbemüll noch das geringste Problem darstellt). AOL reagiert diesbezügliche Beschwerden nicht. Daher stehen bei vielen Usern IDs mit der Endung @aol generell im Killfile. Abhilfe schaffen ein neuer Newsreader (siehe auch NUA, wobei die in den großen Browsern eingebauten weniger brauchbar sind), eine neue ID/Absenderadresse (empfehlenswert ist der kostenlose Dienst www.gmx.de, der sehr wirksame Spamfilter hat) und evtl. ein anderer Newsserver (z.B. http://news.dfncis.de , vorher Rules lesen).

... für die Verwender von MS Outlook Express (Stand: Frühjahr 2000): Die Formatierung des eMail-Textes erfolgt erst beim "Senden" bzw. "Bereitstellen", der Autor kann nicht sehen, was mit seinem/ihrem Text passiert. Es werden Zeilenumbrüche entsprechend der eingestellten Zeilenlänge auch in Zitaten gemacht, dabei das Zitatkennzeichen ">" nicht als solches beachtet. Jedes "Senden" bzw. "Bereitstellen" erzeugt eine (überflüssige) Leerzeile am Ende der Nachricht. Dafür werden vorhandene Leerzeichen am Ende jeder Zeile entfernt - inklusive das des Usenet-konformen Signaturtrenners(-- ). Letztes bleibt nur stehen, wenn keinerlei Sonderzeichen in der Nachricht enthalten sind.
Dazu kommt, daß aus "quoted printable"-Ursprungsnachrichten nicht korrekt zitiert werden kann, weil OE dann das Setzen von Zitatkennzeichen ">" nicht erlaubt.
Diese und andere Eigenheiten verlangen genaue Programmkenntnisse des Users, es ist daher für einen Neueinsteiger ungeeignet.

... und so sollte es im Header einer eigenen Nachricht aussehen:

Mime-Version: 1.0
Content-Type: text/plain; charset=iso-8859-1
Content-Transfer-Encoding: 8bit

Fundstellen für Hinweise zu News-Clients und eMail-Clients

('tschuldigung, noch sehr unvollständig)

Allgemein:
http://www.cgarbers.de/newsreaderFAQ.htm oder http://www.crosswinds.net/~cgarbers/faq/newsreaderFAQ.htm und
[Info] Postings (Header/Kopfzeilen) ueberpruefen: news:de.newusers.questions

News/eMail: MS Outlook Express (Lieferumfang MS Internet Explorer)
FAQ: http://www.henrik-reimers.de/oe5/
FAQ: http://oe-faq.de.vu
Newsgroups: news:de.comm.software.newsreader oder news:microsoft.public.de.german.ie40.outlookexpress
Liste von OE-Macken: http://www.wschmidhuber.de/oeprob

News/eMail: Messenger (Lieferumfang Netscape)
FAQ: http://home.t-online.de/home/Peter.Dobler/netscape.htm
Newsgroup: news:de.comm.software.newsreader

News: Opera
FAQ: Bisher nur in den mitgelieferten Dokumenten
OPERA-Newsserver news://opera.nta.no/opera.deutsch
Newsgroup: news:de.comm.software.newsreader

News: Forte Agent /Forte Free Agent
Newsgroup: news:de.comm.software.forte-agent
FAQ: http://www.westfalen.de/paefken/forteagent

News: Xnews:
FAQ: http://www.hreimers.de/Xnews
Newsgroup: news:de.comm.software.newsreader

Lokaler Newsserver: Hamster
FAQ: http://www.tglsoft.de/
Newsgroup: news:hamster.de.newuser und andere in der hamster.de.*-Hierarchie
Newsgroup: news:de.comm.software.newsserver

0
  zum Seitenanfang

(08/2001)·Logo, klein © Renate Husmann 1995-2004
Jede Verwendung von Inhalten bedarf meiner schriftlichen Genehmigung · Impressum · schreiben