PTC

So bereiten Sie eine CSV-Datei für die Übersetzung vor

Eine CSV-Datei, die sich sauber übersetzen lässt, hat stabile Schlüssel, klare Spalten für den Quelltext und eine korrekte UTF-8-Kodierung. Diese Anleitung behandelt jeden Vorbereitungsschritt. Sobald Ihre CSV-Datei bereit ist, können Sie sie in 3 Schritten mit PTC (Private Translation Cloud) übersetzen. Eine Übersicht über den eigenständigen CSV-Service finden Sie unter CSV-Dateien online mit KI übersetzen.

CSV ist das kleinste gemeinsame Vielfache unter den Übersetzungsformaten. Jedes Tabellenkalkulationsprogramm, jede E-Commerce-Plattform, jeder Analyse-Export spricht CSV. Diese Flexibilität ist ein zweischneidiges Schwert. Eine CSV-Datei, die in Excel „in Ordnung aussieht“, kann aufgrund von Spaltenmehrdeutigkeit, fehlenden Schlüsseln oder Kodierungsproblemen unmöglich sauber zu übersetzen sein. Diese Anleitung erklärt, was eine CSV-Datei übersetzungsbereit macht.

So sieht eine übersetzungsbereite CSV-Datei aus

Eine übersetzungsbereite CSV-Datei ist eine CSV-Datei, bei der:

  • Jede übersetzbare Zeichenkette einen stabilen, eindeutigen Schlüssel hat.
  • Die Spalte mit der Ausgangssprache klar gekennzeichnet ist.
  • Die Spalten für die Zielsprachen entweder bereits vorhanden sind (eine Spalte pro Sprache) oder eine CSV-Datei pro Zielsprache erzeugt wird.
  • Identifikatorspalten (SKU, ID, Bild-URL, Preis) offensichtlich nicht übersetzbar sind.
  • Die Datei gültiges UTF-8 ohne Kodierungsmehrdeutigkeit ist.

Zwei gängige Formen:

Breitformat (eine Spalte pro Sprache):

key,en,es,fr,de
welcome,Welcome,,,,
cart.empty,Your cart is empty,,,,
cart.items_one,"You have %{count} item",,,,

Langformat (eine Zeile pro Zeichenkette, eine Datei pro Sprache):

key,source
welcome,Welcome
cart.empty,Your cart is empty
cart.items_one,"You have %{count} item"

Beide funktionieren. PTC liest beide. Wählen Sie diejenige, die zu Ihrer bestehenden Pipeline passt.

Wählen Sie Spalten, die Übersetzer und PTC lesen können

Machen Sie die erste Zeile zur Kopfzeile. Verwenden Sie einfache, beschreibende Spaltennamen wie key, source_text und context. Ihr Übersetzungstool und alle menschlichen Prüfer wissen dann genau, was jede Spalte enthält.

Erforderliche Spalten. Jede übersetzungsbereite CSV-Datei benötigt mindestens eine key-Spalte und eine Spalte mit dem Quelltext.

  • Die key-Spalte enthält einen eindeutigen Identifikator für jede Zeichenkette. Ihre Anwendung verwendet ihn, um zur Laufzeit die richtige Übersetzung zuzuordnen. Verwenden Sie eine einheitliche Namenskonvention - nur Kleinbuchstaben, Unterstriche und Punkte. Gängige Formate: button.submit, error.invalid_login, onboarding.welcome_message. Ändern Sie einen Schlüssel niemals, nachdem die Übersetzung begonnen hat. Das Ändern eines Schlüssels erzeugt eine neue Zeichenkette und verwaist die bestehende Übersetzung.
  • Die Spalte mit dem Quelltext enthält den Originaltext in Ihrer Ausgangssprache.

Optional, aber nützlich: eine context-Spalte. Kurze Zeichenketten wie „Save“ oder „Back“ können je nach ihrem Erscheinungsort in Ihrer Oberfläche Unterschiedliches bedeuten. Ein kurzer Hinweis teilt dem Übersetzer (oder der KI) mit, wofür die Zeichenkette dient:

key,source_text,context
button.save,Save,Document editor toolbar
checkout.button.save,Save,Checkout address form

Bei großen Dateien hilft eine namespace- oder group-Spalte dabei, Zeichenketten nach Funktion oder Bereich zu organisieren.

Sprachspalten. Wenn Ihr Workflow Quelle und Ziel in derselben Datei hält, fügen Sie pro Zielsprache eine Spalte mit BCP-47-Codes als Kopfzeile hinzu. Verwenden Sie es_ES für Spanisch (Spanien), fr_FR für Französisch (Frankreich), pt_BR für Portugiesisch (Brasilien).

Verwenden Sie Schlüssel mit Punktnotation für die Hierarchie. cart.items.one und cart.items.other gruppieren sich auf natürliche Weise. Vermeiden Sie Leerzeichen in Schlüsseln.

Halten Sie Identifikatorspalten getrennt. Wenn Ihre CSV-Datei ein Produktkatalog ist, sollten die Spalten sku, handle, price und image_url allein durch ihre Namen offensichtlich nicht übersetzbar sein. Verstecken Sie sie nicht in einer generischen metadata-Spalte.

Eine CSV-Datei pro logischem Bereich. Mischen Sie nicht Zeichenketten der Admin-Oberfläche mit Marketingtexten in derselben Datei. Verschiedene Bereiche haben verschiedene Tonalitäten. Die Markenstimme von PTC funktioniert besser, wenn jedes Projekt eine kohärente Menge von Zeichenketten abdeckt.

Kennzeichnen Sie Platzhalter, damit PTC sie über alle Sprachen hinweg bewahrt

Platzhalter sind Token innerhalb einer Zeichenkette, die zur Laufzeit ersetzt werden. %s, %d, {name}, {{count}}, %{currency}. PTC bewahrt Platzhalter wortgetreu und übersetzt das Token selbst niemals.

key,source_text
greeting,"Hello, %{name}!"
cart.total,"Total: %{currency}%{amount}"
notification,"You have %{count} new messages"

Konventionen, die PTC standardmäßig erkennt:

  • %s, %d, %f, %1$s, %2$d - printf-Stil (gettext, Rails, Java).
  • {name}, {count}, {0} - Python str.format, .NET, ICU-Index-Syntax.
  • {{name}}, {{count}} - i18next, Mustache, Handlebars.
  • %{name}, %{count} - Rails I18n, Ruby.

Wenn Ihr Quelltext HTML-Tags (<strong>, <br>, <a href="">) enthält, behandeln Sie sie genauso wie Platzhalter. PTC erkennt und bewahrt sie über alle Formate hinweg, an der richtigen Position in jeder Zielsprache. Übersetzen Sie das Tag selbst niemals.

Wenn Sie eine eigene Konvention verwenden (z. B. [[token]]), deklarieren Sie sie im PTC-Projektglossar, und PTC respektiert sie in jeder Zeile.

Kodieren Sie Pluralformen als separate Zeilen, damit jede Sprache die richtigen Formen erhält

Die meisten Sprachen haben mehr als zwei Pluralformen. Viele haben Regeln, die kein englischer Muttersprachler vorhersagen würde. Polnisch hat one / few / many / other. Arabisch hat sechs Formen. Japanisch hat eine (keine Pluralunterscheidung). Ein Übersetzungstool, das nur Singular und Plural speichert, erzeugt für diese Sprachen falsche Ausgaben.

Kodieren Sie Plurale als separate Zeilen mit einer Suffix-Konvention:

key,source_text,context
cart.items.zero,Your cart is empty,Zero state
cart.items.one,"You have {count} item in your cart.",Singular: count = 1
cart.items.other,"You have {count} items in your cart.",Plural: count > 1

PTC liest die Suffixe _one, _other, _zero, _few, _many (gemäß der i18next-Konvention) und erzeugt die richtigen Pluralkategorien für jede Zielsprache.

Kombinieren Sie Pluralformen nicht in einer einzigen Zeichenkette mit Schrägstrichen oder Klammern, wie "You have {count} item(s) in your cart.". Dieser Ansatz ist nicht übersetzbar und bricht die Grammatik der meisten Sprachen.

Maskieren Sie Sonderzeichen, damit der CSV-Parser keine Zeilen zerbricht

CSV-Maskierungsregeln (RFC 4180):

  • Kommas innerhalb eines Felds: schließen Sie das Feld in doppelte Anführungszeichen ein, sonst teilt der Parser Ihre Zeichenkette über mehrere Zellen auf.
key,source_text
intro,"Welcome to our store, where every product matters"
  • Wörtliche doppelte Anführungszeichen: maskieren Sie sie durch Verdopplung.
key,source_text
quote,"He said ""hello"" and waved"
  • Zeilenumbrüche innerhalb eines Felds: in Ordnung, wenn das Feld in Anführungszeichen steht.
key,source_text
address,"123 Main Street
Springfield, IL 62701"
  • Typografische Anführungszeichen: verwenden Sie immer gerade Anführungszeichen (") statt typografischer Anführungszeichen (" "). CSV-Parser erkennen typografische Anführungszeichen nicht und werfen Formatierungsfehler.
  • Nachgestellte Leerzeichen: entfernen Sie sie vor dem Senden aus allen Zellen. Sie sind in den meisten Tabelleneditoren unsichtbar, verursachen aber Fehler beim Abgleich von Zeichenketten in Ihrer Anwendung.

Bei HTML oder Markup innerhalb einer Zelle setzen Sie das Feld in Anführungszeichen und lassen PTC nur den Text übersetzen:

key,source_text
disclaimer,"<p>By signing up, you agree to our <a href=""/terms"">terms</a>.</p>"

PTC parst das HTML, übersetzt nur den menschenlesbaren Text und bewahrt jedes Tag, jedes Attribut und jede URL.

Speichern Sie als UTF-8, um beschädigte Akzentzeichen zu vermeiden

Die Kodierung ist die mit Abstand häufigste Ursache für Probleme bei der CSV-Übersetzung. Ohne UTF-8 können Zeichen außerhalb des grundlegenden lateinischen Alphabets in Ihrer Anwendung als ???, leere Kästchen oder verstümmelter Text erscheinen.

  • Speichern Sie Ihre CSV-Datei als UTF-8 (mit oder ohne BOM). Die meisten modernen Tools verwenden dies standardmäßig. Excel unter Windows tat dies in der Vergangenheit nicht.
  • Verwenden Sie nicht Windows-1252, ISO-8859-1 oder die „ANSI“-Kodierung. Akzentzeichen in Zielsprachen werden beschädigt.
  • Wenn Sie unsicher sind, öffnen Sie die CSV-Datei in einem Texteditor wie VS Code oder Notepad++ und prüfen Sie die Kodierungsanzeige. Speichern Sie bei Bedarf erneut als UTF-8.

Excel-spezifische Hinweise:

  • Excel für Mac verwendet standardmäßig UTF-8. Keine Aktion erforderlich.
  • Excel für Windows: wählen Sie Datei > Speichern unter und wählen Sie CSV UTF-8 (durch Trennzeichen getrennt) (*.csv) aus dem Formatmenü. Nicht das einfache „CSV (durch Trennzeichen getrennt)“.
  • Google Sheets: Datei > Herunterladen > Kommagetrennte Werte (.csv). Standardmäßig UTF-8.

Bei Quell-CSV-Dateien, die bereits in der falschen Kodierung vorliegen, konvertieren Sie mit iconv:

iconv -f WINDOWS-1252 -t UTF-8 source.csv > source-utf8.csv

Ein durchgearbeitetes Beispiel: eine vollständige E-Commerce-CSV, die PTC ohne Vorbereitung übersetzt

Eine vollständige, gut vorbereitete CSV-Datei für eine E-Commerce-Website:

key,source_text,context
header.welcome,"Welcome to {{shopName}}",Top of page
header.cart.zero,"Your cart is empty",Cart icon - zero state
header.cart.one,"{count} item in cart",Cart icon - singular
header.cart.other,"{count} items in cart",Cart icon - plural
product.add_to_cart,"Add to Cart",Product page CTA
product.out_of_stock,"Out of Stock",Product availability badge
product.price,"{currency}{amount}",Price display
checkout.shipping,"Shipping address",Checkout step heading
checkout.payment,"Payment method",Checkout step heading
checkout.confirm,"Place Order",Final checkout button
errors.email.required,"Email is required",Form validation
errors.email.invalid,"Please enter a valid email address",Form validation
errors.card.declined,"Your card was declined. Please try a different payment method.",Checkout error
promo.tagline,"Sale ends Sunday, grab your deal!",Promo banner - contains comma
tooltip.save,"Click ""Save"" to keep your changes.",Tooltip - contains quotes
disclaimer,"<p>By placing this order, you agree to our <a href=""/terms"">terms and conditions</a>.</p>",Footer legal

Diese Datei:

  • Hat klare key-, source_text- und context-Spalten.
  • Verwendet hierarchische Schlüssel mit Punktnotation.
  • Behandelt Platzhalter ({{shopName}}, {count}, {currency}, {amount}).
  • Behandelt Plurale mit den Suffixen .zero / .one / .other.
  • Maskiert HTML und Anführungszeichen korrekt.
  • Ist als UTF-8 gespeichert.

PTC übersetzt diese Datei direkt. Keine Vorbereitung über das Gezeigte hinaus.

Bewährte Praktiken für die CSV-Übersetzung in einer Liste

  • Verwenden Sie ein spezialisiertes Übersetzungstool. Vermeiden Sie es, CSV-Dateien manuell in einem Texteditor oder einer Tabellenkalkulation zu übersetzen. Spezialisierte Tools wie PTC bewahren Ihre Dateistruktur, behandeln Platzhalter korrekt und halten Ihre Schlüssel intakt.
  • Verwenden Sie Standardkommas als Trennzeichen. Manche Tools verwenden standardmäßig Semikolons. Kommas werden am breitesten unterstützt und verursachen am seltensten Importfehler.
  • Halten Sie eine Zeichenkette pro Zeile. Das Kombinieren mehrerer Zeichenketten in einer einzigen Zeile macht Übersetzungen unhandhabbar und bricht die meisten Übersetzungstools.
  • Isolieren Sie übersetzbare Spalten. Halten Sie Spalten, die übersetzt werden müssen, getrennt von Spalten, die unverändert bleiben sollen (numerische IDs, SKUs, technische Parameter). Das verringert das Risiko, dass ein Tool oder Übersetzer versehentlich Daten ändert, die unberührt bleiben sollen.
  • Vermeiden Sie verbundene Zellen und Tabellenformatierung. CSV ist reiner Text. Jede über eine Tabellenkalkulationssoftware angewendete Formatierung wird bei der Verarbeitung der Datei entfernt.
  • Entfernen Sie unnötige Spalten und Metadaten. Nehmen Sie nur die Spalten auf, die Ihr Übersetzungstool benötigt.
  • Testen Sie zuerst mit einer kleinen Stichprobe. Bevor Sie eine große Datei durch die Übersetzung laufen lassen, testen Sie mit einer kleinen Stichprobe, um strukturelle oder Kodierungsprobleme früh zu erkennen.
  • Validieren Sie Ihre Datei vor dem Hochladen. Prüfen Sie, dass jede Zeile einen eindeutigen Schlüssel ohne Duplikate hat, dass keine Schlüssel Leerzeichen oder Sonderzeichen enthalten und dass es keine zerbrochenen Zeilen gibt.
  • Bewahren Sie eine Sicherungskopie auf. Behalten Sie immer eine Kopie Ihrer ursprünglichen CSV-Datei, bevor Sie sie zur Übersetzung senden.

Visuelle Übersetzungsprüfung des gerenderten Katalogs oder der App

Sobald PTC die CSV-Datei übersetzt hat, werden die Zeichenketten in dem gerendert, was die CSV-Datei konsumiert. Ihr Schaufenster, Ihre App, Ihr Dashboard. Ein übersetzter Produkttitel, der in die Datei passt, kann ein Karten-Layout zum Überlaufen bringen. Eine französische Checkout-Schaltfläche verwendet möglicherweise das falsche Wort für „Place Order“. Eine lange deutsche Adresse kann eine Spalte mit fester Breite in einer gedruckten Rechnung zerbrechen.

Die visuelle KI-Prüfung von PTC erkennt diese Probleme. Installieren Sie für Schaufenster und Dashboards (browserbasiert) die PTC-Browser-Erweiterung und zeichnen Sie eine Durchführung Ihres Shops auf. PTC spielt sie in jeder Zielsprache erneut ab und behebt Layout- und Kontextprobleme in der CSV-Datei automatisch. Bei nativen Apps, die die CSV-Datei konsumieren, laden Sie stattdessen Screenshots der relevanten Bildschirme hoch.

Übersetzen Sie Ankündigungen von Produkteinführungen und Lieferanten-E-Mails

Ankündigungen von Produkteinführungen und kundenorientierte E-Mails über Katalog-Aktualisierungen existieren außerhalb der CSV-Datei. Die Funktion Paste to Translate von PTC behandelt diese Texte im selben Projekt, mit demselben Glossar und derselben Markenstimme wie Ihre Katalogübersetzungen.

Übersetzen Sie Massenimporte beim Eintreffen der Daten mit der PTC-API

Massen-Katalogimporte, die bei der Ankunft übersetzt werden müssen, können über die PTC REST API mit Bearer-Token-Authentifizierung fließen, mit demselben Glossar und derselben Markenstimme wie Ihre CSV-Übersetzungen.

Übersetzen Sie Ihre CSV-Datei jetzt mit PTC

Sobald Ihre CSV-Datei vorbereitet ist, übersetzen Sie sie in 3 Schritten:

  1. Laden Sie Ihre CSV-Datei hoch und wählen Sie die Zielsprachen.
  2. PTC übersetzt und bewahrt dabei jede Spalte, jeden Schlüssel und jeden Platzhalter.
  3. Laden Sie die übersetzten CSV-Dateien herunter und importieren Sie sie dort, wo sie hingehören.

Starten Sie Ihre kostenlose 30-tägige Testphase - 20.000 Wörter in 2 Sprachen, keine Kreditkarte.