Desktop Publishing: preprocesare și postprocesare documente pentru CAT tool
Editare de documente: procesare pentru programe de traducere asistată de calculator (CAT tool-uri)
Procesul de editare de documente (DTP) pentru traducere este, în zilele noastre, un pas crucial pentru eficientizarea procesului de traducere și pentru a putea beneficia de toate instrumentele pe care le avem la îndemână în prezent: programe de traducere asistată de calculator (CAT tool-uri), memorii de traducere, glosare de termeni și programe care ne oferă asistență în procesul de revizie pentru asigurarea calității (verificări QA și QC).
Avem, astfel, două etape în care specialistul DTP este sau poate fi implicat în cadrul procesului de traducere:
- Etapa de preprocesare a documentelor încredințate pentru traducere
- Etapa de postprocesare a documentelor traduse
Etapa de preprocesare a documentelor intervine în cadrul proiectului de traducere atunci când documentul sau documentele care trebuie traduse nu sunt într-un format editabil (PDF, PNG, .img, .dwg, printre altele). Pentru a transmite clientului un document tradus care să redea cât mai fidel formatarea documentului original, dar și pentru a putea efectua traducerea într-un program dedicat – care va eficientiza considerabil munca traducătorului oferindu-i acces la resurse terminologice într-o manieră automată – documentul trebuie pregătit pentru traducere în prealabil.
Această etapă presupune următorii pași:
- analizarea documentului sursă pentru a identifica porțiunile care necesită o preprocesare mai amănunțită și verificarea anumitor aspecte care ar putea avea impact asupra documentului final, tradus (spații în plus, aliniere defectuoasă, simboluri, imagini și multe altele);
- convertirea documentului într-un format editabil cu ajutorul unor programe specializate (de exemplu, Abby FineReader, Smallpdf, Adobe, InDesign, CorelDRAW și multe altele);
- „curățarea” documentului de caractere convertite și afișate într-un mod neconform sursei, spații în plus care de obicei nu sunt vizibile, tag-uri care pot îngreuna procesul de traducere (dacă se optează traducerea într-un CAT tool), lucru care se poate realiza cu ajutorul unor programe dedicate (de exemplu: TransTools);
- reformatarea documentului respectiv, care constă în verificarea modului în care documentul este structurat și redarea formatării documentului sursă, prin rezolvarea problemelor apărute în urma convertirii, inclusiv transcrierea textului în porțiunile neconvertite integral;
- asigurarea redactării corecte (cu spațiere, despărțire și aranjare corecte, folosind instrumentele oferite de Microsoft Word);
- pregătirea documentului pentru CAT tool (folosirea, unde este cazul, a unor reguli de procesare – Regex – pentru eficiență, dar și asigurarea că anumite elemente din document nu au suferit modificări);
- analizarea documentului în programul de traducere automată (CAT tool) pentru a ne asigura că documentul este segmentat adecvat și că nu vor apărea alte probleme. Acest lucru permite utilizarea și valorificarea tuturor intrărilor din memoria de traducere (TM – Translation Memory) și garantează actualizarea ei într-un mod optim.
Chestiuni de avut în vedere la verificare:
-
- propoziții despărțite incorect, pe segmente diferite
- probleme de scriere, de despărțire a cuvintelor – asigurarea că textul sursă este corect
- dacă există section/page breaks care nu sunt necesare
- dacă există fonturi care nu sunt disponibile în anumite limbi
În lipsa unei pregătiri corespunzătoare a documentelor care necesită traducere, vor apărea dificultăți atât în procesul de traducere, cât și la utilizarea sau actualizarea memoriei de traducere:
- în momentul analizării unui document din cadrul proiectului (prin comparație cu celelalte documente din proiect sau cu ajutorul memoriilor de traducere și glosarelor), segmentarea defectuoasă a elementelor cuprinse în acesta (fraze, propoziții scurte, chiar și cuvinte) va genera o analiză incorectă, precum și omiterea unor informații relevante și, implicit, lipsa preluării acestora din memoriile de traducere ale proiectului;
- existența anumitor elemente/caractere rezultate în urma convertirii documentelor va fi semnalată prin tag-uri care îngreunează procesul de traducere și pot, în anumite situații, genera erorii la importarea și exportarea documentului în și din CAT tool-ul utilizat în procesul de traducere. Mare atenție însă: nu toate tag-urile sunt elemente care trebuie eliminate din cuprinsul documentului – unele dintre acestea pot reprezenta elemente de formatare (space breaks, strikethroughs, bold, italic, semne de punctuație etc.), iar ștergerea lor trebuie evitată. Acestea pot fi protejate prin implementarea anumitor reguli Regex sau prin convertirea lor în simboluri și formate propriu-zise pentru a nu îngreuna procesul de traducere și a evita ștergerea lor din greșeală.
De cele mai multe ori, la majoritatea proiectelor de traducere, ne lovim de situația în care suntem nevoiți să apelăm la un specialist în DTP pentru a ne asista în etapele de preprocesare și postprocesare a documentelor, întrucât documentele încredințate spre traducere sunt, de cele mai multe ori, în format PDF, iar fișierele native (INDD, IDM și altele) nu sunt disponibile. Atât documentele format PDF, cât și alte formate ne-editabile, nu sunt compatibile cu programele de traducere asistată (CAT tool-uri), iar etapa de preprocesare este obligatorie pentru a putea beneficia de toate avantajele unui astfel de program.
Comunicarea cu clientul final stă, de cele mai multe ori, la baza unui proiect de traducere de succes. Înțelegerea procesului de traducere și implicarea clientului de la început reprezintă un pas important pentru a asigura desfășurarea fără probleme a întregului proces. Totodată, clarificarea anumitor aspecte (de formatare, privind terminologia preferată, ce anume traducem și ce anume nu traducem) încă de la început contribuie la obținerea unor rezultate excepționale.
Într-un scenariu ideal, proiectele de traducere ar trebui să includă următoarele:
- un fișier sursă pentru fiecare document, respectiv fișierul nativ creat în diverse programe precum Adobe InDesign, CorelDraw, Visio, Adobe Illustrator, pachetul Microsoft Office și multe altele; în cazul în care proiectul conține un număr mai mare de documente, se recomandă adoptarea unei maniere organizate de transmitere a documentelor (de exemplu, un centralizator care conține toate documentele și informațiile aferente, transfer prin cadrul unui sharepoint/server);
- un fișier cu instrucțiuni și specificații privind: limba țintă, respectiv specificații privind publicul și țara țintă (spre exemplu, o traducere în limba spaniolă implică alegerea lingviștilor potriviți și a unei abordări diferite dacă vorbim despre traduceri care trebuie realizate în limba spaniolă vorbită în Spania, Argentina sau Columbia);
- scopul traducerii: unde va fi folosită (intern sau cu un alt scop precis) și care este rezultatul dorit în urma folosirii acesteia (marketing, informare, formalități etc.)? Scopul utilizării traducerii ajută la determinarea mai multor aspecte privind abordarea acesteia în procesul de traducere: de la tonul folosit (formal sau informal) până la stabilirea etapelor (revizie nativă, adaptare, localizare) prin care va trece textul până la varianta sa finală;
- semnalarea anumitor aspecte specifice, dacă este cazul (în ce măsură este necesară adaptarea textului, dacă imaginile care conțin text necesită procesare și traducere, preferințe privind tonul și vocea – formal sau informal și pasivă sau activă – etc.);
- un glosar terminologic, un ghid stilistic, o memorie de traducere sau materiale de referință privind conținutul documentelor transmise spre traducere;
- informații privind termenul de livrare dorit;
- informații privind formatul în care clientul dorește transmiterea documentelor traduse (monolingv sau bilingv, editabil sau ne-editabil, format pretabil CAT tool, cu traducerea în extras s anumitor informații sau nu și multe altele);
- informații privind procesul de revizie internă: dacă există o persoană dedicată în cadrul companiei care va revizui traducerea sau care poate fi contactată pentru clarificări privind terminologia sau eventualele aspectele neclare.
Etapa de postprocesare a documentelor traduse implică verificarea documentelor țintă exportate din CAT tool. Există și situații fericite în care documentele transmise spre traducere fie au fost trecute prin etapa de preprocesare deja de către client sau în urma preprocesării noastre interne nu a rezultat nicio eroare de formatare (pot apărea anumite diferențe datorită specificului fiecărei limbi, iar simbolurile își pot muta poziția și este nevoie de ajustare), fie sunt fișiere native. În cea de-a doua situație, intervine astfel doar etapa de postprocesare a documentelor traduse.
Această etapă presupune:
-
- includerea elementelor externe în fișierul IDML tradus;
- asigurarea că textul este afișat corect, vizibil în întregul document;
- asigurarea că toate elementele sunt vizibile și poziționate corect;
- asigurarea că toate link-urile sau alte elemente funcționale din cadrul documentelor funcționează corect;
- asigurarea că au fost folosite și păstrate fonturile corecte și că acestea sunt folosite în mod consecvent în tot documentul pentru a reflecta documentul original;
- asigurarea că documentul final, tradus, arată precum fișierul original din punctul de vedere al formatării.
Este recomandată efectuarea unei verificări finale a textului tradus într-un format exportat (de exemplu: format PDF) înainte de finalizarea etapei de postprocesare. Astfel, specialistul DTP va face ultimele modificări înainte de a salva pachetul final pentru client.
Fișierele procesate de specialistul DTP pot fi de următoarele tipuri: Microsoft Office (Microsoft Word, Excel, PowerPoint, Visio), Adobe Creative Cloud (PDF, Adobe Illustrator, InDesign), CorelDRAW și multe altele.
În ultimii ani, tehnologia a devenit o parte esențială a procesului de traducere, iar instrumentele care pot asista un traducător s-au transformat într-o necesitate. În activitatea noastră, întrebarea nu mai este dacă să ne folosim de aceste programe, ci „care program ne poate ajuta cel mai mult?”. Acum, cel puțin când vine vorba de traduceri specializate, dicționarul nu mai este unica resursă de care are nevoie un traducător pentru a avea un rezultat de calitate, în linie cu standardele din industrie. Odată cu avansările în domeniul inteligenței artificiale și a „machine learning”, a avut loc o explozie în materie de programe și instrumente care pot asista traducătorul în meseria sa – de la soft-uri de convertire a documentelor până la programe de traducere asistată de calculator, care vin cu funcțiile incorporate de creare de memorii de traducere și de includere a unor baze terminologice – tehnologia în domeniul traducerilor lasă astfel creativitatea în sarcina lingviștilor, ocupându-se de task-urile automatizate și repetitive.