WWC (Weighted Word Count)

  • 7

WWC (Weighted Word Count)

[AVISO: o post a seguir pode ser extremamente perturbador para pessoas avessas a números.]

Lembra daquele seu professor que dizia “A matemática é muito importante para a vida” quando você fechava a cara para os cálculos dos livros dele? Pois este post é a prova de que, para a sua infelicidade, ele estava certo. Não, não se trata de mais uma sigla inovadora para designar banheiro, o WWC (Weighted Word Count) é uma soma de todos os pesos e percentuais de cada palavra de acordo com o aproveitamento da memória de tradução do projeto. Hã? Calma, vamos explicar  melhor essa definição.

A tarifa do mercado de localização geralmente é calculada por palavra. Isto é, se um arquivo tem 1000 palavras, ele vai custar 1000 vezes o valor cobrado por palavra e vai levar cerca de 4 horas para ser traduzido (considerando a média de mercado de 2800 palavras a cada 8 horas de trabalho). Porém, e se houver aproveitamento de memória na ferramenta? Como calcular esse valor e estimar o tempo de trabalho?
 
Nesse caso, obviamente cobrar o valor inteiro da palavra seria injusto. Afinal, se 500 daquelas 1000 palavras tiverem um aproveitamento de memória muito grande (isto é, se já estiverem praticamente traduzidas na TM), o seu trabalho se restringirá a apenas ler essas 500 palavras e/ou alterar um ou dois termos em cada frase. Ou seja, você vai gastar menos esforço e levar muito menos tempo para traduzir essas frases do que levaria se tivesse que perder tempo digitando cada uma delas “do zero”. No fim das contas, é justo o cliente não querer pagar o mesmo valor só para você ajustar algo que já estava traduzido na memória.

Imagino que você deva estar se perguntando algo semelhante a “Mas como assim o cliente não quer pagar por uma tradução?”  Pense comigo: se para traduzir uma palavra 100% match você só precisa, por exemplo, de 25% do esforço/tempo de uma palavra No match (pois você não traduz um 100% do zero), cada 4 palavras de 100% match vão corresponder ao que seria uma palavra cheia (25% de 4 palavras = 100% de 1 palavra).

1 palavra No Match = 100% do valor/esforço de 1 palavra, que é 1 palavra inteira

1 palavra 100% Match = 25% do valor/esforço de 1 palavra, que seria o equivalente a 0,25 palavras

4 palavras 100% Match = 4 palavras valendo 0,25 do valor/esforço cada, que daria 1 palavra (4 x 0,25 = 1)

 

[AVISO: nós avisamos.]

Antes de entender esse cálculo, você precisa saber que esses tais aproveitamentos de memória são classificados por porcentagens. Então, se uma frase do seu arquivo for exatamente igual à frase que está na TM, ela será 100% igual, o que chamamos de 100% match. À medida que a sua frase vai se diferenciando da que está na memória, seja por uma letra ou palavra, essa porcentagem se reduz, podendo chegar a até 0% match, que chamamos comumente de No match (já que não há correspondência para ela na memória) ou de palavra cheia (já que você recebe o valor inteiro da palavra). Resumindo: enquanto o segmento 100% match já está praticamente pronto, o segmento No match exige uma tradução que parta do zero.

Para contornar esse cálculo confuso, surge na equação uma variável a que chamamos de peso da palavra. Uma palavra cheia (ou melhor, uma palavra que ainda não foi traduzida nem está salva na memória de tradução) sempre vai custar o valor integral. Por exemplo, se o valor da sua palavra é de R$ 0,10, a palavra cheia será integralmente cobrada, e você também deve considerá-la integralmente no tempo estimado da tradução. Entretanto, uma palavra que tenha 100% de aproveitamento na memória costuma ter um peso de apenas 25% do valor. Ou melhor, você receberá somente 25% daqueles R$ 0,10 para adaptá-la, e teoricamente essa adaptação leva muito menos tempo do que uma tradução integral. Afinal de contas, ela já estava salva na sua memória.

Acontece que esse cálculo não para nos 100%; à medida que a sua frase se distancia da que está na memória (100%, 95-99% etc.), você vai tendo mais trabalho para traduzir. Então o seu esforço vai ser maior e, consequentemente, o valor que você vai receber dessa palavra também será maior. É claro que cada empresa ou cliente pode lidar de maneiras diferentes com esses valores, pesos e categorias, mas os métodos costumam ser bem parecidos. Em suma, o que você precisa saber é: o indicativo de quantas palavras cheias (No match) que você precisa traduzir + o peso de cada uma das palavras (e suas devidas porcentagens) já salvas na memória de tradução é o que chamamos de WWC.

Se você é formado em Letras e alérgico a números (como a Mitsue), parabéns por ler até aqui! Sabemos que entender esse monte de números pode parecer confuso, mas esses valores ficam naturais com o tempo e a prática. Mesmo assim, caso ainda tenha dúvidas e enquanto não surgir a oportunidade de aplicar toda essa teoria, não hesite em deixar sua pergunta nos comentários abaixo. Ah, e pense com carinho naquele professor de matemática, pois ele acertou em cheio.

 

Bruno F. Fontes.

 


7 Comments

Roger Chadel

julho 7, 2016at 9:17 am

Eu sei, não tem muito a ver com o tema proposto, mas sua frase “No fim das contas, é justo o cliente não querer pagar o mesmo valor só para você ajustar algo que já estava traduzido na memória” me incomodou. Mais do que isso, se a memória foi criada pelo tradutor eu a considero injusta. Imagine duas situações: você leva seu carro no mecânico e ele cobra por 8 horas de serviço; e agora você o leva a outro mecânico, que investiu em ferramentas de diagnóstico e graças a elas consegue detectar o problema e corrigi-lo em apenas duas horas. É justo você querer um desconto do segundo mecânico porque ele trabalhou apenas 25% do tempo?

    Bruno Fontes

    julho 7, 2016at 9:46 am

    Oi, Roger,

    Tudo bom?

    As memórias de tradução costumam ser criadas/vendidas para o cliente no primeiro projeto, então você acaba ficando com uma TM por cliente (ou mesmo por componente) para assegurar a consistência da tradução naquele tipo de material. Em situações como esta, não é justo que o cliente pague o valor da palavra cheia.

    No caso de o cliente não se importar com isso, ou mesmo desconhecer o uso de ferramentas de tradução, e você trabalhar com uma memória que criou para seu uso pessoal, sinceramente ele nem precisa saber que você tem essa TM.

Patricia Franco

julho 7, 2016at 9:50 am

Eu estou com o Roger, se o cliente tem a TM e te dá pronto ou se existem coincidências perfeitas dentro do texto, algum desconto, vá lá, mas descontar com base no meu esforço e trabalho anterior é inaceitável. Certamente, que 25% da palavra cheia é um valor ridículo quando cobro 50% da valor da tradução para revisão que, no fim das contas, é o que tenho que fazer com esses segmentos. Além disso, me desculpem os entendidos, mas o jogo dos sete erros provaram há muito tempo que pequenas diferenças exigem muito mais atenção e concentração da que grandes diferenças, então não vejo aonde está esse ganho de produtividade. Alegam que é por que não vou digitar, mas como? Não estou entendendo, digitar é um componente operacional de um trabalho intelectual, reduzir o esforço de digitação é, na minha opinião o argumento mais sem pé nem cabeça que se pode usar para justificar esses descontos. Acredito que o limite para se revisar é até 30% de alteração do texto traduzido, acima disso estou reescrevendo e devo receber pela tradução, assim 70% match é o limite máximo a se considerar nessa contabilidade. Pessoalmente, acho muito frustrante a desvalorização do trabalho intelectual do tradutor que a aplicação dessas premissas impõem e isso é típico de um fazer que mede os esforços pelo desgaste mecânico e não pela habilidade analítica e intelectual envolvidas.

    Bruno Fontes

    julho 7, 2016at 12:29 pm

    Oi, Patricia,

    A ideia do WWC é permitir que o cliente tenha uma memória específica dele ou de cada componente do conteúdo que ele traduz. Considerando um cenário ideal, por exemplo, os segmentos 100% já estariam dentro do contexto adequado e provavelmente teriam sido traduzidos e revisados por você mesma. Teoricamente isso garante a qualidade da memória, além de agilizar muito o trabalho de tradução.

    Claro, você sempre vai se deparar com clientes que usam a mesma memória para todo e qualquer conteúdo traduzido, transformando a TM em um grande repositório de traduções sem contexto (mais ou menos como as traduções por máquina fazem), e esses clientes vão propor o uso dessa memória “poluída” para reduzir o custo. Assim como também existem aqueles que, mesmo não entendendo da área, se arriscam a traduzir e pagam apenas por uma revisão, por ser mais barato. No fim das contas, o segredo é saber filtrar caso a caso e, dependendo da situação, aceitar ou não o trabalho daquele cliente.

Katia

julho 8, 2016at 11:46 am

Eu concordo com o Roger e a Patrícia, pois na minha experiência o cliente que pede que você envie a TM para ele te paga, na verdade, pela tradução (número de palavras) e leva a memória “de graça”. Depois utiliza essa memória, que você se esforçou para criar, para te pagar menos. Além disto, muitas vezes, mesmo com a TM você tem que revisar atentamente, pois nem tudo que está ali é 100% confiável (nem sempre a TM foi criada por um só tradutor). Então, é como você mesmo diz em seu comentário, Bruno: cada caso tem que ser analisado individualmente. Não dá para generalizar.

    Bruno Fontes

    julho 8, 2016at 1:41 pm

    Oi, Katia,

    Na minha experiência, nunca vi projeto em que o cliente pedisse a TM pessoal, eles sempre pedem a memória apenas do projeto. Só ali do arquivo que você está traduzindo, se ele não enviar uma TM ou a que você recebeu dele, atualizada com aquele projeto. Mas recebemos tantos comentários parecidos com o de vocês que vamos até escrever um post só sobre essas experiências diferentes de uso da TM.

    E é isso, acompanhar caso a caso. 🙂

Abraham Benward

agosto 7, 2016at 9:08 pm

4.6 When a text is preprocessed using a translation memory, the number of words to be translated by the Contractor is weighted according to the match rate and the repetition rate as established by the translation memory.

Leave a Reply

Ad