Todos os dias, o Facebook executa cerca de 4,5 bilhões de traduções automáticas, e a partir de ontem, todos eles são processados usando redes neurais. Anteriormente, o site de redes sociais usava modelos de tradução de máquinas mais simples baseados em frase, mas agora é alternado para o método mais avançado. “Criar experiências de tradução perfeitas e altamente precisas para os 2 bilhões de pessoas que usam o Facebook é difícil”, explicou a empresa em uma postagem no blog. “Precisamos explicar contexto, gírias, erros de digitação, abreviaturas e intenções simultaneamente”.
A grande diferença entre o sistema antigo e o novo é a capacidade de atenção. Enquanto o sistema baseado em frase traduzia frases palavra por palavra, ou olhando frases curtas, as redes neurais consideravam frases inteiras ao mesmo tempo. Eles fazem isso usando um tipo particular de componente de aprendizado de máquina conhecido como um LSTM ou uma rede de memória de longo prazo.
Leia também:
Facebook adquire startup de inteligência artificial
Facebook atualiza o recurso “Stories” para o compartilhamento público
Os benefícios são bastante claros. Compare estes dois exemplos do Facebook de uma tradução de Turco para Inglês. O primeiro é do antigo sistema baseado em frases e o segundo do novo sistema. Você pode ver como ter em conta o contexto completo da oração produz um resultado mais preciso.
“Com o novo sistema, vimos um aumento relativo médio de 11 por cento na BLEU – uma métrica amplamente utilizada para julgar a precisão da máquina de tradução – em todas as línguas em comparação com os sistemas baseados em frase”, disse a empresa.
Quando uma palavra em uma frase não tem uma tradução correspondente direta em uma linguagem de destino, o sistema neural gerará um espaço reservado para a palavra desconhecida. Uma tradução dessa palavra é procurada em uma espécie de dicionário interno construído a partir dos dados de treinamento do Facebook, e a palavra desconhecida é substituída. Isso permite que abreviaturas como “tmrw” sejam traduzidas para o significado pretendido – “amanhã”.
“As redes neurais abrem muitos caminhos de desenvolvimento futuros relacionados à adição de contexto adicional, como uma foto que acompanha o texto de uma publicação, para criar melhores traduções”, afirmou a empresa. “Nós também estamos começando a explorar modelos multilíngües que podem traduzir muitas direções de idiomas diferentes”.
Via: The Verge