Conheça o TranslateGemma: A Nova Geração de Modelos de Tradução Abertos

Apresentamos o TranslateGemma, uma nova coleção de modelos de tradução abertos baseados no Gemma 3, que facilita a comunicação em 55 idiomas, independentemente do local ou dispositivo utilizado.

Os modelos estão disponíveis em tamanhos de 4B, 12B e 27B de parâmetros, representando um avanço significativo na tradução aberta, permitindo que as pessoas se conectem de forma mais eficaz.

A eficiência desses modelos é impressionante. Através de um processo de treinamento especializado, o modelo de 12B do TranslateGemma supera o modelo de referência de 27B do Gemma 3, conforme medido pelo MetricX no benchmark WMT24++.

Isso é uma grande conquista para desenvolvedores, que podem obter qualidade de tradução de alta fidelidade usando menos da metade dos parâmetros do modelo de referência. Essa inovação permite maior throughput e menor latência sem comprometer a precisão. O modelo de 4B também apresenta desempenho comparável ao maior modelo de 12B, sendo uma excelente opção para inferência em dispositivos móveis.

O TranslateGemma foi testado no conjunto de dados WMT24++, abrangendo uma ampla variedade de famílias linguísticas, incluindo idiomas de alta, média e baixa recursos, e apresentou uma taxa de erro significativamente reduzida em comparação com o modelo de referência do Gemma.

Construído sobre o Gemini

A densidade de inteligência foi alcançada através de um processo de ajuste fino em duas etapas que destila a “intuição” dos modelos Gemini em uma arquitetura aberta.

  • Ajuste Fino Supervisionado (SFT): Ajustamos os modelos base do Gemma 3 em um conjunto diversificado de dados paralelos, incluindo textos traduzidos por humanos e traduções sintéticas de alta qualidade, garantindo ampla cobertura linguística.
  • Aprendizado por Reforço (RL): Implementamos uma fase de aprendizado por reforço com um conjunto de modelos de recompensa, utilizando métricas avançadas para guiar os modelos a produzir traduções mais precisas e naturais.

Extensa Cobertura Linguística

O TranslateGemma foi rigorosamente treinado e avaliado em 55 pares de idiomas, garantindo desempenho confiável e de alta qualidade em idiomas principais e em muitos idiomas de baixa recursos. Além disso, foram treinados quase 500 pares de idiomas adicionais, tornando-o uma base robusta para adaptações futuras.

Capacidades Multimodais

Os modelos TranslateGemma mantêm as fortes capacidades multimodais do Gemma 3. Nossos testes mostram que as melhorias na tradução de texto também impactam positivamente a capacidade de traduzir texto em imagens.

Disponibilidade e Implementação

O TranslateGemma estabelece um novo padrão para modelos de tradução abertos, equilibrando desempenho de ponta com eficiência excepcional. Os modelos estão disponíveis em três tamanhos:

  • Modelo 4B: Otimizado para dispositivos móveis e edge.
  • Modelo 12B: Projetado para rodar suavemente em laptops de consumo.
  • Modelo 27B: Criado para máxima fidelidade, capaz de rodar em uma única GPU ou TPU H100 na nuvem.

Como Experimentar o TranslateGemma

A liberação do TranslateGemma oferece ferramentas poderosas e adaptáveis para uma variedade de tarefas relacionadas à tradução. Estamos ansiosos para ver como a comunidade utilizará esses modelos para quebrar barreiras linguísticas e promover maior compreensão entre culturas. Confira como experimentar:

  • Leia o relatório técnico.
  • Baixe no Kaggle.
  • Baixe no Hugging Face.
  • Explore via o Gemma Cookbook.
  • Implemente no Vertex AI.

Compartilhe:

Últimas postagens
Categorias

Fale com um especialista

Precisa de uma consultoria de SEO especializada? Entre em contato.