O Gmail agora é muito melhor na detecção de spam após uma grande atualização

O que você precisa saber

  • O Gmail agora possui um novo vetorizador de texto chamado RETVec que pode melhorar a detecção de spam em 38%.
  • Os vetorizadores de texto ajudam a identificar letras e símbolos em e-mails e classificá-los como spam de acordo.
  • Alguns remetentes de spam manipulam letras e símbolos, usam homóglifos, adicionam caracteres invisíveis e usam substituição de palavras-chave para tentar contornar filtros de spam.

A detecção de spam no Gmail deve melhorar graças a uma atualização no sistema de identificação de texto de back-end em alguns serviços do Google. Graças à atualização de segurança, o Google afirma que o Gmail agora é 38% melhor na detecção de spam.

A empresa anunciou recentemente uma atualização para o Google Security. Postagem no blog (usando 9to5Google). Antes disso, ele passou por testes internos no Google no ano passado. Isto representa “a maior modernização do sistema de defesa nos últimos anos”, afirma a empresa.

Nova adição à detecção de spam do Gmail: RETVek, o que significa um vetorizador de texto eficiente e tolerante a falhas. Os vetorizadores de texto são usados ​​para identificar o conteúdo de um e-mail, que às vezes fica oculto pelo remetente. Manipular letras e símbolos, usar homóglifos (caracteres diferentes que parecem semelhantes), adicionar caracteres invisíveis e usar substituição de palavras-chave para contornar filtros de spam.

“RETVec alcança essas melhorias usando um modelo de incorporação de palavras muito leve (cerca de 200 mil parâmetros)”, disse o Google em comunicado. “Isso nos permite reduzir o tamanho do modelo Transformer com desempenho igual ou melhor, ao mesmo tempo em que podemos compartilhar a computação entre o host e a TPU de maneira eficiente em termos de rede e memória.”

(Crédito da imagem: Google)

A maior vantagem do RETVec é que ele é 38% melhor na detecção de spam, mas há muitas outras melhorias. Esta melhoria na precisão inclui uma redução de falsos positivos em quase 20% e de falsos negativos em quase 18%. Falsos negativos ocorrem quando o detector de spam do Gmail não consegue filtrar um e-mail de spam como spam, enquanto falsos positivos ocorrem quando e-mails válidos são classificados incorretamente como spam.

Como o Google conseguiu reduzir o tamanho do modelo Transformer, o uso do RETVec reduziu o uso de TPU em 83%. Este é um benefício significativo de eficiência no uso do novo vetorizador de texto no Gmail.

RETVec foi desenvolvido pela Google Research e é totalmente de código aberto. Após um longo período de testes internos do Google, a empresa concluiu que ele é “altamente eficaz para aplicativos de segurança e antiabuso”.

Pessoas que desejam usar o RETVec para suas próprias aplicações podem seguir gerenciamento do Google que explica como começar.