Anonimização de dados: como fazer e se adequar com a LGPD?

Escrito por humanos

Silhueta de um homem vestido com uma camisa branca, simulando estar com sua identidade e dados anonimizados.

Com a LGPD (Lei Geral de Proteção de Dados), os dados pessoais se tornaram um ativo valioso e arriscado de se ter. A nova lei estabelece que é preciso proteger os dados com um controle estrito. Caso isso não ocorra, as multas e sanções podem ser pesadas. 

Para garantir a segurança e a proteção deles, é preciso monitoramento constante, eliminação dos erros, bem como adaptação de todo o time.

Diante disso, há uma solução que gera menos peso sobre a empresa: a anonimização de dados. Com as táticas para anonimizar um dado pessoal, é possível eliminar vestígios de identificação e garantir compliance com a LGPD.

Para entender melhor como chegar a esse estágio de segurança e combater os principais riscos, acompanhe o conteúdo a seguir. 

Aprenda mais sobre a melhor estratégia de proteção para se adaptar à LGPD!

Leia também:

O que é anonimização de dados? 

A anonimização é um conjunto de procedimentos que visam remover a identificação direta de um dado, de modo que essa informação deixa de ser pessoal. Ou seja, são transformações feitas em dados para eliminar os vínculos de identificação.

O processo de anonimização envolve aplicação de técnicas computacionais e matemáticas para mascarar os dados. Dessa forma, a empresa garante maior segurança e não precisa se preocupar com sanções das leis de privacidade.

O conceito ganhou força nos últimos anos, em meio a discussões sobre o que é dado pessoal e sobre a importância deles. Para as empresas, funciona como um mecanismo de proteção, ao mesmo tempo em que garante o uso do dado apenas para o objetivo.

Afinal, há muitos cenários em que uma equipe realmente nem precisa de dados pessoais, uma vez que a manipulação pode ser feita com dados anonimizados. Ao saber separar muito bem esses aspectos, a empresa facilita a sua gestão. 

Dado pessoal e anonimização

Um dado pessoal, de acordo com a Lei Geral de Proteção de Dados, é qualquer dado que permite a identificação de uma única pessoa. Ou seja, é uma informação específica que possibilita apontar e reconhecer uma pessoa, como um CPF ou RG.

A definição se estende também a conjuntos de informações que, quando unidos, cooperam com a identificação de alguém. 

Por sua vez, o dado anonimizado é um dado que não apresenta a possibilidade de interligação direta nem indireta. Significa que não há nenhum meio de chegar a um único cliente a partir daquele dado. 

Quando um dado pode ser considerado anonimizado?

Quando não há formas de rastrear uma pessoa a partir daquele dado. Dados gerais sobre um grupo, por exemplo, se encaixam nessa questão. 

Contudo, pode-se determinar o nível de anonimização, pensando no tempo e no esforço necessários para reverter o processo. 

Nesse caso, podemos estar falando de outro conceito, que está entre dado pessoal e anônimo (os chamados pseudônimos — falaremos deles mais adiante).

Dados anonimizados e LGPD: no que se atentar?

Letras LGPD na cor branca, aplicadas a um fundo verde. A anonimização de dados é um dos princípios da Lei Geral de Proteção de Dados.

Quando um dado é anonimizado, ele deixa de ser pessoal (ou sensível). Logo, a informação deixa de ser parte do escopo da LGPD. 

Em suma, gerenciar dados anônimos é aproveitar uma exceção da lei para continuar as operações. Em muitos casos, é o que a empresa precisa e pode garantir menos dores de cabeça. 

Contudo, é importante estar atento ao fato de que a lei não evidencia os métodos aceitos para anonimização. Por isso, a empresa deve seguir o padrão do mercado e pensar, sempre, em combater a possibilidade de reversão do que foi feito (mesmo depois de um tempo). 

Quais as vantagens de manter os dados anonimizados?

A seguir, vamos conhecer as vantagens de adotar a anonimização de dados. 

Privacidade e segurança

A questão da privacidade é um dos fatores mais interessantes. Trabalhar com dados anônimos é respeitar a privacidade e os direitos de cada cliente, usando os dados apenas para a finalidade necessária. 

Ou seja, é utilizar apenas o que é permitido, sem avançar demais.

Isso, por sua vez, pode se converter em vantagem ativa para a empresa em termos de reputação. Uma empresa que investe em proteção e cuida da privacidade dos consumidores certamente se destaca como uma opção confiável.

Esse processo pode, inclusive, ser usado nas estratégias de comunicação com os clientes para gerar valor a eles e demonstrar o cuidado da empresa. 

Menos riscos de ataques

Por outro lado, a anonimização diminui consideravelmente os riscos de ataques e crimes virtuais. Mesmo se houver vazamento dos dados, isso não vai gerar um impacto tão grande quanto geraria com dados pessoais e singulares.

A empresa consegue definir uma barreira para proteger seus clientes e seu próprio nome dos problemas associados aos riscos. É possível se tornar mais sólida e robusta, com menos brechas para criminosos.

O próprio fato de que a empresa gerencia dados anônimos já limita as possibilidades de ataque. 

Compliance

A melhor forma de obter compliance com a nova lei de dados (LGPD) é gerenciando melhor os dados pessoais: com controle do ciclo de vida, mapeamento dos processos, etc. 

A anonimização de dados também entra como uma opção nesse quesito, uma vez que diminui a quantidade de dados pessoais e torna a gestão deles mais simples.

Qual a diferença entre anonimização e pseudonimização? 

Há um conceito intermediário que expande ainda mais as possibilidades das empresas: a pseudonimização. Esse processo possui diferenças claras para a anonimização clássica. Vamos entender.

Em princípio, a pseudonimização transforma os dados para generalizá-los ou remover deles qualquer indício de pessoalidade. Contudo, todo esse processo é reversível, com técnicas específicas que só a empresa consegue usar.

Ao passo que a anonimização é considerado um processo irreversível, que transforma os dados em segmentos anônimos de informação para sempre. 

A diferença entre os dados é importante por um fator: a anonimização influencia muito na qualidade e na utilidade de dados. 

Com dados em estado anônimo, se perde bastante da capacidade de usá-los para o objetivo principal, uma vez que eles são transformados de alguma forma.

Ou seja, insights podem não ser tão claros depois de um processo de anonimização.

Por outro lado, a pseudonimização pode servir a propósitos distintos: gerando dados anônimos e pessoais. Contudo, a responsabilidade é ainda maior, e é preciso manter a segurança nos dois casos. 

Quais as técnicas para anonimizar dados?

Silhueta de um homem encapuzado, escondendo sua identidade. Existem diversas técnicas para anonimizar dados e suas informações pessoais. 

Vamos comentar agora as estratégias usadas no processo de anonimização para garantir a segurança e os benefícios que mencionamos.

Para fins de explicação, vamos considerar os dados em uma tabela comum de um dataset. As linhas correspondem às entradas, ao passo que as colunas representam as variáveis. 

Encobrimento de caracteres

Essa técnica é também chamada de mascaramento de dados. Consiste em usar caracteres neutros, como o asterisco, para encobrir informações importantes e pessoais. 

No caso de um CPF, por exemplo, os asteriscos podem preencher todos os espaços depois dos três primeiros números.

O mesmo método pode ser usado em um e-mail, só que é difícil precisar exatamente a quantidade de caracteres em cada endereço, como se faz com CPF. 

Supressão de dados

Outra técnica, até mais simples, é a supressão de dados. Consiste em remover os espaços de dados que podem ajudar a identificar pessoas. Ou seja, em um dataset, a supressão elimina as colunas referentes a informações únicas, como CPF, RG, nome completo, etc.

É preciso um certo cuidado com essa estratégia: afinal, mesmo com a supressão, pode ser possível resgatar alguma das informações da tabela e mesmo assim identificar uma pessoa. 

Por isso, é um procedimento bem menos complexo que pode funcionar apenas em alguns casos menores. Para uma situação de mais dados por pessoa, é preciso recorrer a outras abordagens. 

Generalização

A generalização é um método bem interessante. Envolve transformar os pontos de dados em intervalos, de modo a garantir uma visão geral e abrangente sobre cada entrada. 

Ou seja, se o dataset tem uma idade específica (18), a equipe a transforma em um conjunto de dados (10-20). 

Evidentemente, é mais fácil generalizar dados numéricos. Quando se tratam de categóricos (textos), o desafio é maior. Da mesma forma, alguns dados numéricos, como os registros de CPF, não podem ser facilmente generalizados.

Então, a empresa pode aplicar uma supressão e uma generalização. Os dois juntos são efetivos para limpar os dados e garantir apenas o necessário. 

Adição de ruídos aos dados

A adição de ruídos também pode ser considerada como uma perturbação de dados. 

Trata-se de um procedimento que muda levemente as informações da base de acordo com alguns critérios, de modo a eliminar vestígios de identificação e garantir o uso para o objetivo principal.

Se um dado é 18, pode ser alterado para 16. Outro dado de idade que é 24 pode virar 23. Pode-se estabelecer um critério, como a divisibilidade por um número, para formatar todos em busca de valores aleatórios, distintos do original.

Agregação de dados

A agregação é uma forma de generalização que transforma os dados em versões resumidas, com menos entradas, a partir da padronização e do agrupamento de semelhantes. Ou seja, altera-se a tabela para apresentar os dados de uma forma distinta.

A agregação é diferente da generalização comum, pois de fato modifica ativamente os dados. Ao passo que generalizar não necessariamente implica uma mudança ativa, mas apenas uma configuração simples em cada entrada. 

Criptografia

Imagem de um cadeado digital em uma tela preta, simulando dados criptografados. Esta é uma das estratégias envolvidas em um processo de anonimização.

Um dos métodos mais complexos da lista é a criptografia. Ela transforma os dados em versões totalmente mascaradas, impossíveis de compreender e utilizar. Para desbloquear essas informações, será preciso ter acesso a uma chave que somente a empresa possui. 

É uma técnica reversível, então se enquadra na definição de pseudonimização. Contudo, a empresa pode combinar a criptografia com outros métodos para gerar uma mudança completa e irreversível, a depender da necessidade. 

Remoção do identificador direto

É uma forma de supressão que consiste em apenas alterar a identificação direta de cada entrada. No lugar de cada identificador, é gerado um valor aleatório. 

Essa supressão pode ser usada como um método de anonimização e como pseudonimização.

Para ser anonimização, é preciso usar tokens aleatórios e não referenciá-los ao cliente em nenhum outro local. Assim, em tese, não há meios para identificar alguém.

Para torná-lo um processo de pseudonimização, por outro lado, a empresa pode usar uma tabela associando os clientes aos valores aleatórios e usar esses valores em outras combinações de dados. 

Quais os riscos que a anonimização combate? 

Em termos práticos, a anonimização previne que a empresa sofra com ataques virtuais ou com algum tipo de vazamento. 

Por exemplo, evita que o prejuízo seja grande em caso de negligência dos colaboradores.

Como a anonimização protege a empresa das normas da LGPD referentes a dados pessoais, é possível garantir que a empresa esteja imune a multas de até 50 milhões reais e a indenizações diversas.

Além disso, esse processo também protege a imagem da empresa e evita grandes escândalos envolvendo dados pessoais e sensíveis. 

Anonimização de dados e ANPD

A ANPD (Autoridade Nacional de Proteção de Dados) é o órgão responsável por fiscalizar e garantir que a LGPD seja cumprida nas relações comerciais com tratamento de dados.

Quando falamos em anonimização, a ANPD desempenha um papel crucial sobretudo especificando os métodos e as definições. Por exemplo, cabe ao órgão determinar se um processo é ou não reversível e usar os critérios ideais para isso.

A GDPR (General Data Protection Regulation) já foi usada na Europa para lidar com casos simples de supressão. Se a identificação ainda acontecer, mesmo que por meios indiretos, os dados não são anônimos.

Além disso, a ANPD vai atuar especificamente determinando questões de custo e de tempo — fatores mencionados na LGPD como discriminantes para estabelecer se um processo de anonimização é reversível ou não. Cabe à agência essa análise subjetiva de cada caso.

Nesse sentido, é importante conhecer a agência, entender os casos já analisados e pesquisar sobre os critérios utilizados para saber como se adaptar aos processos e aplicar corretamente as técnicas.

Como a Algar te ajuda na proteção dos dados?

A Algar oferece uma solução completa de proteção da web, focada em pilares da LGPD, para otimizar seus processos e reduzir os riscos.

Assim, você garante o monitoramento de acessos em links de banda larga e pode combater possíveis riscos de contaminação que levam a uma situação de vazamento ou violação de dados, por exemplo.

É viável evitar outros tipos de ciberataques também.

A capacidade de prever e monitorar cada situação de risco coloca a empresa em vantagem e assegura uma proteção global e abrangente. 

Aprenda mais sobre a melhor estratégia de proteção para se adaptar à LGPD!

Perguntas Frequentes

Imagem de um homem encapuzado de preto digitando algo no celular. A anonimização de dados é importante para sua segurança.

O que é um dado anonimizado?

Um dado anonimizado é um dado sem vestígios pessoais que não permite especificar uma pessoa unicamente. Por isso, é um dado que pode ser gerenciado sem grandes problemas. 

Como fazer anonimização dos dados?

Existem diversas técnicas, como generalização, supressão e a aplicação de criptografia. 

O que acontece quando os dados são anonimizados?

Os dados perdem um pouco de sua utilidade e clareza, porém se tornam mais seguros. É uma troca que a empresa faz para assegurar maior proteção. 

Qual a relação entre os dados anonimizados e a LGPD?

A LGPD estipula que dados anônimos podem ser gerenciados sem a preocupação que existe no caso da gestão dos dados pessoais. 

Conclusão

A anonimização de dados busca eliminar a possibilidade de restringir um dado a um único ser humano, de modo a eliminar problemas com o cliente e com os órgãos de fiscalização. Nesse sentido, a empresa se torna mais confiável no mercado quando sabe aplicar essas técnicas.

Por isso, é fundamental entender como fazer e quais táticas utilizar. Isso inclui também conhecimento sobre possibilidades da pseudonimização.

Avalie este post