Palavras mal escritas, espaços teimosos, prefixos indesejados, casos impróprios e personagens não-printing fazem uma má primeira impressão. E isso nem sequer é uma lista completa de maneiras que os seus dados podem sujar. Arregace as mangas. Está na hora de uma grande limpeza da mola das suas folhas de cálculo com o Microsoft Excel.
O básico da limpeza dos seus dados
Nem sempre tem controlo sobre o formato e o tipo de dados que importa a partir de uma fonte externa de dados, como uma base de dados, ficheiro de texto ou uma página Web. Antes de poder analisar os dados, muitas vezes é necessário limpá-los. Felizmente, o Excel tem muitas funcionalidades para o ajudar a obter dados no formato preciso que deseja. Às vezes, a tarefa é simples e há uma característica específica que faz o trabalho por si. Por exemplo, pode utilizar facilmente o Spell Checker para limpar palavras mal escritas em colunas que contenham comentários ou descrições. Ou, se quiser remover as linhas duplicadas, pode fazê-lo rapidamente utilizando a caixa de diálogo Remove Duplicates.
Noutras alturas, poderá ser necessário manipular uma ou mais colunas utilizando uma fórmula para converter os valores importados em novos valores. Por exemplo, se quiser remover espaços de trailing, pode criar uma nova coluna para limpar os dados utilizando uma fórmula, preenchendo a nova coluna, convertendo as fórmulas da nova coluna em valores e, em seguida, removendo a coluna original.
Os passos básicos para a limpeza dos dados são os seguintes:
-
Importar os dados de uma fonte externa de dados.
-
Crie uma cópia de cópia de cópia de reserva dos dados originais num livro separado.
-
Certifique-se de que os dados se encontra num formato tabular de linhas e colunas com: dados semelhantes em cada coluna, todas as colunas e linhas visíveis, e sem linhas em branco dentro do intervalo. Para obter os melhores resultados, use uma tabela Excel.
-
Faça tarefas que não exijam manipulação da coluna primeiro, como a verificação ortográfica ou a utilização da caixa de diálogo Find and Replace.
-
Em seguida, faça tarefas que requerem manipulação de colunas. Os passos gerais para manipular uma coluna são:
-
Insira uma nova coluna (B) junto à coluna original (A) que necessita de ser limpa.
-
Adicione uma fórmula que transformará os dados no topo da nova coluna (B).
-
Preencha a fórmula na nova coluna (B). Numa tabela Excel, uma coluna calculada é automaticamente criada com valores preenchidos.
-
Selecione a nova coluna (B), copie-a e, em seguida, cole-a como valores na nova coluna (B).
-
Retire a coluna original (A), que converte a nova coluna de B para A.
-
Para limpar periodicamente a mesma fonte de dados, considere registar um código macro ou de escrita para automatizar todo o processo. Há também uma série de add-ins externos escritos por fornecedores de terceiros, listados na secção de fornecedores de terceiros, que você pode considerar usar se você não tem o tempo ou recursos para automatizar o processo por conta própria.
Mais informações |
Descrição |
---|---|
Preencher dados automaticamente em células de folhas de cálculo |
Mostra como usar o comando Fill. |
Criar e formato tabelas
|
Mostre como criar uma tabela Excel e adicione ou apague colunas ou colunas calculadas. |
Mostra várias formas de automatizar tarefas repetitivas usando uma macro. |
Verificação ortográfica
Pode utilizar um verificador de feitiços para não só encontrar palavras mal escritas, mas para encontrar valores que não são utilizados de forma consistente, como nomes de produtos ou empresas, adicionando esses valores a um dicionário personalizado.
Mais informações |
Descrição |
---|---|
Mostra como corrigir palavras mal escritas numa folha de cálculo. |
|
Use dicionários personalizados para adicionar palavras ao verificador de ortografia |
Explica como usar dicionários personalizados. |
Remoção de linhas duplicadas
As filas duplicadas são um problema comum quando se importam dados. É uma boa ideia filtrar primeiro valores únicos para confirmar que os resultados são o que deseja antes de remover valores duplicados.
Mais informações |
Descrição |
---|---|
Filtrar por valores exclusivos ou remover valores duplicados |
Mostra dois procedimentos intimamente relacionados: como filtrar para linhas únicas e como remover linhas duplicadas. |
Encontrar e substituir texto
Pode querer remover uma corda comum de liderança, como uma etiqueta seguida de um cólon e espaço, ou um sufixo, como uma frase parêntestica no final da corda que é obsoleta ou desnecessária. Pode fazê-lo encontrando instâncias desse texto e substituindo-o sem texto ou outro texto.
Mais informações |
Descrição |
---|---|
Verifique se uma célula contém texto (insensível a casos)
|
Mostre como usar o comando Find e várias funções para encontrar texto. |
Mostra como utilizar o comando De substituição e várias funções para remover texto. |
|
Localizar ou substituir texto e números numa folha de cálculo |
Mostre como utilizar as caixas de diálogo Find and Replace. |
FINDB
|
Estas são as funções que pode usar para fazer várias tarefas de manipulação de cordas, tais como encontrar e substituir uma subcadeia dentro de uma corda, extrair porções de uma corda, ou determinar o comprimento de uma corda. |
Alteração do caso do texto
Por vezes, o texto vem num saco misto, especialmente no que diz respeito ao texto. Utilizando uma ou mais das três funções de Caso, pode converter texto em letras minúsculas, tais como endereços de e-mail, letras maiúsculas, como códigos de produto, ou caso adequado, como nomes ou títulos de livro.
Mais informações |
Descrição |
---|---|
Mostra como usar as três funções de Caso. |
|
Converte todas as letras maiúsculas numa cadeia de texto para letras minúsculas. |
|
Coloca a primeira letra do texto em maiúscula e todas as outras letras do texto depois de qualquer caráter diferente de uma letra. Converte todas as outras letras para minúsculas. |
|
Converte texto em letras maiúsculas. |
Remoção de espaços e caracteres não-impressos do texto
Por vezes, os valores de texto contêm caracteres espaciais principais, de rastos ou múltiplos caracteres espaciais incorporados (Unicode caracteres de caracteres 32 e 160), ou caracteres não-printing (Unicode character set values 0 a 31, 127, 129, 141, 143, 144 e 157). Estes caracteres podem, por vezes, causar resultados inesperados quando se classifica, filtrar ou pesquisar. Por exemplo, na fonte externa de dados, os utilizadores podem cometer erros tipográficos adicionando inadvertidamente caracteres de espaço extra, ou dados de texto importados de fontes externas podem conter caracteres não-impressos que estão incorporados no texto. Como estes caracteres não são facilmente notados, os resultados inesperados podem ser difíceis de entender. Para remover estes caracteres indesejados, pode utilizar uma combinação das funções TRIM, CLEAN e SUBSTITUTO.
Mais informações |
Descrição |
---|---|
Mostra como remover todos os espaços e caracteres não-printing do conjunto de caracteres Unicode. |
|
Devolve o código numérico do primeiro caráter de uma cadeia de texto. |
|
Remove os primeiros 32 caracteres não-printing no código ASCII de 7 bits (valores 0 a 31) do texto. |
|
Remove o personagem espacial ASCII de 7 bits (valor 32) do texto. |
|
Pode utilizar a função SUBSTITUTO para substituir os caracteres Unicode de maior valor (valores 127, 129, 141, 143, 144, 157 e 160) pelos caracteres ASCII de 7 bits para os quais foram desenhadas as funções TRIM e CLEAN. |
Fixação de números e sinais de número
Existem dois principais problemas com números que podem exigir que limpe os dados: o número foi inadvertidamente importado como texto, e o sinal negativo precisa ser alterado para o padrão para a sua organização.
Mais informações |
Descrição |
---|---|
Mostra como converter números que são formatados e armazenados em células como texto, o que pode causar problemas com cálculos ou produzir ordens de classificação confusas, para o formato de número. |
|
Converte um número em formato de texto e aplica um símbolo de moeda. |
|
Converte um valor em texto num formato de número específico. |
|
Arredonda um número para o número especificado de decimais, formata o número em formato decimal utilizando um período e vírgulas, e devolve o resultado como texto. |
|
Converte uma cadeia de texto que representa um número num número. |
Fixação de datas e horários
Como existem tantos formatos de data diferentes, e porque estes formatos podem ser confundidos com códigos de peças numerados ou outras cordas que contenham marcas de corte ou hífenes, datas e horas muitas vezes precisam de ser convertidos e reformados.
Mais informações |
Descrição |
---|---|
Alterar o sistema de datas, formato ou interpretação de dois dígitos |
Descreve como funciona o sistema de datas no Office Excel. |
Mostra como se converter entre diferentes unidades de tempo. |
|
Mostra como converter datas formatadas e armazenadas em células como texto, o que pode causar problemas com cálculos ou produzir ordens de classificação confusas, até à data do formato. |
|
Devolve o número de série sequencial que representa uma data particular. Se o formato das células correspondia a Geral antes da introdução da fórmula, o resultado é formatado como uma data. |
|
Converte uma data representada por texto para um número de série. |
|
Devolve o número decimal para uma determinada hora. Se o formato das células correspondia a Geral antes da introdução da fórmula, o resultado é formatado como uma data. |
|
Devolve o número decimal da hora representado por uma cadeia de texto. O número decimal é um valor que vai de 0 (zero) a 0,9999999999, representando os horários das 0:00:00 (12:00:00 horas) às 23:59:59 (11:59:59). |
Colunas de fusão e divisão
Uma tarefa comum após a importação de dados de uma fonte externa de dados é fundir duas ou mais colunas numa, ou dividir uma coluna em duas ou mais colunas. Por exemplo, pode querer dividir uma coluna que contenha um nome completo num primeiro e último nome. Ou, talvez queira dividir uma coluna que contenha um campo de endereços em colunas separadas de ruas, cidades, regiões e códigos postais. O inverso também pode ser verdade. Pode querer fundir uma coluna de Primeiro e Último Nome numa coluna de Nome Completo ou combinar colunas de endereçoseparadas numa coluna. Valores comuns adicionais que podem exigir a fusão numa coluna ou a divisão em várias colunas incluem códigos de produto, caminhos de ficheiros e endereços ip do Protocolo de Internet( IP).
Mais informações |
Descrição |
---|---|
Combine os primeiros e últimos nomes
|
Mostre exemplos típicos de combinar valores de duas ou mais colunas. |
Dividir texto em colunas diferentes com o Assistente de Conversão de Texto para Colunas |
Mostra como usar este assistente para dividir colunas com base em vários delimitadores comuns. |
Mostra como usar as funções ESQUERDA, MÉDIO, DIREITA, SEARCH e LEN para dividir uma coluna de nome em duas ou mais colunas. |
|
Mostra como utilizar a função CONCATENATE, & (ampersand) e converter texto para assistente de colunas. |
|
Mostra como usar os comandos Merge Cells,Merge Acrosse Merge and Center. |
|
Junta duas ou mais cordas de texto numa corda de texto. |
Transformando e reorganizando colunas e linhas
A maioria das funcionalidades de análise e formatação no Office Excel assumem que os dados existem numa única tabela bidimensional plana. Às vezes, pode sê-lo, e as colunas tornam-se linhas. Noutras alturas, os dados nem sequer estão estruturados num formato tabular, e é preciso uma forma de transformar os dados de um formato não tabular para um formato tabular.
Mais informações |
Descrição |
---|---|
Devolve uma gama vertical de células como uma gama horizontal, ou vice-versa. |
|
Conciliar os dados da tabela juntando ou combinando
Ocasionalmente, os administradores de bases de dados usam o Office Excel para encontrar e corrigir erros de correspondência quando duas ou mais tabelas são unidas. Isto pode envolver a conciliação de duas tabelas de diferentes folhas de cálculo, por exemplo, para ver todos os registos em ambas as mesas ou comparar tabelas e encontrar linhas que não correspondam.
Mais informações |
Descrição |
---|---|
Mostra formas comuns de procurar dados utilizando as funções de procura. |
|
Devolve um valor quer de uma linha quer de uma coluna, quer de uma matriz. A função LOOKUP tem duas formas de sintaxe: a forma vetorial e a forma de matriz. |
|
Procura um valor na linha superior de uma tabela ou uma série de valores, e depois devolve um valor na mesma coluna a partir de uma linha que especifica na tabela ou na matriz. |
|
Procura um valor na primeira coluna de uma matriz de tabela e devolve um valor na mesma linha a partir de outra coluna na matriz de tabelas. |
|
Devolve um valor ou a referência a um valor de dentro de uma tabela ou gama. Existem duas formas da função INDEX: o formulário de matriz e o formulário de referência. |
|
Devolve a posição relativa de um item numa matriz que corresponda a um valor especificado numa ordem especificada. Utilize CORRESP em vez de uma das funções PROC quando necessitar da posição de um item num intervalo em vez do item propriamente dito. |
|
Devolve uma referência a um intervalo que é um número especificado de linhas e colunas de uma célula ou de um intervalo de células. A referência que é devolvida pode ser uma única célula ou um intervalo de células. É possível especificar o número de linhas e o número de colunas a ser devolvido. |
Fornecedores de terceiros
Segue-se uma lista parcial de fornecedores de terceiros que possuem produtos que são utilizados para limpar dados de várias maneiras.
Nota: A Microsoft não fornece suporte para produtos de terceiros.
Fornecedor |
Produto |
---|---|
Add-in Express Ltd. |
|
Add-Ins.com |
https://www.add-ins.com/duplicate_finder.htmdo Localizador duplicado |
AddinTools |
Adicionar ferramentashttp://www.addintools.com/english/assist/de assistência |
WinPure |
Nota: Esta página foi traduzida automaticamente e pode conter erros gramaticais ou imprecisões. O nosso objetivo é que estes conteúdos lhe sejam úteis. Pode indicar-nos se estas informações foram úteis? Eis o artigo em inglês para sua referência.