Neste tutorial, vou mostrar alguns recursos para organizar e extrair informação de arquivos de texto utilizando o ONLYOFFICE Planilhas.
Frequentemente precisamos extrair informações de textos ou planilhas, muitas vezes o conteúdo do arquivo simplesmente não está formato ou organizado. E para podermos extrair informações é primordial que o conteúdo do arquivo siga uma ordem clara, o que vai tornar muito mais simples remover as informações de que não precisamos.
Preparando o campo de trabalho
Antes de começarmos, é importante lembrar que para um arquivo ser trabalhado corretamente, o ideal é que ele tenha uma estrutura ao menos parcialmente organizada. Do contrário, será necessário trabalho prévio organizando todo o conteúdo.
Um dica que pode te economizar algum tempo é sempre pensar nos textos como um “banco de dados”, procurando entender sua estrutura e como fatiar o que te interessa.
Vamos usar como exemplo este texto retirado do fórum que é uma pesquisa básica listando alguns tópicos postados pela equipe.

Transformando textos em planilhas
Para cumprirmos o objetivo de transformar o texto em uma planilha, vamos precisar de alguns passos intermediários.
Precisamos adicionar um “divisor” entre cada célula (ponto-e-vírgula) e ao final das linhas vermelha, azul e verde.
Novo ONLYOFFICE 6.3 vai poupar os seus olhos;
Diolinux Feed;
jun '21 - https://diolinux.com.br/softwares/novo-onlyoffice-6-3.html...;
Também será necessário unir as linhas do exemplo (vermelha, azul e verde), para que as colunas da tabela fiquem corretamente posicionadas.
Novo ONLYOFFICE 6.3 vai poupar os seus olhos; Diolinux Feed;jun '21 - https://diolinux.com.br/softwares/novo-onlyoffice-6-3.html...;
Repita o processo com todas as linhas que compõe o seu arquivo, o resultado será um arquivo de texto puro com as colunas separadas por ponto-e-vírgula e a planilha final terá o mesmo número que linhas que o seu arquivo base.
Dica: em arquivos longos, utilize a ferramenta de busca/substituição (CTRL+F ou CTRL+H) para tornar o processo mais eficiente.
O que são arquivos CSV
Os arquivos CSV são bastante usados para criar tabelas de conteúdo baseadas em texto e sua principal vantagem é a compatibilidade, permitindo que você troque o arquivo entre sistemas operacionais diferentes sem afetar os dados.
Podemos considerar os arquivos CSV como pequenas planilhas, mesmo que extremamente simples. Após o trabalho inicial de formatação manual, podemos salvar o arquivo com a extensão CSV (comma separated values) e abri-lo no ONLYOFFICE Planilhas.

Como usar filtros de conteúdo no ONLYOFFICE Planilhas
Após abrir o arquivo no editor de planilhas, teremos acesso a todas as funções avançadas de tratamento de dados como as ferramentas de Filtros e fórmulas.

Para adicionar filtros básicos em cada coluna, siga os passos abaixo.
- Clique na primeira linha, geralmente onde ficam os cabeçalhos das colunas e depois clique no ícone de Filtros, para ativar o recurso na planilha.
- Após isso, basta clicar na seta que aparece ao lado de cada coluna e utilizar as opções disponíveis.
Como remover linhas duplicadas no ONLYOFFICE
Para remover linhas duplicadas ou até mesmo linhas em branco em uma arquivo do ONLYOFFICE Planilhas podemos utilizar o poderoso recurso “remover de duplicatas”. Neste arquivo de exemplo, temos diversas linhas em branco ao longo da planilha (setas azuis).

Para remover todas as ocorrências de textos duplicados, sia os passos abaixo:
- Clique na aba Dados;
- Clique em Remover Duplicatas;
- Ative a opção de preservar cabeçalhos se necessário.
Após isso, basta clicar em “OK” e seu arquivo será limpo.
O ONLYOFFICE Planilhas oferece muitos outros recursos para edição de planilhas e formatação de dados, como as Tabelas Dinâmicas que permitem adicionar filtros condicionais avançados ou plugins que podem ser instalados para ampliar ainda mais as possibilidades.
Espero que estas dicas possam facilitar o seu dia, assim como me ajudam diariamente em diversas tarefas.