terça-feira, 15 de abril de 2008

QUEM TEM MEDO DE COMPACTADORES

Quando se fala o termo compactador, a maioria dos usuários de computador não sabe exatamente do que se está falando. Não há pesquisas - que eu conheça - sobre isso mas há muitos anos que converso com conhecidos e alunos sobre o tema e percebo que existe muita desinformação nesta área.

A começar pelo termo, a palavra compactador lembra aqueles maquinários gigantes de ferro-velho, que transformam carros em caixinhas de metal, ou então pensa-se em compactadores de lixo, normalmente se associa a palavra com reciclagem ou diretamente com lixo.

Na informática, compactador não tem nada a ver com lixo ou reciclagem, trata-se de um tipo de programa que permite reduzir o tamanho dos arquivos. O mais conhecido, entre as diversas opçõesexistentes é o formato ZIP, criado em 1986 por Philip W. Katz. Para mais detalhes sobre o criador e sua criação recomendo o excelente artigo no link a seguir:

http://catalisando.com/infoetc/452.htm

Atualmente existem tantos formatos e programas de compactação e descompactação que seria muito difícil citar todos sem precisar escrever uma enciclopédia, só as versões do ZIP (originalmente PKZIP) já formariam uma lista bastante extensa.

A boa notícia é que a maioria dos compactadores vem atualmente embutida em sistemas operacionais, em programas diversos e até mesmo em servidores da Internet.

A má notícia é que são tantas as opções que em muitos casos instala-se a confusão entre os usuários, muitos arquivos compactados já se perderam justamente porque quem os recebeu não soube fazer o processo inverso, a descompactação que permitiria recuperar o arquivo original. Os motivos são vários, que começam por nem saber que se trata de um arquivo compactado ou não ter o programa adequado para executar o procedimento.

Mais a frente vou falar sobre alguns programas.

PARA QUE SERVE A COMPACTAÇÃO?

A compactação de arquivos serve a inúmeras atividades e está presente na maioria dos equipamentos eletrônicos, de forma invisível e transparente.

Por exemplo, o caro leitor sabia que filmes, fotos e sons podem ser compactados?

Termos conhecidos como MP3 ou MP4 não são apenas nomes de aparelhinhos que quase todos carregam por ai, ouvindo suas músicas e sons preferidos. Na verdade antes de começarem a dar nome aos populares aparelhos eram apenas as siglas de processos de compactação.

Acontece que uma compactação MP3 (para som) ou MP4 (para som e video) não é normalmente feita por usuários comuns e mesmo quando são feitas, ocorrem de forma transparente, sendo que os aparelhos que executam depois a descompactação e transformam em áudio e video também o fazem de forma transparente, o usuário não precisa fazer absolutamente nada, apenas apertar um botão.

A compactação ocorre para reduzir o tamanho dos arquivos necessários para que se reproduza o som e o vídeo e isso explica porque um CD comum costuma ter no máximo umas 20 e poucas músicas e um CD MP3 pode ter mais de 200 músicas.

Quando a compactação é bem feita nosso ouvido nem mesmo consegue perceber a diferença entre um som executado por um aparelho MP3 ou por um aparelho comum. Claro que ouvidos treinados ou sensíveis seriam capazes de perceber, mas são raras as pessoas que tem este dom, a maioria não consegue perceber.

No caso de compactação de video já é possível notar a diferença, quanto maior for a compactação, menor a qualidade final do video exibido e em muitos casos percebe-se as falhas na exibição, notadamente nos casos em que vídeos de um filme inteiro é compactado de forma a caber em um CD comum, os chamados VCD ou Video CD.

Outro lugar onde a compactação se aplica é nas fotos digitais. A grande maioria das câmeras digitais gravam seus arquivos em um formato com a extensão JPEG ou JPG, ambos significam a mesma coisa e a sigla é originária do termo em inglês: Joint Photographic Experts Group, que em uma tradução livre, significa: Grupo de especialistas em fotografia.

Este grupo foi quem definiu as regras para compactação de imagem e a partir de suas conclusões o JPG passou a ser um padrão mundial.

Graças a este processo e a outros que vieram depois, uma imagem fotográfica que poderia ocupar um espaço gigantesco passou a caber em um espaço menor.

Da mesma forma, arquivos de computador que poderiam ocupar espaços gigantescos passam a ocupar espaços menores e isso é especialmente útil em transmissões via Internet, onde o tamanho do arquivo pode fazer muita diferença.

E os compactadores não servem apenas para reduzir o tamanho dos arquivos, também permitem organiza-los. Isso é especialmente útil em procedimentos de backup (preservação de arquivos)  onde não basta reduzir o tamanho, também é preciso organizar.

Não é foco desta matéria explicar os processos ou entrar em detalhes técnicos, mas deixo claro que os procedimentos de compactação implicam em cálculos matemáticos complexos e que normalmente são integrados a programas ou diretamente a equipamentos, que vem com estes programas embutidos nas parte física, em um procedimento chamado Firmware.

Possivelmente, o leitor já conhece os termos Hardware e Software, sendo que o primeiro costuma ser a parte física dos equipamentos e o segundo a parte lógica, que contém os códigos necessários para um equipamento funcionar. O Firmware é um termo que significa basicamente hardware + software, ou seja, um equipamento que já vem com o código de execução embutido, desde a fábrica. Um exemplo claro são os aparelhos MP3 ou MP4, mas um aparelho de DVD também vem com seu Firmware, de fábrica. Em muitos casos o Firmware pode ser atualizado, o que significa que se houver mudanças nos sistemas existentes é possível atualizar o aparelho sem precisar trocar tudo.

QUAIS SÃO OS PROCESSOS DE COMPACTAÇÃO?

São muitas as opções existentes, desde que o PKZIP se tornou popular, surgiram milhares de processos diferentes e as siglas se multiplicaram, gerando uma enorme confusão.

Cada processo tem vantagens e desvantagens em relação aos demais e a escolha de qual deles deve ser utilizado deve ser baseada em conhecimentos específicos e avançados, tanto que para o usuário comum o ZIP continua a ser a opção mais adequada, devido principalmente a grande quantidade de programas capazes de interpretar ou gerar uma compactação neste formato.

O formato ZIP ficou tão popular que gerou até mesmo equipamentos que não são necessariamente compactadores, como é o caso do ZIP disk, um hardware criado pela empresa Iomega e que por algum tempo pretendeu substituir os famosos disquetes de computador. Quase teve sucesso e se tornou bastante popular, mas com o advento das mídias mais baratas representadas pelo CD, depois DVD e atualmente o BlueRay o Zip Disk simplesmente entrou para o limbo. Alguns ainda o utilizam mas a verdade é que o Zip Disk virou peça de museu, assim como o disquete.

Para o usuário comum é preciso saber que existem duas CATEGORIAS de processo, apenas duas:

Categoria 1: A que modifica o arquivo original, causando uma perda de informação.

Categoria 2: A que não estraga o arquivo original, permitindo a sua total recuperação.

Na categoria 1, a que modifica o arquivo estão os já citados MP3, MP4 e o próprio JPG.

Na categoria 2 está o formato ZIP.

Certamente tem uma pergunta na mente dos mais curiosos: Quer dizer que as fotos que tiro com minha câmera não são originais?

A resposta é sim, As fotos de sua câmera digital não são arquivos originais, os arquivos são modificados ao serem convertidos (diretamente pelo Firmware da câmera) para o formato JPG ou qualquer outro que ela utilize, exceto um formado, chamado RAW e que não é um formato compactado.

RAW não é uma sigla, é um termo do inglês, que poderia ser traduzido como "crú" e não é um formato totalmente padronizado, cada fabricante pode ter o seu.

Nem toda câmera digital tem a opção de gravar as imagens em RAW, isso é mais comum em câmeras profissionais, onde a qualidade máxima faz alguma diferença.

Usar este formato não é simples, normalmente é preciso um software da câmera para ler este formato e o tamanho é muito maior do que o popular JPG e o ganho de qualidade só é visível no uso estritamente profissional.

Não significa que o formato JPG não possa ser utilizado profissionalmente, na verdade a maioria dos profissionais também ignoram o RAW, uma vez que é de difícil manipulação.

Tentarei explicar como é essa coisa de "mudar sem perder".

Suponha que você escreveu um texto e quem em seu texto existam palavras que se repitam muitas vezes.

Uma das técnicas mais simples de compactação constitui em substituir estas palavras por representações menores, por exemplo a palavra "árvore" poderia ser substituída pelo número 1, a palavra "natureza" poderia ser substituída pelo número 2.

Como os números 1 e 2 gastam menos espaço para serem armazenados do que as palavras, em um texto em que houvesse muitas repetições de "árvore" e "natureza" haveria um razoável ganho de espaço.

Evidentemente se houver os números 1 e 2 no texto eles precisam também receber um código para não serem confundidos, um algoritmo no programa costuma cuidar destes detalhes.

Ao aplicar tal regra, para se recuperar o texto original bastaria usar um programa que fizesse o contrário, ou seja substituísse os códigos pelas palavras. O resultado final seria um arquivo exatamente igual ao arquivo original.

O que os programas de compactação fazem é basicamente isso, descobrem nos arquivos quais são as ocorrências de um padrão de repetição e as substituem por um outro padrão.

É fácil imaginar o gigantesco trabalho de lógica que é necessário para fazer isso e é exatamente o que acontece nos programas de compactação e descompactação, há um gigantesco trabalho de processamento, que foi criado por gênios da matemática.

Só que uma imagem, ou som, ou ambos, no caso de video + som não são tão simples de lidar quanto um texto. Nestes casos o processo é ainda mais complexo e o resultado final pode não ser exatamente a mesma imagem, o mesmo som, o mesmo video, embora este resultado seja muito próximo do original.

No caso de imagens, quando temos um céu muito azul que predomine em uma foto, ou um fundo enorme, da mesma cor o que o JPG faz é informar que existe um padrão de repetição e em muitos casos isso gera um arquivo infinitamente menor, para ser armazenado. Na hora de reproduzir a imagem apenas o padrão repetido é refeito.

Não é tão simples na prática, quanto parece na explicação, cada pixel (ponto) em uma imagem tem diversas informações associadas a ele, tais como brilho, cor, densidade e muito mais.

O fato é que se compactamos um texto ele vai voltar exatamente como digitado, mas uma foto ou som volta com ligeira modificações, normalmente imperceptíveis a nossos olhos ou ouvidos.

E a quantidade de mudanças permitidas é variável, quando vamos compactar para o formato JPG, por exemplo é informada uma taxa de compressão, em um valor percentual. Quanto menor a taxa, menor o arquivo e menor a qualidade final.

Espero não ter entediado o leitor com tantos esclarecimentos técnicos, mas sem um mínimo de conhecimento nesta área não dá pra entender (e por isso pouca gente entende) a utilidade da compactação.

Relembrando... há basicamente dois tipos de compactação, com perda de informação e sem perda de informação e isso é a única coisa que o leitor precisa saber e - naturalmente - se informar a qual categoria pertence seu programa, na hora de escolher o que vai usar para compactar.

ESCOLHENDO UM PROGRAMA DE COMPACTAÇÃO

Programas de compactação tem detalhes técnicos bastante específicos e é possível definir qual deles usar se houver muito conhecimento destes detalhes.

Como a maioria das pessoas não tem este conhecimento, até porque não é necessário,.costuma-se escolher os programas como se escolhe um time de futebol para torcer... por acaso e depois apaixona-se pelo time e passa a desprezar os outros.

O formato ZIP é o "time" que está vencendo, embora existam muitos outros compactadores com mais capacidade e qualidade, mas ZIP é que nem "Banco do Brasil", tem em qualquer canto.

No Windows XP tem ZIP, mas ele fica tão escondido que poucos sabem da sua existência. Já o Windows Vista vem com este compactador mais destacado.

Vou recomendar apenas um único compactador, não porque ele seja o melhor ou porque eu goste mais dele, mas se fizermos uma análise de custo benefício, sem levar em conta as preferências pessoais de cada um o programa mais adequado para compactar e descompactar no dia-a-dia é o 7ZIP, notem que ele traz no nome a palavra ZIP, mas isso não quer dizer que ele apenas trabalha com este formato.

A segunda melhor característica do 7ZIP é que trabalha com todos os formatos mais populares de compactação, ou seja, é capaz de ler arquivos gerados por diversos outros programas e isso é um diferencial e tanto quando se fala de compactadores.

A primeira melhor característica é que se trata de um programa de código aberto, ou seja, gratuito, free, 0800. Sinal dos tempos, onde bons programas não custam mais em nosso bolso.

Para pegar a versão mais recente do 7ZIP o ideal é ir direto no site do fabricante, que fica em: www.7-zip.org. O site tem opção de visualização em português do Brasil e o programa tem um excelente manual que ensina os segredos da compactação.

Claro que você pode continuar a usar seu programa favorito, mas se o mundo da compactação é uma novidade, então recomendo fortemente que comece por este programa.

O QUE PODE SER COMPACTADO E O QUE NÃO PODE?

É uma pergunta difícil de responder, devido a diversidade de arquivos que existem.

Mas basicamente podemos assumir algumas regras e definir alguns dos tipos mais simples de arquivos que podem ou não ser compactados.

Na lista dos que "podem" estão:

* Textos, de qualquer tipo. São os mais fáceis de compactar;
* Planilhas e bancos de dados;
* Programas executáveis;
* Backups em geral.

Na lista do "não pode" estão:

* Arquivos que já estejam compactados;
* Arquivos protegidos ou codificados;

Notem que coloquei "pode" ou "não pode" entre aspas, porque não é uma regra, na verdade vale tudo quando se trata de compactação, mas se algumas pequenas regras de bom senso não forem seguidas então o processo deixa de ser confiável.

Imagens, sons e vídeos não são bons candidatos a compactação porque normalmente já são arquivos compactados, mas não significa que não se possa juntar várias imagens ou vários sons em um arquivo compactado por outro processo. Há vantagens em fazer isso, como por exemplo poder enviar várias imagens em apenas um arquivo, através da Internet.

FALANDO DE FOTOGRAFIA E COMPACTAÇÃO

Algumas pessoas reclamam, as vezes, que meus textos são muito grandes e compreendo-as, vivemos em um mundo da velocidade e da falta de tempo.

Complementando este artigo eu gostaria de falar sobre a importância de tratar as imagens digitais, que são tão utilizadas em nosso dia-a-dia, mas neste caso o texto vai se agigantar.

Sendo assim, volto a tratar deste assunto nesta mesma coluna, mas só na semana que vem, prometo uma aula completa sobre como a compactação interfere no tratamento das imagens e como é importante saber lidar com elas.

Até lá recomendo que baixem dois programas que considero essenciais para lidar com imagens, um deles eu já recomendei em meu primeiro texto e o outro recomendo agora. Ambos são gratuitos e essenciais em qualquer computador de quem se proponha a lidar com imagens digitais.

Os programas são:

Irfan View: www.irfanview.com

Picasa2: www.picasa.google.com

Até a próxima coluna, quem ficar com pressa sinta-se a vontade para me enviar um email ou preferencialmente discutir o assunto na lista de discussão, criada especialmente para atender a esta coluna.

Nenhum comentário:

Postar um comentário