Neste post vamos apresentar à vocês a ferramenta Talend Open Studio para que possam fazer avaliação do quanto essa ferramenta é prática e eficaz.
Hoje, todos procuram soluções inteligentes para o mundo dos negócios. Transformar Gigas, Terabytes de dados em informação legível, como gráficos, tabelas, é algo não apenas necessário, mas essencial para a tomada de decisão que hoje, acompanhando a velocidade da informação, deve ser feita em tempo real, tudo é para agora, ou melhor, ontem. É onde entra a inteligência nos negócios, Busineess Intelligence (BI).
As ferramentas de integração de dados, são conhecidas também como ETL (Extract, Tranform, Load), onde a função destas nada mais é do que preparar todos esses dados e organizá-los de forma a serem guardados em tabelas, fazendo com que consultas posteriores sejam mais simples e eficazes, é onde um emaranhado de dados começa a fazer sentido. Nesse ponto que se encaixa o trabalho do Talend Open Studio, a ferramenta livre e de código aberto da empresa francesa Talend. Com um poderoso sistema ETL, esta se comporta como a mais abrangente em código aberto do mercado.
O Talend também trabalha com o processo denominado ELT (Extract, Load, Tranform), onde este sobressai em desempenho, quanto a carga em banco de grande volume de dados por aproveitar a eficiência das funções nativas do banco de dados em uso. O Talend mostra que a solução livre pode ser um ótimo negócio, chegando a concorrer com grandes como IBM, SAS e SAP.
Alguns Destaques
Um ponto positivo é quanto a documentação. No próprio site da Talend podemos encontrar toda a documentação para qualquer versão da ferramenta que queremos, seja ela em uma versão paga ou não. Podemos encontrar desde detalhes sobre a arquitetura do sistema até os componentes, explicados um a um, quanto a função e uso.
Desenvolvido em Java, O Talend possui entre outras, gerenciador gráficos para processos ETL, gerenciador de metadados, interface WebService para processos ETL. Aqui daremos uma visão sobre ETL, e a ferramenta gratuita TOS – Talend Open Studio, usada para tal fim. Desde instalação, passando por uma configuração inicial, e uma breve visão de interface.
Em outros posts trataremos especificamente cada uma dos tópicos tratados superficialmente aqui a fim de apresentar a ferramenta de maneira completa para que possamos passar para níveis mais avançados de tutoriais, onde ficará mais divertido! Mas agora vamos a parte chata menos legal necessária.
Talend é uma ferramenta que trabalha com a geração de código, sendo Java ou Perl. O mecanismo de geração de código permite a integração do código gerado pelo Talend dentro de outras soluções, além de ter maior portabilidade. E esta é o grande diferencial do Talend. Aqui trataremos apenas para o caso de Java, o que não torna inútil para quem segue com Perl, pois nos tutoriais trataremos do desenvolvimento que pode ser seguido em qualquer um dos casos.
Instalação do Talend Open Studio
A instalação do Talend é muito simples. Na verdade, trata-se de uma extração para diretório de caminho curto, como “c:\Talend”, e ‘voila!’. Está feito. Agora podemos passar para a primeira execução.
Execução
Na execução, não somente na primeira, mas em todas, é apresentada um janela para
a configuração, seleção, importação, de projetos. Em dois campos, sendo o primeiro quanto a conexão, como local ou remoto, e um segundo campo projeto, onde temos opção de importar, criar ou remover um projeto. Por enquanto ficaremos com os projetos de demonstração em Java. Clique em ‘…’ e crie uma nova conexão. Selecione ‘Local’ em repositório. Dê um nome à sua conexão, sugiro “Local”. Escolha um diretório destino para a Workspace dos seus projetos.
Uma observação a ser feita, o Open Studio não possibilita a criação de uma conexão remota, ou seja, para o TOS o desenvolvimento sempre ocorrerá localmente.
No campo “Projeto” selecione ‘Import demo project’ clique em ‘Go!’, então selecione a linguagem. Espere a importação. Então refresh na lista de projetos, selecione ‘TALENDDEMOSJAVA – java’ e ‘Open’. Pronto, aqui temos uma boa quantidade de Jobs, metadados, entre outros, sendo o suficiente para uma boa diversão.
Interface
Por default, o Talend dispõe suas abas da forma que irei apresentar logo em seguinte. Mas nada impede o usuário de ocultar, exibir outras opções, bem como mudar tamanhos, e até mesmo os locais das mesmas.
À esquerda, encontramos nossas conexões, metadados, templates, funções, além dos desenvolvimentos já desenvolvidos, bem como suas versões. Enfim, os dados a serem integrados e/ou transformados em nosso projeto, bem como funções que possamos vir a utilizar neste.
À direita, está o ouro. Digo isso pela gama de componentes que encontramos. É possível se chegar a solução do nosso problema de várias maneira diferentes usando vários componentes diferentes tamanha é quantidade de componentes disponíveis por default. E claro, se chegar a solução não é o único objetivo. Mas fazer isso com o menor número de recursos possíveis, como tempo, e recursos da própria máquina. Aqui, sempre priorizaremos mostrar a melhor solução, por excelência.
Abaixo, encontramos a aba de configuração, execução, teste, debug, o Talend Exchange, que possibilita a inclusão automática de novos componentes ampliando ainda mais nossos horizontes. Onde também configuramos as opções de cada componente adicionado ao Job.
E no meio disso tudo no campo para criação. O espaço onde desenvolvemos as soluções, onde os componentes são adicionados linkados para gerar o Job. Tudo no “arraste”, botão direito, muito intuitivo.
O Talend apresenta solução flexível para atender aos processos de ETL de forma segura e confiável. A documentação pelo desenvolvedor se mostra bastante simples e de fácil acesso e fácil extração, podendo exportá-la como HTML, por exemplo. Estando ciente que a documentação se encontra completa apenas em inglês ou francês, é possível estudar sozinho para conhecer melhor esta ferramenta e perceber que pode ser usada para várias soluções que está procurando.