Pular para o conteúdo principal

Dando o primeiro passo para se tornar um jEDI

Muitos anos atrás um grande mestre nos disse que para se tornar um mestre JEDI era necessário conhecer como funciona o Garbage Collector e como escrever o seu próprio ClassLoader. Como um Padawan dedicado que não media esforços para se tornar um mestre e sem medo de misturar Star Trek com Star Wars, comecei a estudar como fazer tuning em aplicações Java controlando a alocação de memória realizada pela JVM.

Recentemente participei de duas consultorias onde foi necessário resolver problemas de performance fazendo uma análise da distribuição de memória entre as áreas geracionais dentro de uma JVM da Sun em execução e avaliar como a atuação do Garbage Collector influenciava a aplicação.

Como parte dos estudos e dos trabalhos de consultoria realizados, consegui dar um pequeno passo em direção à força! Agora compartilho um pouquinho do que aprendi.

Para ter uma ideia de como uma configuração errada da alocação de memória dedicada à JVM (normalmente via parâmetros de linhas de comando -Xms e -Xmx) ou a configuração default pode prejudicar a performance de uma aplicação, basta observar o figura a seguir.

GC time graphic
Este gráfico ilustra os momentos e o tempo de execução do Garbage Collector na área Old da memória alocada pela JVM. Alguns tempos são da ordem de 50 a 70 segundos. São tempos que uma aplicação fica congelada enquanto o Garbage Collector realiza a limpeza da memória para liberar espaço. Representa um tempo que certamente incomodará o usuário final durante o uso da aplicação.

Como obter estes dados e otimizar a performance?

No JDK, além das ferramentas tradicionais de linha de comando como javac e java, estão presentes as ferramentas jps, jstat e jstatd. A primeira é equivalente ao comando ps do Unix e permite saber quais processos Java (JVM) estão em execução e o respectivo PID. O segundo permite gerar estatísticas de Garbage Collection e tamanhos da memória ocupada pelas áreas geracionais do Java em execução. A terceira ferramenta faz o mesmo que a segunda ferramenta, mas disponibiliza os dados para acesso remoto via RMI. Muito útil para coletar dados de uma JVM executando remotamente num servidor e acompanhar a partir do desktop do desenvolvedor. O screenshot a seguir ilustra a execução dessa ferramenta via terminal para o demo SwingSet2 presente em qualquer instalação de JDK.

Executando jstat via terminal
Os detalhes sobre estas ferramentas e o significado de cada informação coletada podem ser obtidos em: Java Virtual Machine Statistics Monitoring Tool (jstat) e Java Virtual Machine Process Status Tool (jps).

Contudo, uma ferramenta muito interessante do pacote jvmstat que não foi incorporada ao JDK é o chamado visualgc (Visual Garbage Collection Monitoring Tool). Esta ferramenta permite visualizar graficamente os mesmos dados disponibilizados pela ferramenta jstat. Assim, torna-se possível perceber a dinâmica do Garbage Collector ao liberar memória dentro das áreas geracionais, além de indicar o tempo de execução de cada garbage collection, os tamanhos de cada área geracional e o espaço alocado a cada momento.

Como o visualgc não está presente no JDK, torna-se necessário fazer o download e instalar localmente (muito simples de instalar!). Para executar via linha de comando, basta digitar: visualgc vmid [interval], onde vmid é o PID da JVM desejada obtido via jps e interval é o tempo em milisegundos ou segundos que a ferramenta coleta as informações da JVM e atualiza na tela. Um exemplo de execução desta ferramenta é ilustrada na figura a seguir para o demo SwingSet2 em execução.

Execução do visualgc sobre o SwingSet2
Colocar a ferramenta para rodar ou coletar os dados via linha de comando é a parte fácil. Agora vem a parte difícil! Como analisar estas informações e transformar em resultado útil ao melhorar a performance de um aplicação Java? Este é um segredo que os mestres JEDI raramente ensinam! Mas um antigo pergaminho escrito por uma extinta empresa que era a meca dos JEDI revela todos os segredos. Este valioso documento é datado da época do JDK 1.3 e veio sofrendo atualizações ao longo dos anos para as versões atuais de JDK. O texto citado ainda pode ser encontrado na seguinte página (não sabemos até quando!): Tuning Garbage Collection with the 5.0 Java™ Virtual Machine.

Uma leitura cuidadosa do texto antigo, esquecido ou ignorado por muitos e citado acima, permitirá o Padawan e aprendiz de mestre JEDI conhecer detalhes de como usar a força a seu favor e melhorar significativamente a performance de uma aplicação Java. Contudo, nem sempre o caminho da força e conhecimento é fácil! Este caminho exige muito estudo, esforço e dedicação. Mas, cuidado para não cair na tentação do caminho mais fácil da ilusão criada pelos lordes "Microsith".

Quem sabe algum dia eu conto alguns segredos sobre como criar ClassLoaders customizados! Até lá boa leitura e bons códigos!

By Spock
http://blog.spock.com.br/
http://twitter.spock.com.br/
http://www.springbrasil.com.br/

Comentários

Unknown disse…
Show o artigo Dr. Spock!

A arquitetura de class loading, os modelos e áreas de memória onde atua (ou não) o GC e as capacidades atuais de instrumentar uma JVM define o que é maturidade.

Não imagino a quanto anda isso nas outras linguagens da moda, mas sei que se ela roda em cima da uma JVM, vai levar tudo isso pronto, como um sistema operacional da linguagem.

Agora se a linguagem for solo, alguém vai ter que fazer tudo isso para ela...

Parabéns mais uma vez, vc é o cara!
Unknown disse…
Legal Spock.

Duas ferramentas que me ajudaram a monitorar o GC, em alguns tunings que realizei, foram:

- Introscope, ferramenta da CA: http://www.ca.com/br/products/product.aspx?id=5779
- YourKit, dica do Ricardo Jun na época: http://www.yourkit.com/

Ambas são pagas.

[]s
Eder
Roberto disse…
bom artigo!

e uma dica sobre boas referencias de garbage collector e classloaders são os pdfs em portugues do livro Arquitetura Java... dá pra baixar esses capitulos de graca aqui http://www.arquiteturajava.com.br
Wagner Santos disse…
Muito bom Yoda,, quer dizer Dr. Spock :)
Henrique Lima disse…
Boa Spock.

Legal lembrar também que é possível fazer análise de desempenho do GC através do próprio log obtido através de parâmetros da JVM (JVM da sun, -verbose:gc -Xloggc:gc.log). Com esse log e o gcviewer (http://www.tagtraum.com/gcviewer.html) é possível obter o gráfico do GC desde o start da JVM.

Fica a dica.

Parabéns!
Anônimo disse…
Excelente artigo valew Dr. Spock!!!! =D

Postagens mais visitadas deste blog

TDC ONLINE: SUA PLATAFORMA DE PALESTRAS GRAVADAS DO TDC DISPONÍVEL

Além do conteúdo ao vivo transmitido online nas edições do TDC, agora você pode ter acesso à centenas de palestras gravadas, através da nossa nova plataforma de vídeos - o TDC Online, que reúne todas as Trilhas premium, Stadium e Salas dos Patrocinadores das edições anteriores de 2022, TDC Innovation e TDC Connections.  Para acessar, basta clicar na edição em que você participou ( TDC Innovation ou TDC Connections ); Fazer o mesmo login (com e-mail e senha) cadastrados na hora de adquirir ou resgatar o seu ingresso no TDC; E clicar na Trilha de sua opção, e de acordo com a modalidade do seu ingresso. Logo em seguida, você será direcionado para a seguinte página com a lista de todas as palestras por Trilha: Pronto! Agora você tem acesso à centenas de palestras gravadas da sua área de interesse, para assistir como e quando quiser! Caso tenha esquecido a senha, clique na opção "Esqueci a senha" , insira o e-mail que você realizou para o cadastro no evento, e aparecerá a op

O que é Lógica de programação?

Este é o segundo de uma série de posts voltados aos leitores do blog que estão dando início à carreira de desenvolvimento de software. O assunto de hoje é a lógica de programação. Para ler antes: Entendendo como funciona a programação de computadores: linguagens de programação, lógica, banco de dados A lógica de programação é um pré-requisito para quem quer se tornar um desenvolvedor de software, independente da linguagem de programação que se pretende utilizar. Mas o que é de fato a Lógica de Programação e como saber se eu tenho esse pré-requisito? A lógica de programação nada mais é do que a organização coerente das instruções do programa para que seu objetivo seja alcançado. Para criar essa organização, instruções simples do programa, como mudar o valor de uma variável ou desenhar uma imagem na tela do computador, são interconectadas a estruturas lógicas que guiam o fluxo da execução do programa. Isso é muito próximo ao que usamos em nosso cotidiano para realizar atividad

TDC BUSINESS, chega a São Paulo com novas trilhas de Inteligência Artificial e Inovação

Maior conferência de profissionais de tecnologia do Brasil abordará temas em alta no momento como, por exemplo, Inteligência Artificial, Segurança, Ciência de Dados e Inovação O TDC BUSINESS, a 17° edição do The Developer's Conference na cidade de São Paulo, que acontece entre os dias 19 e 21 de Setembro, reunirá profissionais e especialistas da área para troca de experiência, compartilhamento de conteúdos e networking. Com o tema central: “Tecnologia para negócios transformadores”, o evento será totalmente híbrido, ocorrendo presencialmente no espaço Pro Magno, e com transmissão simultânea e atividades de network pela internet. A expectativa é reunir mais de 14.000 pessoas, somando a participação presencial e online.   Segundo Yara Mascarenhas, Fundadora e Host do Evento, “nosso objetivo com o TDC é inspirar a colaboração entre os profissionais e empresas para construir uma nova realidade para o mercado de TI.  Vamos juntar tecnologia e negócios com as trilhas técnicas, oferecen

Dica rápida: Apagando registros duplicados no MySQL

Ola pessoal, Sei que vocês estão acostumados a ver posts meus sobre tecnologia móvel ou algo relacionado, mas hoje vou falar sobre um pequeno "truque" que usei esse final de semana com o MySQL. Eu estava desenvolvendo o lado servidor de uma nova aplicação mobile (ahh, então "tem a ver" com mobile hehe), e quando fui fazer alguns testes percebi que tinha quase 7 mil registros duplicados (!!!) na minha base de dados! Bom, o meu primeiro reflexo como programador foi pensar em fazer um "programinha" Java para buscar e deletar todos esses registros duplicados. Mas ai, resolvi tirar as teias de aranha dos neurônios e usar os vários anos de experiência que passei com SQL e criar uma query que fizesse esse trabalho todo de uma vez!! E a query ficou assim: delete from TABLE_NAME USING  TABLE_NAME, TABLE_NAME  AS  auxtable WHERE   ( NOT  TABLE_NAME.id  =  auxtable.id ) AND   ( TABLE_NAME.name  =  auxtable.name ) Explicação direta: TABLE_NAME

Devo fazer um curso ou ler um livro?

Acredito que todos os instrutores ou professores, independentemente da área, escola ou centro de treinamento, já devam ter recebido essa pergunta alguma vez na vida: devo fazer um curso ou ler um livro? Para responder a essa pergunta, precisamos avaliar os prós e contras de cada opção. Trabalho com treinamento há algum tempo e, hoje, recebi essa pergunta de um aluno. Não adianta responder a ou b sem argumentar, demonstrando as opções conforme a situação do aluno. O conteúdo, a forma de transmissão e a capacidade de assimilação do indivíduo são chaves para haver benefício maior de aprendizado. Tanto em um bom curso quanto em um bom livro, o conteúdo é a premissa básica . Por conteúdo entendemos: se está organizado; se respeita pré-requisitos; se promove o aprendizado guiado e incremental; se aborda de forma satisfatória os principais pontos; se tem bom balanço entre teoria, exemplos e prática (favorecendo exemplos e prática); se tem como premissa a acessibilidade possível (e cabível) pa

Fazer networking em eventos pode transformar a sua carreira! Saiba como

O networking em eventos é vital ao desenvolvimento da sua carreira para construir relacionamentos de longo prazo, bem como uma boa reputação no mercado . Construir uma forte rede de contatos pode te ajudar a se tornar um nome conhecido no mercado, que influencia e causa impacto na sua área de interesse. Além disso, o networking colabora para: aprendizado contínuo; relacionamentos profissionais duradouros; troca de conhecimento com pessoas renomadas no mercado. O bom networking em eventos tem base de confiança e apoio — e pode significar a diferença entre uma carreira comum e fenomenal. Uma maneira de potencializar o networking, é pelo aprendizado continuado , que permite se especializar na área de atuação e expandir o leque de oportunidades. Neste artigo, reunimos algumas dicas para você saber como tirar o melhor proveito de eventos e fortalecer sua carreira. Aproveite a leitura! O que é networking? Networking é sobre construir relacionamentos profissionais de longo prazo, que sejam