Uso do Cluster IBM-Ubuntu
Este guia contém informações básicas para o uso do Cluster IBM-Ubuntu.
Máquina de Login(xcat02
): Node para efetuar login e submeter jobs
Máquina de Processamento(idpx01,idpx02
): Nodes de execução dos jobs.
Acesso de dentro da FT:
Conexão ao sistema IBM:
$ ssh usuario@143.106.243.188
Acesso de fora da FT
Para acesso de fora da FT primeiro é necessário se conectar em lascado.ft.unicamp.br
.
$ ssh usuario@lascado.ft.unicamp.br
Após conectado ao lascado
, conectar normalmente ao cluster IBM.
O cluster IBM-Ubuntu utiliza o software HTCondor
para submissão de jobs.
Um exemplo de arquivo de submissão pode ser visto abaixo: ::
Executable = /home/bruno/teste1/a.out
Log = reg.log
Output = saida.out
request_cpus = 2
initialdir = dir1
arguments = 2 3
Queue
initialdir = dir2
arguments = 4 4
Queue
onde:
Executable
é o caminho do programa que será executado pelo Condor.
Log
registrará os passos para a execução do job.
Output
é o arquivo que conterá os resultados da execução.
Em request_cpus
é informado a quantidade desejada para a execução.
Agora temos as variáveis responsáveis por separar a execução do programa em duas pastas, nesse exemplo o programa recebe dois argumentos passados pela variável arguments, e o resultado da execução é salvo no diretório passado pela variável initialdir. O diretório é preciso ter sido criado antes da execução. Queue é o comando que inicia a execução
initialdir = dir1
arguments = 2 3
Queue
Comando úteis
condor_submit arquivo-submissao
: Submete um job para execução
condor_q
: Exibe os jobs em execução
condor_status
: Mostra os status dos nodes
condor_rm num-job
: Remove job