Nesta página, você aprenderá a executar um aplicativo de treinamento Keras do TensorFlow na Vertex AI. Esse modelo particular treina um modelo de classificação de imagem que classifica flores por tipo.
Este tutorial tem várias páginas:Como treinar um modelo personalizado de classificação de imagens.
Como exibir previsões de um modelo de classificação de imagens personalizado
Cada página pressupõe que você já tenha realizado as instruções das páginas anteriores do tutorial.
O restante deste documento pressupõe que você está usando o mesmo ambiente do Cloud Shell criado ao seguir a primeira página deste tutorial. Se a sessão original do Cloud Shell não estiver mais aberta, será possível retornar ao ambiente fazendo o seguinte:-
In the Google Cloud console, activate Cloud Shell.
-
Na sessão do Cloud Shell, execute o seguinte comando:
cd hello-custom-sample
Execute um pipeline de treinamento personalizado
Nesta seção, descrevemos como usar o pacote de treinamento que você enviou ao Cloud Storage para executar um pipeline de treinamento personalizado da Vertex AI.
No Console do Google Cloud, na seção "Vertex AI", acesse a página Pipelines de treinamento.
Clique em
Criar para abrir o painel Treinar novo modelo.Na etapa Escolher método de treinamento, faça o seguinte:
Na lista suspensa Conjunto de dados, selecione Nenhum conjunto de dados gerenciado. Esse aplicativo de treinamento específico carrega dados da biblioteca TensorFlow Datasets, em vez de um conjunto de dados gerenciado da Vertex AI.
Verifique se a opção Treinamento personalizado (avançado) está selecionada.
Clique em Continuar.
Na etapa Detalhes do modelo, no campo Nome, insira
hello_custom
. Clique em Continuar.Na etapa Configurações do contêiner, forneça à Vertex AI as informações necessárias para usar o pacote de treinamento que você enviou ao Cloud Storage:
Selecione Contêiner pré-criado.
Na lista suspensa Framework do modelo, selecione TensorFlow.
Na lista suspensa Versão do framework do modelo, selecione 2.3.
No campo Localização do pacote, insira
cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz
.No campo módulo Python, insira
trainer.task
.trainer
é o nome do pacote Python no tarball, etask.py
contém o código de treinamento. Portanto,trainer.task
é o nome do módulo que você quer que a Vertex AI execute.No campo Diretório de saída do modelo, clique em Procurar. Faça o seguinte no painel Selecionar pasta:
Navegue até o bucket do Cloud Storage.
Clique em Criar nova pasta
.Nomeie a nova pasta como
output
. Clique em Criar.Clique em Selecionar.
Confirme se o campo tem o valor
gs://BUCKET_NAME/output
, em que BUCKET_NAME é o nome do bucket do Cloud Storage.Esse valor é transmitido à Vertex AI no campo da API
baseOutputDirectory
, que define diversas variáveis de ambiente que o aplicativo de treinamento acessa quando é executado.Por exemplo, quando você define esse campo como
gs://BUCKET_NAME/output
, a Vertex AI define a variável de ambienteAIP_MODEL_DIR
comogs://BUCKET_NAME/output/model
. No final do treinamento, a Vertex AI usa todos os artefatos no diretórioAIP_MODEL_DIR
ara criar um recurso de modelo.Saiba mais sobre as variáveis de ambiente definidas por este campo.
Clique em Continuar.
Na etapa opcional Hiperparâmetros, verifique se a caixa de seleção Ativar ajuste de hiperparâmetros está desmarcada. Este tutorial não usa o ajuste de hiperparâmetro. Clique em Continuar.
Na etapa Computação e preços, aloque recursos para o job de treinamento personalizado:
Na lista suspensa Região, selecione us-central1 (Iowa).
Na lista suspensa Tipo de máquina, selecione n1-standard-4 na seção Padrão.
Não adicione aceleradores ou pools de workers para este tutorial. Clique em Continue.
Na etapa Contêiner de previsão, forneça à Vertex AI informações necessárias para exibir predições:
Selecione Contêiner pré-criado.
Na seção Configurações de contêiner pré-criado, faça o seguinte:
Na lista suspensa Framework do modelo, selecione TensorFlow.
Na lista suspensa Versão do framework do modelo, selecione 2.3.
Na lista suspensa Tipo de acelerador, selecione Nenhum.
Confirme se o campo Diretório do modelo tem o valor
gs://BUCKET_NAME/output
, em que BUCKET_NAME é o nome do bucket do Cloud Storage. Isso corresponde ao valor do diretório de saída do modelo fornecido em uma etapa anterior.
Deixe os campos na seção Schemata de previsão em branco.
Clique em Iniciar treinamento.
Agora é possível visualizar o novo pipeline de treinamento, chamado hello_custom
,
na página Treinamento. Talvez seja necessário atualizar a página. Esse pipeline
de treinamento executa, principalmente, as seguintes tarefas:
Ele cria um recurso de job personalizado chamado
hello_custom-custom-job
. Depois de alguns instantes, será possível visualizar esse recurso na página Jobs personalizados da seção Treinamento:O job personalizado executa o aplicativo de treinamento usando os recursos de computação especificados nesta seção.
Após a conclusão do job personalizado, o pipeline de treinamento encontrará os artefatos criados pelo aplicativo de treinamento no diretório
output/model/
do bucket do Cloud Storage. Ele usa esses artefatos para criar um recurso de modelo.
Monitorar o treinamento
Para visualizar os logs de treinamento faça o seguinte:
No console do Google Cloud, na seção "Vertex AI", acesse a página Jobs personalizados.
Para visualizar os detalhes do
CustomJob
que você acabou de criar, clique emhello_custom-custom-job
na lista.Na página de detalhes do job, clique em Visualizar registros.
Ver o modelo treinado
Quando o pipeline de treinamento personalizado for concluído, será possível encontrar o modelo treinado no Console do Google Cloud, na seção "Vertex AI", na página Modelos.
O modelo tem o nome hello_custom
.
A seguir
Siga a próxima página deste tutorial para exibir previsões no seu modelo treinado de ML.