Primeiro, importamos LabelEncoder da biblioteca sklearn.preprocessing. O LabelEncoder é usado para converter valores categóricos em valores numéricos.
Criamos um objeto LabelEncoder chamado codificador_profissao. Em seguida, aplicamos fit_transform() na coluna "profissao" da tabela, convertendo as profissões em números (por exemplo, cientista = 1, bombeiro = 2, etc.).
Criamos um novo LabelEncoder, codificador_credito, e aplicamos fit_transform() na coluna "mix_credito", convertendo seus valores categóricos em números.
Criamos outro LabelEncoder, codificador_pagamento, e aplicamos fit_transform() na coluna "comportamento_pagamento", transformando os valores categóricos dessa coluna em valores numéricos.
Por fim, usamos display(tabela.info()) para verificar a estrutura da tabela, conferindo os tipos de dados e se as colunas foram corretamente convertidas.
Pegamos a coluna "score_credito" da tabela e armazenamos em y. Essa será a variável que queremos prever no modelo.
Criamos x removendo as colunas "score_credito" (que é nosso alvo) e "id_cliente" (pois geralmente um ID não ajuda na previsão). O restante das colunas será usado como entrada para o modelo.
Importamos train_test_split da biblioteca sklearn.model_selection. Depois, usamos train_test_split() para dividir os dados em duas partes:
Importamos dois algoritmos de machine learning do sklearn:
Criamos dois modelos de IA:
Depois de treinar os modelos, usamos predict() para fazer previsões nos dados de teste:
Importamos accuracy_score da biblioteca sklearn.metrics, que mede a precisão do modelo comparando os valores reais (y_teste) com as previsões feitas pelos modelos.
Como os modelos foram treinados com valores numéricos, precisamos transformar os dados categóricos da nova tabela da mesma forma que fizemos antes:
Usamos display(tabela_novos_clientes) para visualizar a nova tabela e conferir se os dados foram corretamente transformados.
nova_previsao = modelo_arvoredecisao.predict(tabela_novos_clientes): Utilizamos o modelo de árvore de decisão para prever o score de crédito dos novos clientes.