Question: Usando Python - Ahora usamos boosting y random forest para predecir Salary en el conjunto de datos Hitters. (a) Elimina las observaciones para las cuales

Usando Python - Ahora usamos boosting y random forest para predecir Salary en el conjunto de datos Hitters. (a) Elimina las observaciones para las cuales la informacin salarial es desconocida, y luego transforma logartmicamente los salarios. (b) Usa AtBat, Hits, Years, Runs como predictores y log-salary como respuesta. Divide los datos en el conjunto de datos de entrenamiento y prueba usando la funcin de divisin de prueba de entrenamiento, con 200 muestras en el conjunto de entrenamiento. Usa random state=24 en la funcin. (c) Realiza boosting en el conjunto de entrenamiento con 1,000 rboles para un rango de valores del parmetro de contraccin = [0.001, 0.002, 0.005, 0.01, 0.02, 0.05]. Produce un grfico con diferentes valores de contraccin en el eje x y el MSE del conjunto de entrenamiento y el MSE del conjunto de prueba correspondientes en el eje y. Sea random state=24. (d) Qu parmetro de contraccin admite el mejor MSE de prueba? Cul es el MSE de prueba correspondiente? (e) Realice el bosque aleatorio en el conjunto de entrenamiento con 1000 rboles para un rango de valores del alfa ccp = [0,01, 0,02, 0,03, 0,04, 0,05, 0,06, 0,07] Produzca un grfico con diferentes valores de alfa ccp en el eje x y el MSE del conjunto de entrenamiento y el MSE del conjunto de prueba correspondientes en el eje y. Sea estado aleatorio = 24. (f) Qu alfa ccp admite el mejor MSE de prueba? Cul es el MSE de prueba correspondiente? (g) Cul es el MSE de prueba para usar regresin lineal?

Step by Step Solution

There are 3 Steps involved in it

1 Expert Approved Answer
Step: 1 Unlock blur-text-image
Question Has Been Solved by an Expert!

Get step-by-step solutions from verified subject matter experts

Step: 2 Unlock
Step: 3 Unlock

Students Have Also Explored These Related General Management Questions!