Holdout werkwijze python

stemmen
0

Hoe dat te doen 6: 4 holdout in python? Ik probeerde de volgende code:

X_train, X_test, y_train, y_test =  train_test_split(X,y, training_size=0.6, test_size=0.4)

Maar niet zeker of het juist is of niet.

De vraag is gesteld op 09/10/2019 om 12:55
bron van user
In andere talen...                            


1 antwoorden

stemmen
2

Raadpleeg de documentatie voor train_test_splituit scikit-leren.

Om zowel de omvang van de opleiding en de test set die u nodig heeft om voorbij te stellen train_size(niet training_sizezoals in de code) en test_size.

Om gebruik te maken van 60% van uw gegevens voor training en 40% voor het testen kunt u dit gebruiken:

import numpy as np
from sklearn.model_selection import train_test_split

X = np.random.rand(100, 2)
y = range(100)

X_train, X_test, y_train, y_test = train_test_split(X, y, train_size=0.6, test_size=0.4)

U kan bevestigen dat voor de 100 datapunten gebruikt in dit voorbeeld een trein set grootte van 60 en een test set grootte van 40 te krijgen:

print(len(X_train), len(X_test))
print(len(y_train), len(y_test))
> 60 40
> 60 40
antwoordde op 09/10/2019 om 13:53
bron van user

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more