Die Klärung der Bedeutung von „Belastungen“ mit Sklearn

stimmen
1

Ich habe über PCA in sklearn Lesen, speziell die Beziehungen zwischen Funktionen und Komponenten. Ich bin besonders daran interessiert, auf ein paar Hauptkomponenten hinsichtlich Funktion Bedeutung zu identifizieren. Allerdings fand ich ein paar Beiträge, die verschiedene Dinge sagen.

Zum Beispiel in den 3 Antworten in diesem Beitrag sind Eigenvektoren und Belastungen diskutiert. Insbesondere ist es erwähnt , dass pca.components_.T * np.sqrt(pca.explained_variance_)die Komponentenladungen der Funktionen zeigt. Warum wird sqrthier verwendet?

Doch in dieser Antwort wird angezeigt , dass abs(pca.components_)Sie die Funktion Bedeutung in jeder Komponente gibt. Dies scheint zu widersprechen , was oben angegeben ist, nicht wahr?

Außerdem vermisse ich zu verstehen , wie diese beantwortet die Frage: I think what you call the loadings is the result of the projection for each sample into the vector space spanned by the components. Those can be obtained by calling pca.transform(X_train) after calling pca.fit(X_train).Aber das ist nicht korrekt: Belastungen beziehen sich auf die Koeffizienten jedes Merkmal auf den Hauptkomponenten, und nicht die Proben. Zustimmen?

Wäre wirklich eine Klarstellung in hier zu schätzen wissen.

Veröffentlicht am 09/10/2019 um 18:57
quelle vom benutzer
In anderen Sprachen...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more