Effizientes groupby des Datensatzes während zusätzliche Spalten Halte

stimmen
0

Ich habe eine große Datenmenge ‚df‘ und ich versuche einfach einen Wert ‚A‘ bis GROUPBY, Summe eines anderen ‚B‘ und dann behalten die restlichen Spalten ‚C‘ - ‚Z‘ (sie werden bereitgestellt, um die ‚A‘ identisch sein ist das gleiche ich zur Zeit tue.:

df = df.groupby(['A',
                 'C',
                 'D',
                 ...
                 'Z'])['B'].sum()

Dies ist jedoch nimmt eine lange Zeit auszuführen. Gibt es eine effizientere Art und Weise, dies zu tun?

Vielen Dank

Veröffentlicht am 09/10/2019 um 18:53
quelle vom benutzer
In anderen Sprachen...                            


1 antworten

stimmen
0

Dies ist wahrscheinlich ein Fall, wo eine Datenbank würde sich als nützlich.

Legen Sie die Daten in eine Tabelle

Dann einfach SELECT A, SUM(B), C GROUP BY A

Eine Datenbank wird viel schneller durchführen Aggregatfunktionen als Python sein, besonders bei großen Datensätzen.

Beantwortet am 09/10/2019 um 19:09
quelle vom benutzer

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more