Replizieren von Ergebnissen aus pd.merge in SQL?

stimmen
0

Ich habe mit einigen Datensätzen lokal in Python herumgespielt und versuche nun, die gleichen Ergebnisse in einer Cloud-Umgebung mit SQL zu replizieren

Ich habe 3 Tabellen, jede mit mehreren doppelten IDs. Zum Beispiel enthält Tabelle A IDsa, b, c, d, ..., Tabelle B enthält IDs a, c, e, a1, a2 ...und Tabelle C enthält IDs d, f, a2, b1, b2, ...

Das tue ich derzeit pd.mergefür Tabelle A und Tabelle B zur ID aund Tabelle C mit der Tabelle, die sich aus der ersten Zusammenführung zur ID ergibta2. Bei der Verwendung von pd.merge ist mir aufgefallen, dass es a _xoder a _yzu den doppelten IDs hinzufügen würde (damit meine ich in der ersten pd.mergevon Tabelle A und Tabelle B, caus Tabelle A würde c_x, und caus Tabelle B würde , c_yund so weiter für alle anderen doppelten IDs werden. Dasselbe würde für alle anderen doppelten IDs für alle Joins gelten

Wie wäre ich in der Lage, diesen Prozess zu replizieren und das Problem mit doppelten IDs in SQL zu umgehen?

Veröffentlicht am 26/05/2020 um 03:30
quelle vom benutzer
In anderen Sprachen...                            


1 antworten

stimmen
0

Ich denke, Sie können in der Verknüpfung die restlichen verbundenen Spalten mit neuen Namen umbenennen:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Ich hoffe, Sie finden es nützlich.

Beantwortet am 10/06/2020 um 15:51
quelle vom benutzer

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more