Het repliceren van resultaten van pd.merge in SQL?

stemmen
18

Ik heb met een aantal datasets lokaal in Python gespeeld en probeer nu dezelfde resultaten in een cloudomgeving met SQL te repliceren

Ik heb 3 tabellen, elk met meerdere dubbele ID's. Bijvoorbeeld, tabel A bevat ID'sa, b, c, d, ..., tabel B bevat ID'a, c, e, a1, a2 ...s en tabel C bevat ID's d, f, a2, b1, b2, ...

Ik doe pd.mergemomenteel voor tabel A en tabel B op ID a, en tabel C met de resulterende tabel uit de eerste samenvoeging op ID a2. Bij het gebruik van pd.merge, merkte ik dat het zou een _xof a _ytoe te voegen aan de dubbele ID's (door dat, ik bedoel in de eerste pd.mergevan tabel A en tabel B, cuit tabel A zou worden c_x, en cuit tabel B zou worden c_yen zo verder voor alle andere dubbele ID's . Hetzelfde zou gelden voor alle andere duplicaat-ID's voor eventuele samenvoegingen

Hoe zou ik in staat zijn om dit proces te repliceren en het probleem te omzeilen met dubbele ID's in SQL?

De vraag is gesteld op 26/05/2020 om 03:30
bron van user
In andere talen...                            


1 antwoorden

stemmen
0

Ik denk dat je in de join de rest van de joined columns kunt hernoemen met nieuwe namen:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Ik hoop dat je het nuttig vindt.

antwoordde op 10/06/2020 om 15:51
bron van user

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more