Het repliceren van resultaten van pd.merge in SQL?

stemmen
0

Ik heb met een aantal datasets lokaal in Python gespeeld en probeer nu dezelfde resultaten in een cloudomgeving met SQL te repliceren

Ik heb 3 tabellen, elk met meerdere dubbele ID's. Bijvoorbeeld, tabel A bevat ID'sa, b, c, d, ..., tabel B bevat ID'a, c, e, a1, a2 ...s en tabel C bevat ID's d, f, a2, b1, b2, ...

Ik doe pd.mergemomenteel voor tabel A en tabel B op ID a, en tabel C met de resulterende tabel uit de eerste samenvoeging op ID a2. Bij het gebruik van pd.merge, merkte ik dat het zou een _xof a _ytoe te voegen aan de dubbele ID's (door dat, ik bedoel in de eerste pd.mergevan tabel A en tabel B, cuit tabel A zou worden c_x, en cuit tabel B zou worden c_yen zo verder voor alle andere dubbele ID's . Hetzelfde zou gelden voor alle andere duplicaat-ID's voor eventuele samenvoegingen

Hoe zou ik in staat zijn om dit proces te repliceren en het probleem te omzeilen met dubbele ID's in SQL?

De vraag is gesteld op 26/05/2020 om 03:30
bron van user
In andere talen...                            


1 antwoorden

stemmen
0

Ik denk dat je in de join de rest van de joined columns kunt hernoemen met nieuwe namen:

SELECT table_A.ID_a, table_A.c_ID as c_ID_from_A, table_B.c_ID as c_ID_from_B
FROM table_A
JOIN table_B ON(table_A.ID_a = table_B.ID_a)

Ik hoop dat je het nuttig vindt.

antwoordde op 10/06/2020 om 15:51
bron van user

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more