Bästa svaret
Pandas är ett bibliotek i Python skapat av Wes McKinny.
Data wrangling betyder helt enkelt att massera dina data till ett tillstånd som maskininlärningsmodeller accepterar.
Det tillståndet är en matris eller matrisliknande struktur. Tänk på ett Excel-kalkylblad om du är ny. Om dina data inte är strukturerade kan modellen inte … ja … modellera den.
Du kan krossa dina data i SQL. Många gör det, men Pandas använder en struktur som kallas en dataram som sitter på en NumPy-array och den är mycket mer prestanda än någon SQL-fråga. Tja, nästan … Jag lämnar BigQuery utanför ekvationen för tillfället.
Varför Pandas. Eftersom det är fantastiskt, är det enkelt att använda, för att du kan krossa och modellera direkt i en Jupyter Notebook … listan fortsätter.
Varför Python? Massor av skäl men vid denna tidpunkt spelar varför ingen roll för de flesta av oss. Du lär dig Python eller begränsar dina karriärmöjligheter kraftigt.
Om du är intresserad av att kämpa, kolla in min kurs här:
Data Wrangling with Pandas for Machine Learning Engineers
PS – Tack för att du länkar till mitt inlägg. 🙂
Svar
ANVÄNDNING AV PANDAS: 10 Mind Blowing Tips du inte vet (Python).
Vad är det för användning av pandor i Python?
Dessa tips ovan lärs ut i min video och de svarar på olika frågor som är användningen av pandas python i datavetenskap.
Denna ANVÄNDNING AV PANDAS Python-handledning hjälper dig att lära dig följande tips:
1. Ladda och spara data
Detta är ANVÄNDNING AV PANDAS nummer ett, du kommer att lära dig hur man laddar data på jupyter-anteckningsboken för att spara dem i csv-format.
Detta tips nummer ett i ANVÄNDNINGEN PANDAS handledning svarar nedan frågor. Fråga det svarar:
Hur kan jag ladda min dataset på jupyter?
Hur kan jag spara min dataset?
2. Kolumninsättning och radering
Så här infogar du en ny kolumn i den befintliga datasetet och hur man tar bort det.
Detta tips nummer två i ANVÄNDNINGEN AV PANDAS handledning svarar på frågorna nedan.
Frågor som det svarar på:
Hur tar jag bort en kolumn i pandor?
Hur lägger jag till en ny kolumn i min redan befintliga CSV-fil med Pandas?
3. Dataval
Det här handlar om hur man väljer eller filtrerar specifikt antal rader och kolumner.
Detta tips nummer tre i ANVÄNDNINGEN AV PANDAS handledning svarar på frågan nedan.
Frågan svarar: Hur skriver jag ut de första 10 raderna och tio kolumnerna i Python (Pandas)?
4. Kolumn och radbyte namn
Det lär dig hur du kan byta namn på kolumn och rad i Pandas som är bland ANVÄNDNINGAR AV PANDAS.
Detta tips nummer fyra i ANVÄNDNINGEN AV PANDAS handledning svar på frågorna nedan.
Frågor som det svarar på:
Hur kan jag byta namn på kolumn i pandor?
Hur kan jag byta namn på mina rader i python-datavetenskap?
5. Radradering
Du kommer att lära dig att ta bort en viss rad i datasetet.
Detta tips nummer fem i PANDAS-bruksanvisningen svarar på frågan nedan.
Fråga svarar:
Hur ska jag radera rader från en DataFrame i Python-Pandas?
6. Datasortering
Detta tips visar hur man sorterar data i stigande och fallande ordning i PANDAS python.
Detta tips nummer sex i PANDAS-handledningens ANVÄNDNING svarar på frågorna nedan.
Frågor som det svarar på:
Hur sorterar jag data i stigande ordning i pandor?
Hur kan jag sortera min DataFrame i fallande ordning i pythondatavetenskap?
7. Hantering av saknade värden
Hur kan du lösa problemet med saknade värden? Om du vet att ANVÄNDNING AV PANDAS är python det bästa sättet att hantera det.
Detta tips nummer sju i ANVÄNDNINGEN AV PANDAS handledning svarar på frågan nedan.
Fråga det svarar:
Hur byter jag ut alla tomma / tomma celler i en pandas dataram med NaN ?.
8. Hantering av duplicerade data
Hur kan du lösa problemet med duplicerade värden? Om du vet att ANVÄNDNINGAR AV PANDAS är python det bästa sättet att hantera det.
Detta tips nummer åtta i ANVÄNDNINGEN PANDAS handledning svarar på frågan nedan.
Fråga svarar:
Hur kan jag hitta och ta bort dubblerade rader i pandor?.
9. Data Exploration
Det bästa sättet för datavetare att förstå mycket bättre dataset är att utforska dem för att känna till dataens egenskaper.
Detta tips nummer nio i ANVÄNDNINGEN AV PANDAS handledning svar nedan fråga.
Fråga det svarar:
Vilket sätt kan ge mig full förståelse för min dataset i pandor?
10. Datavisualisering
Ibland blir det att jämföra två kolumner såvida du inte plottar dem på ett enkelt och bra visuellt sätt, detta
tips nummer tio i ANVÄNDNINGEN AV PANDAS lär dig att .
Detta tips nummer åtta i ANVÄNDNINGEN AV PANDAS handledning svarar på frågan nedan.
Fråga det svarar:
Hur jämför jag olika kolumner på ett enkelt visuellt sätt?
Min video går in i mycket detaljer om det tipset, det heter ANVÄNDNING AV PANDAS: 10 Mind Blowing Tips du inte vet (Python).
Kolla in alla tio tips och läs videobeskrivningen.
Följ mig på Instagram: motech tz