Pandas

pandas és una biblioteca de Python on es defineixen estructures de dades per emmagatzemar dades etiquetades i facilitar-ne les consultes. Per exemple:

  • Dades de diversos tipus tabulades en columnes, com en taules relacionals o fulls de càlcul.

  • Sèries temporals.

  • Qualssevol dades matricials amb etiquetes tant per les files com per les columnes.

  • Dades obtingudes d’observacions o conjunts de dades estadístiques.

Les estructures de dades que defineix pandas es caracteritzen pel següent:

  • Faciliten la gestió de dades desconegudes.

  • Són mutables, es poden afegir i esborrar files i columnes.

  • Alineen automàticament les dades basant-se en etiquetes.

  • Permeten agrupar dades.

  • Admeten indexació per les etiquetes.

  • Disposen d’operacions de fusió, canvi de forma i pivotatge.

  • Les etiquetes poden ser jeràrquiques.

  • Disposen d’operacions específiques per a sèries temporals.

A més, pandas permet carregar dades a partir de diversos formats de fitxer, com ara CSV, bases de dades o HDF5.

Conceptes

Referències

De la documentació de pandas destaquem:

Altres fonts:

Material

Exercicis