Método de filtrado de DataFrame en Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos cómo utilizar el método filter() en un DataFrame de Pandas. El método filter() nos permite seleccionar un subconjunto de filas o columnas de un DataFrame basado en etiquetas de índice especificadas. Es importante tener en cuenta que este método filtra el DataFrame en función de las etiquetas del índice, no del contenido del DataFrame.

Consejos para la MV

Después de que la máquina virtual (MV) haya terminado de iniciar, haz clic en la esquina superior izquierda para cambiar a la pestaña Notebook y acceder a Jupyter Notebook para practicar.

A veces, es posible que debas esperar unos segundos para que Jupyter Notebook termine de cargar. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si encuentras problemas durante el aprendizaje, no dudes en preguntar a Labby. Proporciona comentarios después de la sesión y resolveremos rápidamente el problema para ti.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/AdvancedTopicsGroup(["Advanced Topics"]) python(("Python")) -.-> python/DataStructuresGroup(["Data Structures"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/DataSelectionGroup(["Data Selection"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) pandas/DataSelectionGroup -.-> pandas/select_columns("Select Columns") pandas/DataSelectionGroup -.-> pandas/select_rows("Select Rows") pandas/DataSelectionGroup -.-> pandas/slicing("Slicing") python/DataStructuresGroup -.-> python/lists("Lists") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") python/AdvancedTopicsGroup -.-> python/regular_expressions("Regular Expressions") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/PythonStandardLibraryGroup -.-> python/data_serialization("Data Serialization") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/select_columns -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} pandas/select_rows -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} pandas/slicing -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} python/lists -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} python/using_packages -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} python/regular_expressions -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} python/data_collections -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} python/data_serialization -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} python/data_analysis -.-> lab-68622{{"Método de filtrado de DataFrame en Pandas"}} end

Crear un DataFrame

Primero, creemos un DataFrame de muestra con el que trabajar.

#import pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({
    "Name":["Navya","Vindya","Sinchana","Amrutha","Akshatha"],
    "Age":[25,24,25,25,26],
    "Education":["M.Tech","M.Tech","M.Tech","Ph.d","Ph.d"],
    "YOP":[2019,2020,2018,None,None]},
    index=["Group_1", "Group_1","Group_1","Group_2","Group_2"])

#printing DataFrame
print("-------DataFrame is----------")
print(df)

Filtrar por nombres de columnas utilizando el método filter()

Podemos utilizar el parámetro items del método filter() para filtrar el DataFrame por ciertas columnas.

#filter by column names
filtered_df = df.filter(items=["Name","Education"])

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Filtrar por nombres de filas utilizando el método filter()

Podemos utilizar el parámetro like del método filter() para filtrar el DataFrame por ciertas filas.

#filter by row names
filtered_df = df.filter(like='Group_2', axis=0)

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Filtrar por nombres de columnas con el parámetro regex

Podemos utilizar el parámetro regex del método filter() para filtrar el DataFrame por ciertas columnas basado en una expresión regular.

#filter by column names with regex
filtered_df = df.filter(regex ='[g]')

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

Resumen

En este laboratorio, aprendimos cómo utilizar el método filter() en el DataFrame de Pandas. Cubrimos cómo filtrar el DataFrame por nombres de columnas y nombres de filas, así como cómo filtrar basado en una expresión regular. Este método es útil para obtener un subconjunto del DataFrame basado en etiquetas de índice específicas.