Загрузка страницы

🧐 + 🐼 ¿Cómo hacer búsquedas aproximadas en strings? | Similtudes | Fuzzy matching | Pandas | Python

🙏¡Muchas gracias por vernos! 💡Suscríbete a nuestro canal aquí: https://bit.ly/subcctmexico
👍 🤗 ¡Te agradecemos mucho tu like, si el vídeo te fue de utilidad!
¿Necesitas hacer búsquedas aproximadas…o corregir los valores que son capturados de forma diferente? Aquí te mostramos cómo hacerlo con el módulo de difflib, ya verás que se hace ¡Rapidísimo! Y con muy poquitas líneas de código..te vas ahorrar muchos dolores de cabeza, tratando de corregir uno por uno los valores que han sido capturados de forma incorrecta.
👋Esperamos que este vídeo te sea de utilidad, no olvides dejarnos en que utilizarás o cómo aplicarás las funciones de este vídeo, nos dará mucho gusto saludarte.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
🤗 Checa la sección de comunidad de nuestro canal:
https://www.youtube.com/channel/UCvJpU1VFBMX3rPdCYt10QZw/community
💻 Programa Python en línea, sin instalar software con Google
https://colab.research.google.com
💻 Línea para instalar el módulo de Levenshtein:
pip install python-Levenshtein

💻 Dataframes para copiar y pegar
url = 'https://docs.google.com/spreadsheets/d/e/2PACX-1vRXzBvAathvBsUOBXj1z1WobyEm4Ug25qYO-ZmRTHtqWDMRwflI0BtquusO_1tYCV_3W_0mpBLVBHBF/pub?output=csv'
df = pd.read_csv(url)
urla = 'https://docs.google.com/spreadsheets/d/e/2PACX-1vRXzBvAathvBsUOBXj1z1WobyEm4Ug25qYO-ZmRTHtqWDMRwflI0BtquusO_1tYCV_3W_0mpBLVBHBF/pub?gid=182387140&single=true&output=csv'
dfa = pd.read_csv(urla)
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
🔗 Links que mencionamos en el vídeo:
Distancia de Levenshtein:
https://www.analyticsvidhya.com/blog/2021/02/a-simple-guide-to-metrics-for-calculating-string-similarity/#:~:text=Levenshtein%20distance%20is%20the%20most,transform%20one%20string%20to%20another
Documentación oficial de difflib:
https://docs.python.org/3/library/difflib.html#
Pregunta de stackoverflow:
https://stackoverflow.com/questions/28232646/whats-the-use-of-cutoff-argument-in-difflib-get-close-matches-example-in-python#:~:text=About%20the%20%22cutoff%22.,going%20down%20it's%20more%20relax.

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
🐍+🐼 Revisa las versiones de Python y Pandas con las siguientes líneas:
!python --version
import pandas as pd
Pd.__version__
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
⏰ Por si tienes prisa, aquí te dejamos el minuto a minuto del vídeo:
00:00 Introducción: Distancia de Levenshtein y Similaridad (Jaro y Gestalt)
01:43 Cálculo de la distancia de Levenshtein
06:02 Difflib: Las palabras más cercanas (Similares)
08:20 Difflib: Búsquedas aproximadas con Pandas
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
🎞️ Vídeos que mencionamos o algunos que te pueden ser de utilidad:
Ciclos for de un renglón (Comprensión de listas):
https://youtu.be/lAKQouvVOPg
https://youtu.be/pUEiXqhexSM
Filtros con texto
https://youtu.be/s47egWgFZG4
Tablas pivote, exportar a Excel
https://youtu.be/s2V1xfzdKO8
🦈 Estadísticas básicas | Datos del Tiburón de 7 branquias
https://youtu.be/-uNouxUyUCE
Buscar valores en un dataframe, a partir de datos de otro dataframe (isin)
https://www.youtube.com/watch?v=vlsR11mQXm4
VideoTK de pandas vol. 1: https://youtu.be/EmxClt7Ir9k
VideoTK de pandas vol. 2: https://youtu.be/rOkHjUyED_I
Leer archivos desde GitHub: https://youtu.be/svySL_g3XhQ
Cómo resolver errores en Python: https://youtu.be/X46F2-OxxqY
Lista de reproducción de vídeos sobre el agente infeccioso:
https://www.youtube.com/watch?v=QJpE90cEaP0&list=PLgHCrivozIb0JBikrXF7On25gucMiPTd7
Comprensión de listas en Pandas: https://www.youtube.com/watch?v=lAKQouvVOPg
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
😉 Nuestro blog:
http://cctmexico.blogspot.mx/p/python.html
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
🤓Otros vídeos que pueden ser de utilidad:
✔Lista de reproducción de Machine Learning
https://www.youtube.com/watch?v=-qYljhR4hsc&list=PLgHCr
ivozIb2NBVVL0Scs_nIGRUb9dW5U
✔Lista de reproducción de Pandas
https://www.youtube.com/playlist?list=PLgHCrivozIb0ULMKfJVV-rFdRG2OeEgfq
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
📷Imagen de fondo en el Thumbnail:
Imagen de mohamed Hassan en Pixabay
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
🌐 Hashtags
#Pandas #Python #PandasenEspañol

Видео 🧐 + 🐼 ¿Cómo hacer búsquedas aproximadas en strings? | Similtudes | Fuzzy matching | Pandas | Python канала cctmexico
Показать
Комментарии отсутствуют
Введите заголовок:

Введите адрес ссылки:

Введите адрес видео с YouTube:

Зарегистрируйтесь или войдите с
Информация о видео
29 августа 2022 г. 3:49:20
00:16:47
Другие видео канала
⚛️ ¿Qué tienen que ver los electrones con la Tabla periódica de los elementos? | Muy básico⚛️ ¿Qué tienen que ver los electrones con la Tabla periódica de los elementos? | Muy básico🐼 ¿Cómo tomar una muestra de un dataframe (O una sola columna)? | sample |Pandas | Python🐼 ¿Cómo tomar una muestra de un dataframe (O una sola columna)? | sample |Pandas | Python🤔 ¿Cómo hacer una derivada en Symbolab? |⏰ En menos de 60 segundos | Shorts🤔 ¿Cómo hacer una derivada en Symbolab? |⏰ En menos de 60 segundos | Shorts📐Ley de senos: Caso ambiguo con dos ángulos y dos lados | Ley de cosenos, con fórmula general📐Ley de senos: Caso ambiguo con dos ángulos y dos lados | Ley de cosenos, con fórmula general🤓 Series de Fourier para funciones escalón (Impares) | ¡Con atajos! | Ecuaciones Diferenciales🤓 Series de Fourier para funciones escalón (Impares) | ¡Con atajos! | Ecuaciones Diferenciales🙃 ¿Cómo hacer gráficas en una celda? | Hojas de cálculo de Google | Sparkline | ¡Muy fácil!🙃 ¿Cómo hacer gráficas en una celda? | Hojas de cálculo de Google | Sparkline | ¡Muy fácil!🕵️ + 🐼 Búsquedas con varios rangos de fechas | Múltiples condiciones | Con y sin set_index🕵️ + 🐼 Búsquedas con varios rangos de fechas | Múltiples condiciones | Con y sin set_index🛰️+👨‍🚀 + 🌅 ¿Cuántos amaneceres ve la Estación Espacial Internacional? | Conversiones de unidades🛰️+👨‍🚀 + 🌅 ¿Cuántos amaneceres ve la Estación Espacial Internacional? | Conversiones de unidades💡+🐼 ¿Cómo resolver el error is ambiguous en un dataframe de Pandas? | Evaluar condiciones| Python💡+🐼 ¿Cómo resolver el error is ambiguous en un dataframe de Pandas? | Evaluar condiciones| Python🐼 Formato condicional de tablas | Strings, Valores, Fechas | ¡Muy básico! | Plotly | Pandas | Python🐼 Formato condicional de tablas | Strings, Valores, Fechas | ¡Muy básico! | Plotly | Pandas | Python🐍+📂 Extraer información específica de varios PDF guardar datos en dataframe | Exportar a CSV y Excel🐍+📂 Extraer información específica de varios PDF guardar datos en dataframe | Exportar a CSV y Excel📐 + 🐍 Impresión de patrones y figuras de secuencias | Python desde cero | ¡Muy Básico!📐 + 🐍 Impresión de patrones y figuras de secuencias | Python desde cero | ¡Muy Básico!📒  Encuentra el valor de k…ecuación de la recta: Ecuación + pendiente paralela📒 Encuentra el valor de k…ecuación de la recta: Ecuación + pendiente paralela🖼️ +🐍 ¿Cómo mostrar imágenes al azar? | IPython, Display | Python | ¡Muy fácil!🖼️ +🐍 ¿Cómo mostrar imágenes al azar? | IPython, Display | Python | ¡Muy fácil!🧐 Despeje de todas las variables  | Despeje del tiempo | Con fórmula general | Fórmulas de Física🧐 Despeje de todas las variables | Despeje del tiempo | Con fórmula general | Fórmulas de Física🐼 Leer datos como tipo fecha, cambiar formato en un dataframe |  Pandas | Python | Shorts🐼 Leer datos como tipo fecha, cambiar formato en un dataframe | Pandas | Python | Shorts🐼  Insertar, agregar y reemplazar renglones | Insertar columnas | ¡Cualquier posición del dataframe!🐼 Insertar, agregar y reemplazar renglones | Insertar columnas | ¡Cualquier posición del dataframe!🐼 Extraer todos los números en un dataframe | 🐍 Python en menos de 60 segundos | Shorts🐼 Extraer todos los números en un dataframe | 🐍 Python en menos de 60 segundos | Shorts🤔 Multiplicación de matrices (2x2) | Comprobación en línea | Álgebra Lineal | ¡Ejemplo muy fácil!🤔 Multiplicación de matrices (2x2) | Comprobación en línea | Álgebra Lineal | ¡Ejemplo muy fácil!🧑‍💻 Generación de códigos QR (Links a páginas y texto) con las hojas de cálculo de Google | ¡Fácil!🧑‍💻 Generación de códigos QR (Links a páginas y texto) con las hojas de cálculo de Google | ¡Fácil!
Яндекс.Метрика