En este post veremos cuál es el tratamiento que se le da a las vocales con acento en Python.
Generalmente, cuando ejecutamos procesos relacionados con NLP, requerimos de muchas normas gramaticales para completar nuestras tareas. En relación al orden ortográfico tenemos, por ejemplo, el uso de vocales con acento en Python; cuando mencionamos acento hacemos referencia al acento ortográfico (el que se marca con la tilde), no al acento prosódico (el que se marca de forma oral por medio de una sílaba tónica).
Las vocales con acento en Python
Para verificar cuál es el manejo que se le da a las vocales con acento en Python, buscamos el regex, que es una especie de manual de reglas que se aplican a strings. Para acceder al regex y validar nuestra búsqueda, debemos seguir los pasos a continuación:
- Ingresamos a la página de regex.
Nos aparecerá una página de inicio como esta:
- La sección que modificaremos será la de “Expression”.
- En esta sección pondremos la siguiente expresión regular, que nos servirá para validar la letra ñ (presente en el español) y las vocales con acento en Python: a-zA-ZñÑáéíóúÁÉÍÓÚ. Este comando irá dentro de los corchetes de color naranja.
- Nos aparecerá un listado con las especificaciones de cada carácter:
- Si quisiéramos, podríamos añadirles a estos parámetros la detección de espacios en blanco y podríamos ponerles el signo +, que lo que busca es hacer la repetición del patrón una o más veces. De modo que quedaría así:
[a-zA-ZñÑáéíóúÁÉÍÓÚ\s]+
De este modo, podrías indicarle a tu código que reconozca los acentos en el análisis de datos y preprocesado.
Los acentos generalmente no se usan porque producen mucho ruido de cara a los procesamientos. En este caso, estamos trabajando con el idioma español, pero en otros idiomas, como francés, que tiene muchos acentos, las cosas cambiarían y probablemente sí sea muy necesario usarlos.
Veamos cómo quedaría en Python:
#Vocales con acento en Python
#Solo mayúsculas, minúsculas y números
import re
re.sub (f' [a-zA-ZñÑáéíóúÁÉÍÓÚ\s] + ' , ' ', sentence)
Esto nos daría como resultado una frase en la que se incluirían todas las letras del abecedario en el rango de la a a la z, incluyendo mayúsculas y minúsculas, la letra ñ y todas las vocales con acento en Python.
Otra forma de identificar vocales con acento en Python
Veamos un ejemplo de cómo podríamos identificar vocales con acento en Python de otro modo.
Para ello, lo único que tenemos que hacer es proponer en nuestro código un rango de caracteres en el que solo se incluyan letras mayúsculas, minúsculas y números:
#Vocales con acento en Python
#Solo mayúsculas, minúsculas y números
import re
re.sub (f' [^a-zA-Z0-9] + ' , ' ', sentence)
‘Esta vez no voy a usar una pel cula como pretexto para exponer mis ideas o pensamientos m s dementes racionales insensatos Esta vez, y lo juro ante el sagrado Necronomic n de Lovecraft, pienso hablar de la pel cula en s por primera vez y esperando que no sirva de precedente aunque creo que es evidente que prefiero que una pel cula me haga reflexionar sobre cualquier aspecto que en ella se d cita’
En este caso hemos eliminado signos de puntuación (lo que incluye puntos y comas), pero incluso en este caso podríamos ponerlos y verificar cuáles son las vocales con acento en Python por una regla de descarte, en la cual identificamos todos los otros caracteres, menos las tildes. Así pues, el espacio reservado para las vocales con tilde quedaría vacío.
¿Quieres seguir avanzando?
Ahora que has aprendido cómo identificar vocales con acento en Python, podemos seguir aprendiendo y haciendo avances en el propósito de ser más exitosos. Para poder acceder a las opciones laborales del Big Data, una de las áreas en el mundo de la industria tecnológica mejor pagada y más demandada, tenemos para ti el Big Data, Inteligencia Artificial & Machine Learning Full Stack Bootcamp. Con la guía de esta formación intensiva e íntegra adquirirás los conocimientos teóricos y prácticos necesarios para obtener tu trabajo soñado en pocos meses. ¡No esperes más para impulsar tu carrera y solicita información ahora!