Sacar acentos, tildes y demás signos diacríticos de un texto
Publicado por Gerardo Contijoch en Enero 15, 2009
Hace un tiempo me vi en la necesidad de quitarle todos los acentos a un texto para que el mismo pueda ser procesado correctamente. Lo primero que me vino a la mente es hacer uso de una expresión regular para esto, pero como no las manejo muy bien tuve que ponerme a buscar como hacerlo. En medio de esa búsqueda me topé con este post de Michael Kaplan en donde explica una mejor manera de hacerlo y no solo eso, sino que también su método elimina cualquier otro ’símbolo extraño’ que contengan nuestro texto. Con ’símbolo extraño’ me refiero a los signos diacríticos (ni sabia que existía esa palabra), como pueden ser el anillo (°), la diéresis (¨) o la virgulilla (~, ¡otra palabra nueva!).
Esta técnica es muy útil para generar URLs como se puede ver acá (versión ligeramente modificada para hacerla apta para URLs).
¡Nos vemos en el próximo post!
Publicado originalmente en http://gerardocontijoch.wordpress.com.
TraceTool: simplificando el logging en .NET (¡y en otras plataformas también!) « Gerardo Contijoch escribió
[...] los caracteres especiales con una versión ligeramente modificada del método que presenté en este post (ojo con las tablas, que necesitan los caracteres ‘t’ para ser procesadas [...]
jake escribió
como saco la i con asento