Cómo eliminar etiquetas HTML en hojas de Google
Si copia datos de páginas web a Hojas de cálculo de Google, podría incluir una gran cantidad de código HTML no deseado. Aquí se explica cómo eliminar etiquetas HTML en Hojas de cálculo de Google.
Google Sheets es una excelente manera de organizar y analizar datos. Sin embargo, como todo buen software, la basura que entra es igual a la basura que sale. Si obtiene sus datos de otras fuentes, podría terminar con más de lo que esperaba; puede importar inadvertidamente la información que desea, pero también un montón de etiquetas HTML inútiles. Hasta que no se deshaga de estas etiquetas, no podrá hacer mucho con sus datos.
Afortunadamente, no es demasiado complicado eliminar todas esas etiquetas HTML y dejar solo la información que desea. Aquí se explica cómo eliminar etiquetas HTML en Hojas de cálculo de Google.
¿Qué son las etiquetas HTML?
Las etiquetas HTML son parte del código HTML (HyperText Markup Language) que le dice al navegador web cómo mostrar el contenido de estas etiquetas. Por ejemplo, una etiqueta HTML puede indicarle a su navegador que muestre una sección de texto en negrita o cursiva, alinear el texto al centro o crear un marco donde se puede incrustar el contenido.
Estas etiquetas HTML siempre tienen el mismo formato. Comienzan con el nombre de la etiqueta entre paréntesis angulares, como
. La información que desea extraer se encuentra entre estas etiquetas. Para poner un texto en negrita, por ejemplo, usaría lo siguiente: ¡Hola Mundo!.
Cuando copia datos de una página web, así como los valores que desea copiar, también puede copiar sin darse cuenta esas etiquetas HTML. No le sirven de nada en su hoja de cálculo, por lo que debe eliminarlos y dejar solo la información que realmente desea.
Cómo eliminar etiquetas HTML en Google Sheets usando una fórmula
Puede crear una fórmula que buscará en una celda, eliminará todas sus etiquetas HTML y devolverá lo que quede. La celda original permanecerá intacta, pero la nueva celda tendrá todas las etiquetas HTML eliminadas, dejando solo los datos que desea. Puede crear esta fórmula para una celda y aplicarla rápidamente a varias celdas.
Para eliminar etiquetas HTML usando una fórmula en Hojas de cálculo de Google:
- Seleccione la celda junto a su primera celda que incluye etiquetas HTML.
- Introduzca la siguiente:
=REGEXREPLACE(
- Seleccione la celda que contiene su HTML.
- Escriba una coma y luego:
"<[^<>]+>","")
- Prensa Digitar y las etiquetas HTML deben eliminarse de sus datos.
- Para aplicar la fórmula a otras celdas, haga clic y mantenga presionado el controlador de arrastre en la esquina inferior de la celda.
- Arrastre hacia abajo sobre las celdas en las que desea copiar la fórmula.
- Suelte y la fórmula se copiará en esas celdas y eliminará las etiquetas HTML de los datos restantes.
Esta fórmula funciona usando el REEMPLAZAR REGEX función. Esta función le permite reemplazar parte de una cadena con una cadena diferente. Usted proporciona el texto que se reemplazará seleccionando la celda que contiene las etiquetas HTML.
Luego proporciona una expresión regular que buscará la función. En este caso, la expresión regular es:
<[^<>]+>
Esta expresión busca una cadena que comience con un corchete angular abierto, contenga al menos un carácter que no sea un corchete angular y termine con un corchete angular cerrado. Como vimos anteriormente, dado que todas las etiquetas HTML comienzan y terminan con corchetes angulares, esta expresión regular encontrará todas las instancias de esas etiquetas.
La parte final de la fórmula reemplaza cualquier aparición de coincidencias para la expresión regular con nada. Dado que todas las etiquetas HTML se reemplazan por nada, todo lo que queda es el texto sobrante.
Cómo eliminar etiquetas HTML en las hojas de Google usando Buscar y reemplazar
Una falla de este método es que, aunque elimina las etiquetas HTML de sus datos, crea una nueva columna de datos y también le deja los datos etiquetados originales. Si elimina los datos originales, los nuevos valores eliminados también desaparecerán ya que la fórmula no tiene nada con lo que trabajar.
Puede copiar y pegar sus datos como valores, pero eso no es ideal. Una alternativa es usar Buscar y reemplazar para quitar las etiquetas HTML de sus celdas y dejar el resultado en la misma celda.
Para eliminar etiquetas HTML mediante Buscar y reemplazar en Hojas de cálculo de Google:
- clickea en el Para editar menú.
- seleccionar encontrar y reemplazar.
- En el Encontrarse campo, ingrese la misma expresión regular que usamos en nuestra fórmula:
<[^<>]+>
- asegurarse de que Buscar usando expresiones regulares está marcado, de lo contrario Buscar y reemplazar buscará el texto exacto de nuestra expresión regular.
- Hacer clic reemplaza todo.
- Las etiquetas HTML deberían desaparecer, dejando solo los datos que desea.
Más información sobre Hojas de cálculo de Google
Aprender a eliminar etiquetas HTML en Hojas de cálculo de Google garantiza que no tenga que pasar horas editando manualmente todos sus datos para eliminar etiquetas no deseadas. Usando cualquiera de los métodos anteriores, puede deshacerse rápidamente de las etiquetas y dejar solo los datos que necesita. La capacidad de usar expresiones regulares es un verdadero salvavidas aquí; definitivamente vale la pena aprender más sobre RegEx, ya que puede ahorrarle mucho tiempo.
Hay muchos otros consejos y trucos útiles de Hojas de cálculo de Google que puede aprender. Si está tratando de realizar un seguimiento del tiempo, puede aprender a usar las marcas de tiempo en Hojas de cálculo de Google. Si sus fórmulas no le brindan los resultados que desea, puede obtener información sobre cómo mostrar fórmulas en Hojas de cálculo de Google para verificar si hay errores. Y si desea utilizar datos de un documento diferente, puede aprender a consultar otra hoja en Hojas de cálculo de Google.
No Comment! Be the first one.