<html><head></head><body>Si está tan guarro como dices te tocará pegarle al awk, para lidiar con todo eso pocas herramientas son más potentes.<br>
<br>
Salud!!<br>
<br><br><div class="gmail_quote">El 10 de agosto de 2018 12:33:01 CEST, "Héctor Lahoz" <hectorlahoz@gmail.com> escribió:<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
<pre class="k9mail">Hola, jaquers. ¿Qué tal el verano?<br><br>Tengo un "problemilla". Cogí por ahí un montón de datos en HTML.<br>Concretamente en XHTML. Al menos es lo que pone en el DOCTYPE.<br>Luego la realidad es que ni siquiera era XML bien formado así<br>que no podía hacer mucho con ellos.<br><br>Hice un script para, por lo menos, cerrar las etiquetas mal anidadas.<br>Ahora ya son XML. Al menos está bien formado y ya puedo hacer algo<br>con ellos. Sin embargo queda el problema de la validez (validation).<br>Ahora tengo algo que se supone que es XHTML pero tiene un montón<br>de etiquetas privadas, que no pertenecen a (X)HTML cono "hw", "tran"<br>o "def". Por supuesto se ve que el que hizo esto no tenía mucha idea<br>de XML y seguramente ni siquiera sabía lo que son los "XML namespaces".<br>Por desgracia es algo bastante frecuente. Pero es lo que hay.<br><br>Aún no sé muy bien dónde están todos estos elementos que no tienen<br>ningún namespace. Ya digo que "xmlns" no aparece aquí por ningún sitio.<br>Esta es la etiqueta del elemento raíz:<br><br><html><br><br>Eso es todo :-)<br><br>Supongo que pasa algo parecido a lo que pasa entre C y C++. Todo está<br>en el espacio global. La cuestión es: ¿cómo puedo mover todos estos<br>elementos que no son de HTML a su propio espacio? Así por lo menos<br>podría validarlo. Lo primero que se me ocurre es hacer otro script que<br>añada un prefijo a todos estos elementos. Últimamente uso Emacs Lisp<br>para casi todo :-) O Perl. Eso es lo de menos. ¿Hay alguna herramienta<br>de XML para hacer esto? Son más de 1000 ficheros así que tiene que ser<br>algo bastante automático.<br><br>Japi jaquing!<br><hr><br>jaquers mailing list<br>jaquers@listas.noblezabaturra.org<br><a href="https://listas.noblezabaturra.org/mailman/listinfo/jaquers">https://listas.noblezabaturra.org/mailman/listinfo/jaquers</a><br></pre></blockquote></div><br>
-- <br>
Enviado desde mi dispositivo Android con K-9 Mail. Por favor, disculpa mi brevedad.</body></html>