Filter HTML/Java

From: Dieter Deinert <dd(at)radio-do.ath.cx>
Date: Mon, 24 Feb 2003 06:41:37 +0100

Hallo,

ich moechte/will/muss von einem kleinen Hardwarerouter das SYS-Log holen
und ordentlich weglegen.

An sich kein Problem, aber.....

leider hat diese kleine Teil nur ein Webinterface und liefert mir, wenn ich
webcopy benutze, eine recht bunte Mischung aus HTML und Java-Script :-((
Ausserdem ist der Log-Platz nur begrenzt,(einige K) laeuft dann nach hinten
über und wird nur beim Reboot oder Kaltstart sicher mit der Loginsequenz
begonnen.

Der HTML/Java Teil ist aber immer als "Rahnen" dabei. Ich muss, soweit ich
das ubersehen kann, "negativ" filtern, HTML und Java-Script rausnehmen,
weil ich die "positiven" Meldungen nicht voraussehen kann.

Habe schon laenglich in den Ports gesucht, auch Google ist da recht
schweigsam. .......

Kennt jemand einen Filter, der den HTML/Java Teil sauber ausfiltern kann.

XYZ to HTML gibt es reichlich, aber HTML/Java-Script to ASCII ?

oder hat jemand eine andere, einfache Idee, weis ein Script, Perl,
Shell,... ein Tool, etc. das ich modifizeiren, dafuer einsetzten
koennte?

Wollte das Rad nicht neu erfinden. Mit sed koennte es vielleicht gehen.....

Ich haenge mal zum Anschauen einen kleinen Logauszug dran. Da ist ein
Login, Verbindungsaufbau und die ersten 1-2 Minuten e-donky, die ich
normalerweise im Router schon wegdrehe.. Es gibt noch andere
Meldungstypen, wollte ich aber nicht alle mitschicken;-)

Gruesse Dieter

----------------------------------------------------schnipp----------------------------------------------------

$>webcopy -g xyz > syslog2.htm
<HTML><HEAD><META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-8859-1"><SCRIPT LANGUAGE=JavaScript><!--
function GURL(x){var t=new Date(); location=x+'&ZT='+t.getTime();}
function makesure(p,l){if (confirm(p)) GURL(l);}
//--></SCRIPT></HEAD><BODY TEXT=#000000 BGCOLOR=#FFFFFF LINK=#0000FF
VLINK=#0000FF ALINK=#FF0000><H2 ALIGN=CENTER>System Log (Verbose)</H2>
<HR>WAN Type: PPP over Ethernet (R1.95j)<BR>
<SCRIPT LANGUAGE=JavaScript><!--
var today = new Date(); document.write("Display time:
"+today.toLocaleString());
//--></SCRIPT><BR><I>NOTE! "-00:05:20" means that the event occurred 5
minutes and 20 seconds ago.</I><PRE>
.$PQ44=701E0000
.Restarted by 192.168.123.2
.DOD:triggered internally
#### Das ist die uptime des Routers. Zaehlt rückwaerts
-00:02:12 PPPoE start to dial-up
#### Hier beginnt das Log mit der Loginsequenz
.PADT sent
.PADI sent
.PADO recv 0016 DTMX11-erx
.PADR sent
.PADS recv 0002 3C1D
.PAP3: OK
.IPCP3: IP is 217.81.228.21
.IPCP3: DNS0 is 62.225.244.197
.IPCP3: DNS1 is 194.25.2.129
### Login erfolgreich. Zugriffe von innen und aussen
-00:01:44 Unrecognized access from 80.145.82.16:3075 to TCP port 4662
-00:01:38 Unrecognized access from 217.86.30.89:2349 to TCP port 4662
-00:01:35 Unrecognized access from 217.86.30.89:2349 to TCP port 4662
-00:00:55 Unrecognized access from 213.23.43.122:64923 to TCP port 4662
-00:00:54 Unrecognized access from 217.230.142.110:4345 to TCP port 4662
-00:00:53 Unrecognized access from 217.231.236.242:2841 to TCP port 4662
-00:00:52 Unrecognized access from 213.23.43.122:64923 to TCP port 4662
-00:00:51 Unrecognized access from 217.86.30.89:2506 to TCP port 4662
-00:00:49 Unrecognized access from 217.227.33.161:4164 to TCP port 4662
-00:00:14 Unrecognized access from 212.202.188.16:4856 to TCP port 4662
-00:00:13 Unrecognized access from 217.230.142.110:4448 to TCP port 4662
-00:00:13 Unrecognized access from 80.145.82.16:3385 to TCP port 4662
-00:00:11 Unrecognized access from 213.23.43.122:64669 to TCP port 4662
-00:00:01 Unrecognized access from 195.158.152.109:61498 to TCP port 4662
-00:00:00 Unrecognized access from 80.133.230.45:3770 to TCP port 4662
#### das war es
</PRE><A NAME=BOTTOM><HR><P><CENTER><FORM><INPUT TYPE=BUTTON VALUE="Back"
OnClick="history.go(-1)">
<INPUT TYPE=BUTTON VALUE="Refresh" OnClick="location.reload()">
</FORM></CENTER></BODY></HTML>
~

To Unsubscribe: send mail to majordomo(at)de.FreeBSD.org
with "unsubscribe de-bsd-questions" in the body of the message
Received on Mon 24 Feb 2003 - 06:42:15 CET

search this site