Das kranke Kind

klein und gemein

Archive for the ‘Perl’ Category

Etwas Konstruktives AntiHartz4-Prog

leave a comment »

Nun, meine Madame hat leider weniger Glück in den letzten Tagen gehabt, und so musste Sie den Verlust des Arbeitsplatzes aufgrund bescheidener Auftragslage verdauen. Da ich Sie trotzdem LIEBE 😉 und Sie sich wahrlich müht, griff ich mal zu meinen Skills und entwickelte Ihr nen kleines Perl-Skript, welches es ihr im Wesentlichen abnimmt, stehts und ständig irgendwelche hässlichen Internetseiten besuchen zu müssen.

Dieses Perl-Programm macht eigentlich nur eins:

Es öffnet eine Textdatei, wo die gesammelten Verweise zu den Webseiten, welche explizit die offenen Stellen beinhalten, gespeichert sind. Diese scrallt er dann Schritt für Schritt ab und überprüft diese auf ein zuvor festgelegtes „Suchwort“. Je nach Ergebnis (Suchbegriff in der „gescannten Seite“ vermeintlich gefunden oder nicht) speichert der Scraller dies dann in einer eigenen HTML Datei, die positiven Ergebnisse sogleich als Link, damit man bequem die Seite, wo der Scrawler den Begriff fand, besuchen kann.

Nennen wir dieses kleine Prog einfach mal AntiHarz4 1.0 ^^ – wenn ich Lust habe erweitere ich es zu gegebener Zeit einfach mal, dazu dürft ihr aber immer schön den Blog besuchen..

Zurück zum Thema:
Dann möchte ich erstmal den Quellcode der Allgemeinheit preis geben, doch leider funktioniert die Scheisse mit dem HTML TAG Code einfügen hier nicht, zumindest wurden die HTML-Tags interpretiert, sodass ich es einfach mal bei nopaste hochgeladen habe:

http://nopaste.info/99ed0e66ea.html

So das was Ihr da unter CODE dann seht, kopiert ihr euch in eine Textdatei und speichert diese z.B. unter anti.pl (.pl steht dabei für PERL). Im gleichen Verzeichnis ( für den Anfang empfehle ich den Desktop ) 😉 legt ihr die Datei webseiten.txt an wo ihr die Seiten z.B.

http://www.firma-mayer.de/jobangebote.html
http://www.deinefimra.com/index.php?id=3

schön sauber untereinander nieder schreibt. (Lohnen sich auch wirklich nur die Seite, wo ihr euch auch drauf verlaufen würdet, wenn Ihr nen Job sucht ^^ denn ansonsten quält ihr euren kleinen Rechner nur „ungemein“ ^^ )  – achso vergesst bitte das http:// nicht sonst wird euch das Programm keine richtigen Ergebnisse liefern. So dann gebt Ihr noch in Zeile 45 in der .pl Datei Euren Suchbegriff zwischen die Hochkommas an und die Datei ist eigentlich fertig „bearbeitet“. Nochmal speichern (guckt mal auf dem Desktop ob da dann auch eure .pl liegt) und fertig ist dieser Teil.

Nun können die wenigsten aber sicher mit einer .plDatei (perl-Datei) etwas anfangen,deshalb hier mal nen kleiner Leitfaden:

Perl-Dateien nutzen

das Perl LogoPerl Dateien benötigen den Perl-Interpreter, um genutzt werden zu können. Ich empfehle ActivePerl ich nutze es auch und es funktioniert einwandfrei.
http://www.activestate.com/downloads
Den kurz installiert und die auf dem Dekstop befindliche .pl Datei (die ihr mit dem Code erstellt habt), müsste nun folgendes hübsches Icon aufweisen.

Tut es das, ist alles perfekt und ihr geht in die Console CMD .

Das macht ihr über Start / Ausführen / cmd eintippen und Enter drücken )

Nun müsste ihr die Perl Datei annavigieren:

Laut Erfahrung sind es zum Desktop genau 1 Schritt. Dort wo der kleine Balken auf schwarzem Grund blinkt tippt Ihr ein cd desktop und es müsste als letztes letztes vor dem blinkenden Balken jetzt stehen:

C:\\…\Desktop>

Um nun die Datei zu starten tippt Ihr ein: name_der_datei.pl

Sodass nun da steht:

C:\\…\Desktop>name_der_datei.pl

Enter gedrückt und das Programm müsste anfangen zu rattern.

sollte es nicht auf Anhieb klappen könnt Ihr auch folgendes probieren:
C:\\…\Desktop>perl name_der_datei.pl

So und wenn alles gut ging dann habt ihr bei euch auf dem Desktop nun auch die HTML-Datei, welche angelegt wurde (wenn ihr nichts verändert habt die Datei verweise.html) wo ihr dann einfach mal gucken könnt, was euch die Webseiten ausgespuckt haben.

So ich habe fertig!
Sicher werde einige Perl-Cracks jetzt mit den Ohren schlackern und andere wiederum die Richtigkeit der Syntax bezweifeln, ich hoffe es nutzt aber trotzdem dem einen oder anderen und wenn es nur dazu dient, sich Blogs wie diesen oder diesen in der gesparten Zeit durchlesen zu können!

LG
und in Gedanken bei meiner Frau 🙂

Written by kr4nk3sk1nd

28. Januar 2010 at 10:55 pm

Veröffentlicht in Perl, Selfcoded