Text einer HTML Webseite auslesen und entfernen der HTML-Tags

Sa, 04.07.2009 - 20:03 -- admin

Um den reinen Text einer HTML Seite zu kommen, bedarf es einiger Funktionen. Ich habe hierzu einen Interessanten Blogeintrag gefunden. PHP bietet hierfür zwar schon ein paar Funktionen, die allerdings nicht immer den gewünschten Erfolg bringen. So werden zum Beispiel mit strip_tags alle HTML-Tags entfernt, jedoch kein Javascriptcode.
In der unteren Klasse habe ich alle Funktionen des Blogs zusammengefasst. Am Ende kommt hier wirklich nur der reine Text ohne HTML-Tags, Javascript, Sonderzeichen, Zeilenumbrüche, Leerzeilen, usw raus.

automatische Generierung von Keywords/Tags aus einem Text

Sa, 04.07.2009 - 19:52 -- admin

TODO: Beschreibung

Beispiel

#use only to set right encoding for browser
 header( 'Content-Type: text/html; charset=UTF-8' );
 
require_once 'text2keywords.class.php';
 
$text="Stoppwörter nennt man im Information Retrieval Wörter, die bei einer Volltextindexierung nicht beachtet werden,
da sie sehr häufig auftreten und gewöhnlich keine Relevanz für die Erfassung des Dokumentinhalts besitzen.
Allgemein übliche Stoppwörter in deutschsprachigen Dokumenten sind bestimmte Artikel ('der', 'die', 'das'),

HTTP Requests: POST, GET, Datei hochladen, Formular abschicken und Cookies mit VB.NET

So, 28.06.2009 - 16:59 -- admin

ToDO: Beschreibung

Webseite aufrufen

Dim http As New IntelligentStreaming.SharpTools.HTTPWorker()
Dim rsp As HttpWebResponse = Nothing
http.Url = "http://yoursite.com/pageToFetch.html"
http.Type = HTTPRequestType.[Get]
http.RequestObject.AllowAutoRedirect = False
' if required
Try
    rsp = http.SendRequest()
Catch ex As WebException
    Console.WriteLine(ex.Message)
    Return
End Try
 
Dim webPage As String = rsp.ResponseText

Login-Formular

Dim http As New IntelligentStreaming.SharpTools.HTTPWorker()

Alle Computer, Workstations und Server in einer Windows-Domäne mit VB.NET auslesen

Sa, 27.06.2009 - 17:12 -- admin

Beispiel

'returns all items thats starts with PC or Server on domain.local
Dim netpcs As ArrayList = GetDomainHosts("LDAP://dc=domain,dc=local", "PC*|Server*")
 
'returns all items on domain.local
Dim netpcs As ArrayList = GetDomainHosts("LDAP://dc=domain,dc=local")

Funktionen

    Function GetDomainHosts(Optional ByVal LDAPDir As String = "LDAP://dc=domain,dc=local", Optional ByVal RegexHost As String = "") As ArrayList
        Dim pc As New ArrayList

PC Information und installierte Software über WMI/Registry mit VB.NET Remote auslesen

Sa, 27.06.2009 - 14:42 -- admin

In einem Windows-Netzwerk kann ohne weiteres, hat man denn die Rechte, von außen auf einen PC zugegriffen und verwaltet werden. Microsoft bietet hier einige Möglichkeiten. Zum einen gibt es WMI (Windows Management Instrumentation) zum anderen kann man auch ohne weiteres auf die Windows-Registrierung per Remote zu greifen.

Seiten

neueste Beiträge abonnieren