vb@rchiv
VB Classic
VB.NET
ADO.NET
VBA
C#
Brandneu! sevEingabe v3.0 - Das Eingabecontrol der Superlative!  
 vb@rchiv Quick-Search: Suche startenErweiterte Suche starten   Impressum  | Datenschutz  | vb@rchiv CD Vol.6  | Shop Copyright ©2000-2024
 
zurück

 Sie sind aktuell nicht angemeldet.Funktionen: Einloggen  |  Neu registrieren  |  Suchen

VB.NET - Ein- und Umsteiger
Re: Prüfen ob Datei eine Textdatei ist 
Autor: Manfred X
Datum: 21.06.11 13:54

Hallo!

Wenn man eine sortierte Liste mit 10000 häufigen Wörten
verwendet, geht das recht zügig (zusätzlich kann man
einen Vorabfilter für die Wortlänge verwenden).
Dieses Vorgehen ist eine Suche nach Text.
Falls in einer "TextDatei" kein Text eingetragen ist,
klappt es nicht.

Hier eine triviale Variante:
Private Function Wortliste(ByVal filename As String) As List(Of String)
   If Not System.IO.File.Exists(filename) Then Return Nothing
 
   Dim lst As New List(Of String)
   Dim sep(0) As String
   Dim enc As New System.Text.UTF8Encoding
 
   sep(0) = vbCrLf
   Dim t As String = My.Computer.FileSystem.ReadAllText(filename, enc)
   Dim l() As String = t.Split(sep, StringSplitOptions.RemoveEmptyEntries)
   For Each line As String In l
       Dim w() As String = line.Split(" "c)
       For i As Integer = 0 To w.Length - 1
          w(i) = _
          w(i).Trim("("c, ")"c, ","c, ";"c, "."c, "-"c, "?"c, "!"c, "/"c, _
          "\"c).ToUpper
       Next i
       lst.AddRange(w)
   Next line
 
   lst.RemoveAll(AddressOf IsNullOrShort)
   lst.Sort()
   Return lst
End Function
 
Private Function IsNullOrShort(ByVal str As String) As Boolean
   If String.IsNullOrWhiteSpace(str) Then Return True
   If str.Length < 4 Then Return True
   Return False
End Function
Durch diese Funktion wird zunächst eine Liste häufiger Worte
in eine Liste geladen, danach der Inhalt einer zu prüfenden Datei.
Dim worte As List(Of String) = Wortliste("Datei mit Liste häufiger Worte")
 
Dim abschnitte As List(Of String) = Wortliste("zu prüfende Datei")
 
Dim sum As Integer = 0
For Each abschnitt As String In abschnitte
   If worte.BinarySearch(abschnitt) > -1 Then sum += 1
Next abschnitt
Dim wortprozente As Double = sum / abschnitte.Count * 100.0#
Wenn mehr als 10% der Abschnitte sich als Wort identifizieren lassen,
enthält mit hoher Sicherheit zumindest ein wesentlicher Teil der Datei
einen Text.

MfG
Manfred
alle Nachrichten anzeigenGesamtübersicht  |  Zum Thema  |  Suchen

 ThemaViews  AutorDatum
Prüfen ob Datei eine Textdatei ist3.039OlliBG20.06.11 09:51
Re: Prüfen ob Datei eine Textdatei ist2.352ModeratorDaveS20.06.11 10:33
Re: Prüfen ob Datei eine Textdatei ist2.254OlliBG20.06.11 13:46
Re: Prüfen ob Datei eine Textdatei ist2.214Manfred X20.06.11 19:57
Re: Prüfen ob Datei eine Textdatei ist2.190Code_mancer21.06.11 08:27
Re: Prüfen ob Datei eine Textdatei ist2.227ModeratorDaveS21.06.11 08:40
Re: Prüfen ob Datei eine Textdatei ist2.224Code_mancer21.06.11 09:21
Re: Prüfen ob Datei eine Textdatei ist2.220ModeratorDaveS21.06.11 09:59
Re: Prüfen ob Datei eine Textdatei ist2.191Manfred X21.06.11 13:54
Re: Prüfen ob Datei eine Textdatei ist2.441Preisser21.06.11 14:08
Re: Prüfen ob Datei eine Textdatei ist2.240Code_mancer21.06.11 14:10
Re: Prüfen ob Datei eine Textdatei ist2.090Manfred X21.06.11 14:16
Re: Prüfen ob Datei eine Textdatei ist2.138Code_mancer21.06.11 14:44
Re: Prüfen ob Datei eine Textdatei ist2.130Preisser21.06.11 14:52
Re: Prüfen ob Datei eine Textdatei ist2.108Code_mancer21.06.11 15:02
Re: Prüfen ob Datei eine Textdatei ist2.146Manfred X21.06.11 14:54
Re: Prüfen ob Datei eine Textdatei ist2.071Code_mancer21.06.11 15:09
Re: Prüfen ob Datei eine Textdatei ist2.012Manfred X21.06.11 15:15
Re: Prüfen ob Datei eine Textdatei ist2.143Code_mancer21.06.11 15:18
Re: Prüfen ob Datei eine Textdatei ist2.305Preisser21.06.11 15:24
Re: Prüfen ob Datei eine Textdatei ist2.071Code_mancer22.06.11 07:45
Re: Prüfen ob Datei eine Textdatei ist2.204ModeratorDaveS21.06.11 15:41
Re: Prüfen ob Datei eine Textdatei ist2.258Manfred X21.06.11 16:21
Re: Prüfen ob Datei eine Textdatei ist2.097ModeratorDaveS21.06.11 17:03
Re: Prüfen ob Datei eine Textdatei ist2.095OlliBG21.06.11 09:39
Re: Prüfen ob Datei eine Textdatei ist2.118ModeratorDaveS21.06.11 09:59
Re: Prüfen ob Datei eine Textdatei ist2.111OlliBG21.06.11 16:23
Re: Prüfen ob Datei eine Textdatei ist2.133Manfred X21.06.11 16:39
Re: Prüfen ob Datei eine Textdatei ist2.090ModeratorDaveS21.06.11 17:08
Re: Prüfen ob Datei eine Textdatei ist2.066Manfred X21.06.11 17:34
Re: Prüfen ob Datei eine Textdatei ist2.087Code_mancer22.06.11 07:53

Sie sind nicht angemeldet!
Um auf diesen Beitrag zu antworten oder neue Beiträge schreiben zu können, müssen Sie sich zunächst anmelden.

Einloggen  |  Neu registrieren

Funktionen:  Zum Thema  |  GesamtübersichtSuchen 

nach obenzurück
 
   

Copyright ©2000-2024 vb@rchiv Dieter Otter
Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.

Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel