vb@rchiv
VB Classic
VB.NET
ADO.NET
VBA
C#
SEPA-Dateien erstellen inkl. IBAN-, BLZ-/Kontonummernprüfung  
 vb@rchiv Quick-Search: Suche startenErweiterte Suche starten   Impressum  | Datenschutz  | vb@rchiv CD Vol.6  | Shop Copyright ©2000-2024
 
zurück

In diesem Forum haben Sie die Möglichkeit Kommentare, Fragen und Verbesserungsvorschläge zu den im vb@rchiv gelisteten Tipps und Workshops zu posten.

Hinweis:
Ein neues Thema kann immer nur über die jeweilige Tipps & Tricks bzw. Workshop Seite eröffnet werden!

 Sie sind aktuell nicht angemeldet.Funktionen: Einloggen  |  Neu registrieren  |  Suchen

Fragen zu Tipps & Tricks und Workshops im vb@rchiv
Tipp 2127: Anzahl Wörter eines Textabsatzes zählen 
Autor: keco
 Tipp anzeigenDatum: 26.01.10 15:42

Da hast du dir sicherlich viel Arbeit gemacht, danke dafür!

Ich habe damals solch eine Funktion gesucht, leider kam ich auf kein zufriedenstellendes Ergebnis. Nachdem ich mich aber mit den regulären Ausdrücke befasst habe, habe ich eine Funktion schreiben können, die das gleiche macht.
   ''' <summary>
   ''' Zählt die Anzahl der Wörter im Text, wobei Wörter, die durch ein 
   ' Unterstrich (_), ein Minus
   ''' (-) oder einem Slash (/) getrennt sind als ein Wort gezählt werden.
   ''' </summary>
   ''' <param name="text">Der zu prüfende Text.</param>
   ''' <returns>Die Anzahl der im Text enthaltenen Wörter.</returns>
   ''' <remarks></remarks>
   Public Function WordsCount(ByVal text As String) As Integer
      Dim regex As New System.Text.RegularExpressions.Regex( _
                   "[a-zA-Z_0-9äöüß\-/]+", RegularExpressions.RegexOptions.None)
 
      Return regex.Matches(text).Count
   End Function
Ein Wort enthält hierbei alle Zeichen des Alphabets plus deutsche Umlaute, alle 10 Ziffern und darf _ (Unterstrich), - (Minus) und ein / (Slash) enthalten. Bei allen anderen Zeichen wird ein Wort als beendet betrachtet.

Zu beachten ist allerdings, dass diese Funktion ausschließlich für deutsche Texte eine genaue Zählung hervorbringt. Ein weiterer Unterschied ist, dass beispielsweise ein aus Microsoft Word eingefügter Text meist spezielle Sonderzeichen wie einen langen Bindestrich oder die ... in ein eigenes Sonderzeichen wandelt und dadurch in Dieter's Methode als ein eigenes Wort betrachtet werden (eventuell ungewollt?). Bei 20.000 Wörtern wird meine Methode mit RegEx um etwa 20ms schneller ausgeführt, eigentlich nicht wirklich schneller.
Themenbaum einblendenGesamtübersicht  |  Zum Thema  |  Suchen

Re: Anzahl Wörter eines Textabsatzes zählen 
Autor: Maas
Datum: 26.01.10 16:32

Anmerkung zur Geschwindigkeit: Hier mal ein echt guter Artikel über die Optimierung von String-Operationen und wann es sich lohnt RegEx zu benutzen.

Maas
Themenbaum einblendenGesamtübersicht  |  Zum Thema  |  Suchen

Re: Anzahl Wörter eines Textabsatzes zählen 
Autor: keco
Datum: 26.01.10 17:41

Ich habe mir den Artikel durchgelesen (zumindest bis zum Replace). In dem Falle könnte man separieren. Bei einem langen Suchbegriff und großem Text automatisch mit RegEx suchen lassen, ansonsten die integrierten Methoden bzw. eine eigene Methode verwenden.

Ich werde jedenfalls noch den Rest durchlesen und mir den Blog-Artikel von dem dortigen Link anschauen (bezüglich der Besonderheiten von RegExOptions.Compiled). Danke für den Link.
Themenbaum einblendenGesamtübersicht  |  Zum Thema  |  Suchen

Sie sind nicht angemeldet!
Um einen neuen Beitrag schreiben zu können, müssen Sie sich zunächst anmelden.

Einloggen  |  Neu registrieren

Funktionen:  Zum Thema  |  GesamtübersichtSuchen 

nach obenzurück
 
   

Copyright ©2000-2024 vb@rchiv Dieter Otter
Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.

Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel