vb@rchiv
VB Classic
VB.NET
ADO.NET
VBA
C#
NEU! sevCoolbar 3.0 - Professionelle Toolbars im modernen Design!  
 vb@rchiv Quick-Search: Suche startenErweiterte Suche starten   Impressum  | Datenschutz  | vb@rchiv CD Vol.6  | Shop Copyright ©2000-2024
 
zurück

In diesem Forum haben Sie die Möglichkeit Kommentare, Fragen und Verbesserungsvorschläge zu den im vb@rchiv gelisteten Tipps und Workshops zu posten.

Hinweis:
Ein neues Thema kann immer nur über die jeweilige Tipps & Tricks bzw. Workshop Seite eröffnet werden!

 Sie sind aktuell nicht angemeldet.Funktionen: Einloggen  |  Neu registrieren  |  Suchen

Fragen zu Tipps & Tricks und Workshops im vb@rchiv
Tipp 2127: Anzahl Wörter eines Textabsatzes zählen 
Autor: keco
 Tipp anzeigenDatum: 26.01.10 15:42

Da hast du dir sicherlich viel Arbeit gemacht, danke dafür!

Ich habe damals solch eine Funktion gesucht, leider kam ich auf kein zufriedenstellendes Ergebnis. Nachdem ich mich aber mit den regulären Ausdrücke befasst habe, habe ich eine Funktion schreiben können, die das gleiche macht.
   ''' <summary>
   ''' Zählt die Anzahl der Wörter im Text, wobei Wörter, die durch ein 
   ' Unterstrich (_), ein Minus
   ''' (-) oder einem Slash (/) getrennt sind als ein Wort gezählt werden.
   ''' </summary>
   ''' <param name="text">Der zu prüfende Text.</param>
   ''' <returns>Die Anzahl der im Text enthaltenen Wörter.</returns>
   ''' <remarks></remarks>
   Public Function WordsCount(ByVal text As String) As Integer
      Dim regex As New System.Text.RegularExpressions.Regex( _
                   "[a-zA-Z_0-9äöüß\-/]+", RegularExpressions.RegexOptions.None)
 
      Return regex.Matches(text).Count
   End Function
Ein Wort enthält hierbei alle Zeichen des Alphabets plus deutsche Umlaute, alle 10 Ziffern und darf _ (Unterstrich), - (Minus) und ein / (Slash) enthalten. Bei allen anderen Zeichen wird ein Wort als beendet betrachtet.

Zu beachten ist allerdings, dass diese Funktion ausschließlich für deutsche Texte eine genaue Zählung hervorbringt. Ein weiterer Unterschied ist, dass beispielsweise ein aus Microsoft Word eingefügter Text meist spezielle Sonderzeichen wie einen langen Bindestrich oder die ... in ein eigenes Sonderzeichen wandelt und dadurch in Dieter's Methode als ein eigenes Wort betrachtet werden (eventuell ungewollt?). Bei 20.000 Wörtern wird meine Methode mit RegEx um etwa 20ms schneller ausgeführt, eigentlich nicht wirklich schneller.
alle Nachrichten anzeigenGesamtübersicht  |  Zum Thema  |  Suchen

 ThemaViews  AutorDatum
Tipp 2127: Anzahl Wörter eines Textabsatzes zählen3.587keco26.01.10 15:42
Re: Anzahl Wörter eines Textabsatzes zählen1.614Maas26.01.10 16:32
Re: Anzahl Wörter eines Textabsatzes zählen1.546keco26.01.10 17:41

Sie sind nicht angemeldet!
Um einen neuen Beitrag schreiben zu können, müssen Sie sich zunächst anmelden.

Einloggen  |  Neu registrieren

Funktionen:  Zum Thema  |  GesamtübersichtSuchen 

nach obenzurück
 
   

Copyright ©2000-2024 vb@rchiv Dieter Otter
Alle Rechte vorbehalten.
Microsoft, Windows und Visual Basic sind entweder eingetragene Marken oder Marken der Microsoft Corporation in den USA und/oder anderen Ländern. Weitere auf dieser Homepage aufgeführten Produkt- und Firmennamen können geschützte Marken ihrer jeweiligen Inhaber sein.

Diese Seiten wurden optimiert für eine Bildschirmauflösung von mind. 1280x1024 Pixel